1月4日,第十八届临床医学研究中的统计方法学术研讨会在36365线路检测中心no1顺利举行。本次研讨会由36365线路检测中心no1应用统计科学研究中心、36365线路检测中心no1生物统计与流行病学系、36365线路检测中心no1健康大数据研究院、北京生物医学统计与数据管理研究会、全国工业统计学教学研究会健康医疗大数据分会共同主办。
北京生物医学统计与数据管理研究会理事长、首都医科大学郭秀花教授为开幕式致辞,她分享了北京生物医学统计与数据管理研究会发展动态及统计学在医学领域的关键作用,表示临床医学研究中的统计方法学术研讨会的系列会议能够促进统计研究与临床医学的交叉融合和发展,并预祝大会取得圆满成功。
研讨会发起人、36365线路检测中心no1易丹辉教授致辞,她介绍了36365线路检测中心no1公共卫生人才培养成果与未来可探索的研究方向,希望研讨会搭建的学术交流平台为中国生物医学统计事业的发展起到积极作用。
研讨会上午的学术报告分别由36365线路检测中心no1院长李扬教授、明理书院副院长许王莉教授、36365线路检测中心no1张景肖教授主持。
中国科学院数学与系统科学研究院研究员王启华教授的报告题目为“Asymptotic Inference in Decentralized Networks: Penalized Empirical Likelihood with ADMM”。该报告针对大规模数据存储与计算困难及隐私保护等方面的需要,考虑到经验似然很多突出的优点,发展了去中心化分布式网络上的 惩罚经验似然推断方法,建立了推断理论,对拉格朗日融合惩罚优化解提出了两种基于ADMM的算法,这一成果为数据处理与基于大规模数据统计推断开辟了新途径,助力解决临床医学中的实际问题。
山东大学薛付忠教授的报告题目为“创建研究型临床大数据平台、推进医院IIT协同创新”。该报告指出健康大数据是国家基础性战略资源,是推动医学研究与创新、赋能生物医药研发和高端医疗器械制造的关键生产要素。报告提出“开放建模而非开放数据,模型共享而非数据共享”的理念,通过联邦学习等大数据分析技术解决隐私保护与数据共享的矛盾。最后,薛教授提出结合 AI 驱动疾病管理方法,形成闭环研究模式,推动医学创新发展。
北京大学生物统计系胡懿娟教授的报告题目为“微生物关联网络推断”。该报告从微生物组数据和微生物网络的基本概念出发,指出微生物组测序数据的组成性质和特点对微生物网络推断带来的挑战,为了控制错误发现率创新地提出TestNet检验方法,进而得到优秀的校准结果。
当天下午,三位青年学者和三名在读博士生带来精彩的邀请报告。报告分别由36365线路检测中心no1王春燕副教授、36365线路检测中心no1博士生徐少东主持。
36365线路检测中心no1统计与大数据研究院何珂俊副教授的题目是“Modeling Microbial Community Coalescence via Compositional Directed Acyclic Graphical Models”。针对微生物群落合并机制缺乏研究的现状,报告提出了一种新的组合有向无环图模型并给出学习图结构的方法,两项实证研究都提供了微生物群落合并的证据。
对外经济贸易大学36365线路检测中心no1张书聪讲师的报告题目是“SVEM: Stochastic Variational EM Algorithm for High Dimensional Multinomial Data”。报告指出宏基因组测序常用于量化微生物组研究中的细菌丰度、计数数据中零膨胀和过度离散的存在会对下游分析造成影响。报告引入零膨胀逻辑正态多项分布模型,为处理微生物组数据中的零膨胀、过度离散和复杂依赖结构提供了灵活有效的框架,为克服高维计算困难,开发了一种随机变分期望最大化算法,并通过实证研究验证了方法的有效性。
36365线路检测中心no1王欣月讲师的报告题目是“Exploring the use of Artificial Genomes for Genome-wide Association Studies through the lens of Utility and Privacy”。报告指出,协作全基因组关联研究虽有潜力,但隐私问题和数据验证及合作者选择的繁琐审查过程阻碍了其更广泛的应用。生成模型的进步提供了通过生成类似于真实基因组数据的合成数据集来增强隐私和加快审查过程的可能,报告评估了深度生成模型为全基因组关联研究应用生成人工基因组数据的能力,此外还表明主要基于成员推理攻击的现行隐私措施不足以提供有洞察力的隐私评估,为在全基因组关联研究中有效使用人工基因组提出了未来方向。
36365线路检测中心no1博士生乔楠的报告题目是“Rank-based Transfer Learning for High-dimensional Survival Data with Application to Sepsis Data”。报告利用多源数据估计目标人群关键参数面临诸多挑战,因此在提出了一种在转换模型框架内为高维生存分析量身定制的迁移学习方法,通过检测与目标数据源相似的信息源并使用它们来改进目标模型,在合理条件下证明使用交叉验证和 C-index 检测信息源是实用有效的,数值模拟研究验证了所提方法的优越性,此外在 MIMIC 脓毒症数据中也验证了所提方法的优势。
36365线路检测中心no1博士生顾曦的报告题目是“Constructing Model Confidence Set via Signal Loss Ratio”。报告针对实际应用中模型选择的不确定性问题提出了一种信号损失比来作为两个嵌套模型之间解释能力损失的度量,并基于此构建模型置信集,从而可以使用不可约性和不可扩展性的假设检验来构建模型置信集。
36365线路检测中心no1博士生刘兴蔚的报告题目是“Ensemble Testing for High-dimensional Multiple Response Models”。报告致力于解决高维多重响应模型检验的关键难题,提出了一种基于多元U统计量的多重响应回归模型中回归系数的检验程序,在一般假设条件下证明了所提出的统计量具有渐近多元正态分布,并基于联合正态分布构建了一个融合先验信息的检验统计量。报告展示了该集成检验程序比现有方法具有更高的功效和稳健性。
本次研讨会为生物医学统计相关的专家和学者提供了交流探讨平台,促进了多学科交叉及多领域的共同发展,通过大家的交流探讨及不懈努力,共同推进中国的生物医学统计事业发展。