报告题目:面向高维异质数据的鲁棒关联分析
报告时间:2026年3月4日下午19:00
会议链接:https://meeting.tencent.com/dm/4S7vv4O9YPBW
腾讯会议ID:349-599-204
主办单位:yl23411永利集团/科研处
报告人:朱利平
报告人简介:朱利平,中国人民大学教授、博士生导师,学校和理工学部学术委员会委员,统计与大数据研究院院长,人民教育出版社普通高中教科书《数学》联合主编,享受国务院特殊津贴专家,国家重大人才工程入选者,国家杰出青年科学基金获得者,国家重点研发计划首席科学家,兼任中国现场统计研究会生存分析分会理事长和高维数据统计分会副理事长等。
先后受邀担任国际统计学领域顶级学术期刊《统计年刊》、国际权威学术期刊《中华统计学》和《多元分析》等副主编,以及国内统计学领域顶级学术期刊《中国科学·数学》(中、英文版)、《系统科学与数学》(中、英文版)和《应用概率统计》等青年编委、编委和副主编等。
长期从事大数据统计学基础理论、方法和应用研究。1、在高维度大数据领域,提出不依赖于切片数的累积切片估计方法、不依赖于分布条件的半参数降维方法和不依赖于模型的变量筛选方法,解决了充分降维领域“公开问题”,被认为是该领域“突破性进展”,被列为变量筛选领域“基准方法”。2. 在非线性大数据领域,提出投影相关系数度量非线性相关关系,广泛应用于类脑科学和天文学等研究中;原创性提出区间分位数相依基本思想,扩宽了(分布)独立基本概念并建立了(分布)独立与分位数独立和均值独立的联系。3.在大数据应用领域,主持开发的虚假诉讼预警甄别系统已经在四川省高级人民法院和成都市中级人民法院等10家法院部署应用示范,参与编写的人民法院信息化标准《民事案件信息技术规范》已被最高人民法院发布实施。
摘要:皮尔逊相关系数等经典关联分析方法通常直接基于观测值度量关联性,但在处理高维数据时,常面临随机变量取值范围差异显著(即异质性强)的挑战。在此情形下,聚合高维自变量与因变量的关联时,取值范围较大的自变量易主导聚合结果,致使取值范围较小的自变量之关联信息被掩盖。为此,本文提出一类基于排序的鲁棒关联分析方法,并从理论上严格分析了该方法在异质及同质情形下的统计检验功效,证明了其在应对高维数据异质性方面的优势。