11月26日上午,应数学与信息科学学院邀请,北京大学艾明要教授在数学院南楼103会议室做题为“Optimal Subsampling for Online Data Streams with Categorical Responses”的学术报告。报告由庞善起教授主持,学院的部分青年教师以及研究生聆听了此次报告。
报告中,艾明要教授从什么是大数据谈起,并指出大数据抽样的两个需要解决的问题:既要快速又要能保证计算的精度。艾老师团队研究了数据流状态下分类响应问题如何对在线的数据做高效抽样。他们基于Multinomial logistic models做统计分析和仿真处理,提出一种顺序子抽样策略-Poisson subsample。同时,从理论上证明了当子样的样本容量n趋于无穷大时这种抽样下得到的估计量能收敛到真实值。
艾老师的精彩报告激起了大家极大的兴趣,报告结束后展开了热烈的讨论。此次报告为青年教师和研究生如何在统计应用方面开展工作提供了参考和帮助。
专家简介:
艾明要,现任北京大学数学科学学院统计学教研室主任、教授、博士生导师,兼任中国现场统计研究会副秘书长,中国现场统计研究会试验设计分会理事长、高维数据统计分会副理事长、空间统计分会秘书长,是国际统计期刊Statistica Sinica、Journal of Statistical Planning and Inference、Statistics and Probability Letters、STAT (An electronic journal of ISI)的Associate Editor,国内数学期刊《系统科学与数学》的编委。主要从事试验设计与分析、计算机试验、高维数据分析和应用统计的教学和研究工作,在国际顶尖的统计期刊Ann.Statist.、JASA、Biometrika、Technometrics、Statist.Sinica等发表学术论文六十余篇,主持或参与完成6项国家自然科学基金面上项目、1项重点项目和1项国家科技部973课题“基于`药性构成三要素'的中药药性实质研究”等。
(数学与信息科学学院王静)