获奖名称: |
大数据多粒度计算理论与方法 |
获奖时间: |
2022年 |
获奖类别、等级: |
山西省科学技术奖一等奖 |
主要完成人: |
钱宇华 李飞江 侯臣平 胡清华 梁吉业 |
成果简介: |
大数据智能分析在国防安全、数字经济、遥感分析等国家关键战略领域具有重大应用需求,是世界各国竞争的高科技前沿,所属领域为人工智能。目前人们借鉴多粒度认知机理进行大数据分析挖掘总体上仍停留在朴素思想的运用阶段,缺乏理论上对多粒度计算原理的系统研究,严重制约了利用该普适认知原理科学指导计算理论与方法研究。 项目组在国家优秀青年科学基金等项目资助下,针对本领域的三大核心问题:多粒度的认知机理、表征机制与建模方法开展了系统研究,取得了若干重要科学发现,奠定了大数据多粒度计算的基础理论与方法体系。揭示了样本特性、类簇质量、融合策略三个要素与聚类集成有效性的内在关系,发现了低维嵌入、标签嵌入、空间嵌入三个维度与聚类分析有效性的作用机理,澄清了局部多粒度认知对大数据粒化的有效作用机理,提出了局部粗糙建模理论,为大数据多粒度计算理论与方法研究夯实了基础。发现了多粒度结构的统一表征方法,提出了概率空间语义下的多模态数据表征机制;揭示了多粒度表征结构之间的泛化偏序特性,发展了关系熵、交叉熵两类多粒度不确定性度量;发现了数据驱动的多粒度约简表示机制,给出了相关的属性约简理论与对应方法。提出了时序多粒度、水平多粒度、层次多粒度三种多粒度融合建模策略;建立了正则化自表示、局部共享迁移学习、膨胀卷积优化三种多粒度内嵌建模策略;给出了多秩回归分类、判别消失成分分析、多粒度粗糙建模三种多粒度关联建模策略;系统发展了多粒度建模原理与方法。在国际重要期刊/会议发表论文25篇(GS引用2237次),5篇代表论文GS引用684次,单篇最高318次,被美国、加拿大、澳大利亚等国家地区的研究机构发表在Science Signal、Artificial Intelligence、IEEE Trans等国际重要期刊/会议的论文广泛引用,引用者不乏AAAS/ACM/IEEE/ELLIS Fellow、美国科学院院士、欧洲科学院院士等权威学者,多次作出“First/basis/the earliest/novel/nice/well/popular”等评价。培养万人计划领军人才1人次、国家杰青1人次,国家优青3人次,第一完成人连续4年入选科睿唯安全球高被引科学家。 |