现在位置:首页 >> 研究队伍 >> 教授
曹付元
教授,博士,博士生导师
研究方向:数据挖掘与机器学习
E-Mail:cfy@sxu.edu.cn
个人简介 科研项目 代表论文
个人简介

曹付元  男,1974年5月生,博士,教授,博士生导师,山西大学计算机与信息技术学院智能信息处理研究室主任。2010年山西大学计算机与信息技术学院计算机应用技术专业毕业,获博士学位,同年晋升为副教授。2011年12月到2013年12月在中科院深圳先进技术研究院从事博士后研究。2014年8月到2015年8月在加拿大Simon Fraser 大学进行学术访问。目前的主要研究方向是块数据聚类、演化聚类、聚类集成、子空间聚类等。近年来,先后主持国家自然科学基金面上项目1项、中国博士后基金项目(一等资助)1项、山西省自然科学基金项目2项、山西省高校科技研究开发项目1项;作为主要成员参与了国家863计划项目2项、国家自然科学基金项目2项(重点基金1项)、国家973计划前期研究专项项目1项。先后在《IEEE Transactions on Fuzzy Systems》、《Information Sciences》、《Pattern Recognition》、《Neurocomputing》、《Computers and Mathematics with Applications》、《Knowledge-Based Systems》、《Expert Systems with Applications 》、《计算机研究与发展》等国际国内重要学术刊物和国际会议PAKDD上发表学术论文30余篇。完成的博士学位论文《面向分类数据的聚类算法研究》获2010年度山西省优秀博士学位论文奖和2011年度中国人工智能学会优秀博士学位论文奖。

科研项目
[1] 面向关联关系数据的概念学习方法研究. 国家自然科学基金面上项目, 2016.01-2019.12, 主持人
[2] 面向跨领域数据的概念融合方法研究.山西省留学基金项目,2016.01-2018.12, 主持人
[3] 大数据分割与融合方法研究.山西省留学择优资助项目,2017.01-2019.12, 主持人
[4] 面向分类型块数据的聚类算法研究. 山西省自然科学基金项目, 2015.01-2017.12, 主持人 
[5] 面向块数据的用户行为模式聚类算法研究. 中国博士后科学基金面上项目(一等资助), 2012.03-2013.12, 主持人;
[6] 面向符号属性数据的聚类算法研究. 山西省自然科学青年基金项目, 2010.01-2012.12,  主持人;
[7] 基于软计算的数据挖掘技术研究与实现. 山西高校科技研究开发项目, 2007.01-2009.12, 主持人;
[8] 面向企业的智能数据分析平台. 太原市科技局项目,2007.04.-2008.03, 主持人;
[9] 面向超市数据挖掘系统的研究与实现. 山西大学青年基金, 2005.04-2007.10, 主持人;
[10] 面向混合数据的粒度计算理论与方法. 国家自然科学基金项目, 2010.01-2012.12, 第二参与人;
 
代表论文
[1]  Fuyuan Cao,Joshua Zhexue Huang,Jiye Liang. A fuzzy SV-k-modes algorithm for clustering categorical data with set-valued attributes, Applied Mathematics and Computation, 2017, 295:1–15.
[2]  Fuyuan Cao,Liqin Yu,Joshua Zhexue Huang,Jiye Liang. k-mw-modes: an algorithm for clustering categorical matrix-object data, Applied Soft Computing, 2017, 57:605-614.
[3]  Fuyuan Cao,Joshua Zhexue Huang,Jiye Liang. Trend analysis of categorical data streams with a concept change method, Information Sciences, 2014, 276:160–173.
[4]  Xingwang Zhao,Jiye Liang,Fuyuan Cao. A simple and effective outlier detection algorithm for categorical data, International Journal of Machine Learning and Cybernetics, 2014, 5(3):469–477.
[5]  Fuyuan Cao,Jiye Liang,Deyu Li,Xingwang Zhao. A weighting k-Modes algorithm for subspace clustering of categorical data, Neurocomputing, 2013, 108:23-30.
[6]  Liang Bai,Jiye Liang,Chuangyin Dang,Fuyuan Cao. The impact of cluster representatives on the convergence of the K-Modes type clustering, IEEE Transactions on Pattern Analysis and Machine Intelligence, 2013, 35(6):1509-1522.
[7]  Liang Bai,Jiye Liang,Chuangyin Dang,Fuyuan Cao. A novel fuzzy clustering algorithm with between-cluster information for categorical data, Fuzzy Sets and Systems, 2013, 215:55–73.
[8]  Fuyuan Cao,Jiye Liang,Deyu Li,Liang Bai,Chuangyin Dang. A dissimilarity measure for the k-Modes clustering algorithm, Knowledge-Based Systems, 2012, 26:120-127.
[9]  Jiye Liang,Xingwang Zhao,Deyu Li,Fuyuan Cao,Chuangyin Dang. Determining the number of clusters using information entropy for mixed data, Pattern Recognition, 2012, 45(6):2251–2265.
[10]  Jiye Liang,Liang Bai,Chuangyin Dang,Fuyuan Cao. The k-means-type algorithms versus imbalanced data distributions, IEEE Transactions on Fuzzy Systems, 2012, 20(4):728-745.
[11]  Liang Bai,Jiye Liang,Chuangyin Dang,Fuyuan Cao. A cluster centers initialization method for clustering categorical data., Expert Systems with Applications, 2012, 39(9):8022-8029.
[12]  Fuyuan Cao,Jiye Liang. A data labeling method for clustering categorical data, Expert Systems with Applications, 2011, 38(3):2381-2385.
[13]  Liang Bai,Jiye Liang,Chuangyin Dang,Fuyuan Cao. A novel attribute weighting algorithm for clustering high-dimensional categorical data, Pattern Recognition, 2011, 44(12):2843-2861.
[14]  Fuyuan Cao,Jiye Liang,Liang Bai,Xingwang Zhao,Chuangyin Dang. A framework for clustering categorical time-evolving data, IEEE Transactions on Fuzzy Systems, 2010, 18(5):872-882.
[15]  梁吉业,白亮,曹付元. 基于新的距离度量的K-Modes聚类算法, 计算机研究与发展, 2010, 47(10):1749-1755.
[16]  杨红菊,韩建栋,曹付元. 采用位平面直方图特征向量的图像检索方法, 计算机工程与应用, 2010, 46(21):165-167.
[17]  Fuyuan Cao,Jiye Liang,Guang Jiang. An initialization method for the K-Means algorithm using neighborhood model, Computers and Mathematics with Applications, 2009, 58:474-483.
[18]  Fuyuan Cao,Jiye Liang,Liang Bai. A new initialization method for categorical data clustering, Expert Systems with Applications, 2009, 36(7):10223-10228.
[19]  杨红菊,张艳,曹付元. 一种基于颜色矩和尺度纹理特征的彩色图像检索方法, 计算机科学, 2009, 36(9):274-277.
[20]  姜广,曹付元,张倚驰,高嘉伟. 基于SQL的粗糙集属性约简方法, 计算机工程, 2008, 34(11):69-71.