学术影响力是衡量学术实体的重要的评价指标。如何合理、公平地评估学术影响力,准确预测学术影响力并进行精准推荐,正面临着隐式关系、动态学术网络嵌入以及学术影响力膨胀等方面的诸多挑战,已引起国内外科研工作者的广泛关注。本书介绍了作者在学术影响力评估、预测与推荐方面的研究成果,展示了数据驱动的学术影响力评估、预测与推荐研究的技术趋势。 本书内容对于学术大数据研究具有一定的参考意义,既适合专业人士了解学术影响力评估、预测与推荐的前沿热点,也可以作为对学术大数据研究感兴趣的本科生和研究生的学习读物。
关注热点,展示数据驱动的学术影响力评估、预测与推荐研究的技术趋势。
学术影响力评估、预测与推荐在国家科研基金分配、人才引进及科研奖励等方面扮演着重要角色,因此,学术影响力评估、预测与推荐研究已经受到国内外科研工作者的广泛关注。本书共包括四章。
第1章主要综述学术影响力评估的方法。在学术影响力量化研究中,有两个大的转变:一个是从非结构方法向结构化方法过渡;另一个是从单一学科的学术影响力评价到跨学科的学术影响力评价的转变。尽管有大量的研究展示量化学术影响力评估的方法,但是学术影响力评估研究中还存在许多挑战性的问题,如合作影响力的模式、统一的评价标准、隐式成功因素挖掘、动态学术网络嵌入以及学术影响力膨胀。
第2章主要针对现有的基于网络结构化的论文影响力评估方法以及机构影响力评估方法中存在的弊端,即没有在异构的学术网络中共同量化机构和论文的影响力,提出了基于机构-引用网络的PageRank评估方法。基于机构与论文之间的关系,构造了一个异构的学术网络机构-引用网络。基于机构-引用网络,利用PageRank算法,计算机构和论文影响力评分。基于此,比较IPRank算法和对比算法。本章在一个真实的数据集上进行了相关的实验,并证明了本文提出基于机构-引用网络的PageRank算法优于现有的评估方法。基于机构-引用网络的PageRank算法能够更好地识别诺贝尔奖的论文和获得诺贝尔奖的机构。
第3章针对KDD CUP 2016竞赛预测机构影响力这一目标,提出了三个基于机器学习的多特征的预测模型,如马尔科夫模型、神经网络模型和基于支持向量机和神经网络的模型。在三类模型中,主要使用的特征包括机构历史的评分、时间信息和空间信息。实验结果表明SVM NN类模型的预测性能总体上好于马尔科夫模型和神经网络模型。在实验中,我们发现有两个有趣的现象:(1)给定相同的预测方法,不同的会议数据,可能得到不同的预测效果。这表明,模型的预测力与实验数据紧密相关。(2)在一定程度上,时间加权和国家加权能够提升模型的预测力,但是,提升的幅度和实验数据紧密相关。这表明,不同算法的预测力与实验数据是相关的。
第4章主要介绍了学术论文推荐系统的方法包括基于内容过滤的推荐、基于协同过滤的推荐、基于图的推荐以及基于混合方法的推荐等。此外,本章详细介绍了论文推荐系统的评价指标包括准确性(Precision)、召回率(Recall)、F值(F-measure)、归一化折损累计增益(NDCG)、均值平均精度(MAP)、平均倒数排名(MRR)、均方根误差(RMSE)、平均误差(MAE)、用户覆盖率(UCOV)。后,我们讨论了学术论文推荐系统中几个挑战性的问题:冷启动、稀疏性、可扩展性、隐私性、偶然性以及统一的数据标准。
本书的出版,得益于2018年辽宁省科技厅重点计划指导项目以及2019年辽宁省教育厅高等学校创新人才支持计划的资助。本书主要面向从事学术大数据研究的科研人员以及相关研究领域的广大师生。由于学术影响力评估、预测及推荐的相关研究发展迅速以及作者能力有限,书中若有不妥之处,敬请广大读者与同行专家提出宝贵的意见。在此,感谢鞍山师范学院校领导和科技处领导,给予我大力支持和经费保障,特别向为本专著的出版做出贡献的同志表示衷心的感谢!前言学术影响力评估、预测与推荐
白晓梅2021年1月
白晓梅,博士,鞍山师范学院计算中心副教授,鞍山师范学院大数据研究所所长,鞍山市杰出科技工作者,辽宁省创新人才。毕业于大连理工大学软件工程专业,研究兴趣包括数据科学、知识管理和网络科学。在Journal of Informetrics、IEEE ACCESS、Scientometrics等国际重要期刊和WWW、AAAI等国际会议上发表英文论文30余篇, 20余篇论文为SCI检索源。主持辽宁省重点研发计划指导计划项目1项、辽宁省自然科学基金项目1项,参加国家自然科学资金以及省市级项目10余项,获得辽宁省自然科学成果三等奖,辽宁省教育软件大赛二等奖;申请国家发明专利4项。
第1章学术影响力评估概述
第2章基于异构网络的机构与论文影响力评估
第3章机构影响力预测模型
第4章学术论文推荐:综述