国家知识基础设施(National Knowledge InfrastructureCNKI)的概念,由世界银行提出于1998年。CNKI工程是以实现全社会知识资源传播共享与增值利用为目标的信息化建设项目,由清华大学、清华同方发起,始建于19996月。在党和国家领导以及教育部、中宣部、科技部、新闻出版总署、国家版权局、国家计委的大力支持下,在全国学术界、教育界、出版界、图书情报界等社会各界的密切配合和清华大学的直接领导下,CNKI工程集团经过多年努力,采用自主开发并具有国际领先水平的数字图书馆技术,建成了世界上全文信息量规模最大的"CNKI数字图书馆",并正式启动建设《中国知识资源总库》及CNKI网格资源共享平台,通过产业化运作,为全社会知识资源高效共享提供最丰富的知识信息资源和最有效的知识传播与数字化学习平台。 

中国知网的智能标引技术在今年取得了突破性进展,该技术从2012年开始研发,旨在精确标引出每一篇文章的主题特征,主要应用场景便是主题检索,目的是为读者提供更加完整、系统、准确、及时的检索服务。

智能检索的核心突破是:主题相关条件下按照时间排序,让读者发现最新的高相关文献。智能检索(用NVSM表示)与传统检索(用KNS表示)的主要区别如下:

1、检索技术

1KNS检索

KNS检索,以“主题”字段检索为例,实现机制是在题名、作者关键词、机标关键词、摘要等内容字段中检索,无法体现全文特征,容易造成漏检;以“全文”字段为例,实现机制是在“全文索引”中进行检索,容易造成过检,检出大量不相关的内容;

2NVSM检索

NVSM检索是在中国知网标引出来的主题字段中进行检索,该字段内容包含一篇文章的所有主题特征,同时在检索过程中嵌入了专业词典、主题词表、中英对照词典、停用词表等工具,并采用关键词截断算法,将低相关或微相关文献进行截断。 

2、排序算法

1KNS检索只能实现一维排序,即检索出结果后只能按照主题排序或者按照时间排序。造成的后果就是:第一、按照主题排序,读者获得的结果长时间不变,排在前几页的结果几乎没有变化,最新发表的研究成果往往淹没在海量文献中,无法被读者第一时间发现;第二、按时间排序,由于没有准确的主题标引,排在前列的结果会出现“主题漂移”,与读者的检索意图相去甚远。

2NVSM检索实现了主题和时间二维排序。即首先通过智能标引算法实现了主题相关,然后默认按时间排序。这样就攻克了检索领域的这一难题,让读者不仅获得主题相关的内容,并且最新的成果排在前列,让最新的研究成果可以被读者第一时间发现。 

目前中国知网的后台有两套系统在为各位读者服务:NVSM智能检索,承载15%的用户流量,KNS传统检索承载85%用户流量。知网将一步一步将KNS检索迁移到NVSM智能检索,当然同时保留原有KNS版本。所以,读者在检索过程中会出现检索结果不一样的现象,待全部升级完毕后,此现象将自动消失。

 

 

 

 

 

 

 

脚注信息

          


Copyright(C)2017-2019   Modern International Green Culture Communication Association (MIGCCA)

MIGCCA-现代国际绿色文化交流协会 版权所有

邮箱:postmaster@migcca.com  制作单位:现代国际绿色文化交流协会

南京私家侦探青岛私家侦探上海私家侦探苏州私家侦探沈阳私家侦探深圳私家侦探天津私家侦探武汉私家侦探西安私家侦探厦门私家侦探郑州私家侦探