项目查重中的大数据挖掘

传统的科技项目重复检查方法以项目申报为研究对象,通过文本挖掘算法计算科技项目的相似性。但是,项目申报基本上不对公众开放,从而限制了项目重复核查方法的研究和应用。

 

除了项目说明外,各种项目管理和执行联系还将产生与项目研究内容密切相关的信息,如进度报告、学术文件、最后报告和科技成果。

 

其中,学术文章是公共出版物,其书目信息通常可通过文献编辑/服务提供商的网络平台获得。国家科学技术报告服务系统(Old 1)和国家科学技术成果转化项目图书馆系统(IV 1)的网站已经正式开通,由资金资助的项目产生的科技报告和科技成果的基本信息,包括标题、关键词和摘要,分别向公众开放。这些网站平台为整合来自多个来源的相关信息提供了数据保证,以便对项目进行重复核查。

 

此外,随着海量数据挖掘技术的不断发展和普及,综合海量多种信息的建模方法和快速处理算法越来越完善,为利用海量数据挖掘方法解决核查问题奠定了理论和技术基础该方法扩大了项目重复核查方法的应用范围,具有重要的研究价值,并将成为科技项目重复核查领域的新研究方向。

 

国家科技管理信息系统将大力鼓励对跨部门规划项目进行重复控制。科技计划管理部门之间缺乏有效的项目信息共享和整合机制,是中国项目多报告问题的根源;以及

 

中国科技部领导的国家科技管理信息系统将中央资助的五种新型科技计划的全过程管理纳入一个统一的信息平台,实现国家科技资源的全面管理。该平台涵盖所有项目管理联系的信息,如需求收集、指南出版、项目声明、项目编制和预算安排、监督和检查以及接受结果。一方面,科技计划署可以实现科技计划管理部门之间项目信息的相互联系和交流,另一方面,科技计划署可以整合每一个科技项目管理环节产生的信息。因此,一旦文档查重系统完成并投入使用,它将有效地促进所有科学和技术方案的重复核查工作,并将在确保科学和技术项目的公平和优化科学和技术资源分配方面发挥重要作用。


2021-06-21 16:58:34

相关文章

非招标采购方式有哪些特点? 在互联网时代版权保护面临哪些难题? 什么是两阶段招标? 标书查重重要吗? 招标的类型主要包括哪几个? 建筑工程预算在投标报价的重要性有什么? 实用新型专利到期后该怎么续展?