标书查重算法及使用技巧

标书查重是用来辅助判断围标串标行为的重要手段,一个好的标书查重系统需要拥有优化过的查重算法。

比如一个场景,投标文件中会大量复制招标文件中的一些技术和商务条款,

这就导致比对的标书中存在大量重复,相似度很高。这种情况,重复是合理的,造成的高相似度不能判定为围标串标。

好的查重系统需要能够过滤上述场景中的内容,也就是白名单过滤功能。将招标文件作为白名单,投标文件中和白名单相同的内容,在对比之前先进行过滤,

这些能够避免造成不合理的高相似度,防止误导评审人员判断围标串标。

过滤掉干扰因素后,标书查重的相似度才有参考性。相似度单个看意义不大,多个相似度一起看才能发现问题。一批投标书,大家的相似度都是20%左右,

而有两份投标书相似度是40%,那么这两篇标书就应该重点查看,打开对比详情,检查到底是哪些内容相似,相似的地方合不合理,经过人工审查判断后,最终才能做出围标串标的判断。

实际操作过程中,也是根据相似度从高到低的查看,高相似度重点检查,低相似度的根据时间可以放宽检查对比。

标书查重系统可以利用计算机的强大算力,在短时间完成大量文字的对比工作,帮助人节省大量时间,辅助评审人员判断是否有围标串标行为。

Tocheck致力于研究开发文本相似度检测技术,为企事业单位提供标书查重,项目申报/专利查重,员工论文查重,企业信息资产安全保护等多项服务。


2022-12-29 17:07:51

相关文章

申请专利需要满足的条件? 有哪些会被判为无效投标的误区? 专利申请有哪些好处? 管理项目立项申报要怎么写? 专利申请有什么好处? 管理项目立项申报怎么写? 如何设置采购流程?