标书查重算法及使用技巧

标书查重是用来辅助判断围标串标行为的重要手段,一个好的标书查重系统需要拥有优化过的查重算法。

比如一个场景,投标文件中会大量复制招标文件中的一些技术和商务条款,

这就导致比对的标书中存在大量重复,相似度很高。这种情况,重复是合理的,造成的高相似度不能判定为围标串标。

好的查重系统需要能够过滤上述场景中的内容,也就是白名单过滤功能。将招标文件作为白名单,投标文件中和白名单相同的内容,在对比之前先进行过滤,

这些能够避免造成不合理的高相似度,防止误导评审人员判断围标串标。

过滤掉干扰因素后,标书查重的相似度才有参考性。相似度单个看意义不大,多个相似度一起看才能发现问题。一批投标书,大家的相似度都是20%左右,

而有两份投标书相似度是40%,那么这两篇标书就应该重点查看,打开对比详情,检查到底是哪些内容相似,相似的地方合不合理,经过人工审查判断后,最终才能做出围标串标的判断。

实际操作过程中,也是根据相似度从高到低的查看,高相似度重点检查,低相似度的根据时间可以放宽检查对比。

标书查重系统可以利用计算机的强大算力,在短时间完成大量文字的对比工作,帮助人节省大量时间,辅助评审人员判断是否有围标串标行为。

Tocheck致力于研究开发文本相似度检测技术,为企事业单位提供标书查重,项目申报/专利查重,员工论文查重,企业信息资产安全保护等多项服务。


2022-12-29 17:07:51

相关文章

陪标要演得像靠的是关联企业吗? 中标通知书到手那天,才发现自己是责任承担者 中标后甲方为何迟迟不签合同? 废标理由千千万,唯有未响应最具争议 低价中标高价索赔,合同陷阱要怎么识别? 电子招投标形式主义该如何破局? 如何打破区块链存证难落地的困局?