怎样用Patentics检索?如何善用Patentics专利的方法


Patentics检索专利的方法
语义检索比传统的布尔检索多做了一步,也就是对检索结果按照与给定目标的语义相关度进行重新排序。

如上图,在圈定小人后,我们对小人按照从大到小的顺序排序,那么在靠前位置就可以得到我们想要的大小人。专利检索时也是类似,在圈定出专利集之后(例如通过领域关键词或IPC分类号圈定),我们给定一个语义排序标准,可以是一个专利(号码)、一段话或是一个关键词,然后按照与这个标准的语义相关度的大小,对圈定的专利集重新排序,最相似的专利就会被排在最靠前的位置,我们就可以高效地获取想要的专利文献。
Patentics中语义检索命令为R/,其中R即是Rerank的缩写,也就是重排序的意思。R/命令后可以输入文字内容或者专利号码,输入专利号码时,系统会自动提取该篇专利的全文文本进行语义检索。
为了满足审查员日常新颖性检索需要,Patentics还提供RDI/命令,后可跟专利号码,含义是检索该专利申请日前公开的最接近专利文献。
在单独使用R/命令或RDI/命令时,系统会对全库进行语义重排序,但只会给出最相关的400篇专利文献,因为系统在给出检索结果时,已将更相关的放在了最前面,排名400以后的相关度会越来越低,因此会有默认的截断。但如果大家想查看更多,可以使用CTOP/命令限定要查看的专利数量,例如CTOP/1000,查看最相关的1000篇。

上图可以简要说明R/命令的执行过程,大概可分为三步。第一步是系统对整个专利数据库中每篇专利全文抽取关键词,将每篇专利都转变成一个有多个词构成的文档向量,然后使用这些大量的文档向量训练语义模型,其实就是前文所说的将这些本在不同空间使用不同标尺衡量的向量都转换到相同的语义向量空间中,以便在同一个坐标系中去测量它们,使得他们之间具有可比性。
第二步就是我们输入一个专利申请号或文本内容进行检索,系统同样会对其抽取关键词,转换为一个文档向量。然后使用训练好的语义模型对其进行向量合成,将我们输入的内容也放到语义向量空间模型中。
第三步就是将我们输入内容的文本向量和数据库中的专利的文本向量进行向量运算,计算它与每篇专利的相关度,最后按照相关度从高到低,对数据库中的专利文献进行重新排序,我们就可以在靠前位置获得相关的专利文献了。
经过训练语义模型的专利数据库会有什么奇妙的变化呢?如上图所示,它实际上是学习了全球申请人的自然表达,建立了词与词之间、词与文档之间、文档与文档之间的大数据关联。

例如,我们在R/命令后输入机器学习这个词,点击搜索框右下方的概念扩充小按钮,系统就会找出与其相关的概念词,并按词与词之间的相关性,聚类为4个主题,例如主题一下有文本分类、基于语义、挖掘方法等机器学习应用场景方面的词汇,主题二下有无监督、朴素贝叶斯、SVM、半监督等机器学习算法方面的词汇,主题三下有最近很火的人工神经网络、深度神经网络等机器学习新算法词汇,主题四下有高维空间几何学等机器学习原理方面的词汇。
大家可以发现,这些词汇并非全是机器学习的同义词,而是相关性较高的词。无论是加工的同义词词表还是本领域技术人员能扩展出的词汇,都无法与这样海量大数据运算和机器学习后得来的全库词汇之间相关关系相比。

同样,在R/命令后输入一个专利号码,点击搜索框右下方的概念扩充小按钮,系统同样可以找出与这篇专利最相关的词汇,通过查看这些词汇和聚类的主题,就可以大概知道这篇专利适合印刷电路相关的专利。这相当于系统替我们对这篇专利进行了自动解读。

如果想更炫一点,可以点击左侧相关概念框中的小书按钮,展示相关词词云。

那么语义检索的实际效果如何呢?我们通过一个案例给大家演示一下。
这件案例是握奇诉被告专利侵权,法院判赔5000万的专利,被告第一时间对握奇这件专利提起了无效请求,此专利被复审委判决部分无效,复审委认定公开其关键技术特征的关键证据是一篇中国专利CN1482550A。
传统布尔检索在检索这篇专利时需要进行关键词、分类号扩展等利用各种检索经验和技巧。而在Patentics中,仅需输入RDI/CN200510105502.1,也就是输入要无效专利的专利号码,检索其申请日前公开的相关专利文献。

在中国申请库中进行检索,输入RDI/CN200510105502.1,可以看到最右侧是相关度百分比,第一位相关度100%,是CN200510105502.1专利本身,第二位相关度94%的即是复审委认定的关键证据。语义检索无需任何检索策略就可在仅看一篇专利文献的情况下获得关键无效证据。
而传统的布尔检索中,检索员一方面为了避免漏检,会扩展关键词分类号等检索要素,而另一方面为了减少浏览量,会限定文献在一个合适范围进行浏览,越窄的检索范围虽然浏览时间少了,但漏检风险又会大大增加。这就是传统布尔检索面临的检全与检准的矛盾所在。
而语义排序正好克服了传统检索方式检全和检准的矛盾。我们在限定浏览范围的时候可以限定得更加宽泛,不用担心文献浏览问题,因为语义排序会将更相关的文献排在靠前位置供我们浏览。也就是说,即不漏检,又能在靠前的位置找到想要的文献,解决查全和查准这一对矛盾。
以上便是KK下载给大家分享介绍的Patentics专利的检索方法!
中国科学院大学2024年最低录取分数线和位次(全国各地数据汇总)
2024年中国科学院大学全国各省录取分数线是多少?最低录取位次又是多少?据中国科学院大学官方网站公布的数据,中国科学院大学2024年一共在全国13个省份招生,其中最高分的是浙江综合平...
内蒙古大学创业学院2024年学费多少钱?每年15000元(各专业收费标准)
内蒙古大学创业学院是一所位于内蒙呼和浩特市玉泉区的综合类大学,办学性质为院校,隶属于内蒙古自治区教育厅管辖。据内蒙古大学创业学院网站公布的数据显示,2024年该校在山东省招生的...
武警海警学院2024年录取最低分数线公布:北京考生2025年参考
2024年武警海警学院在北京市的最低录取分数线是多少?2025年会有多少招生计划?每个专业的学费又是多少?这是很多北京考生和家长关心的事情,据北京市教育考试院发布的数据显示,武警海...
2024年山西工学院学费明细:一年4800元-16000元(各专业收费标准)
山西工学院是一所位于山西朔州市的理工类大学,办学性质为公办本科院校,隶属于山西省管辖。据山西工学院网站公布的数据显示,2024年该校在江西省招生的专业学费每年4800元-16000元,总...
江苏海事职业技术学院2024年每年多少学费?每年5300元(供黑龙江考生参考)
江苏海事职业技术学院是一所位于江苏南京市江宁区的综合类大学,属于双高计划之类的国内高水平大学,办学性质为公办专科院校,隶属于江苏省管辖。据黑龙江省教育考试院网站公布的数据显...
河北地质大学华信学院2024年学费明细:每年19000元(供北京考生参考)
河北地质大学华信学院是一所位于河北石家庄市的综合类大学,办学性质为院校,隶属于河北省教育厅管辖。据河北地质大学华信学院网站公布的数据显示,2024年该校在北京市招生的专业学费每...
张家界航空工业职业技术学院2024年在青海录取最低分数线和学费是多少?
随着2025年高考即将来临,很多考生和家长对自己心意的大学都会有这样的疑问,张家界航空工业职业技术学院在青海省的最低录取分数线是多少?学费又是多少钱?2025年的招生计划又是多少?...
天津轻工职业技术学院2024年学费明细:每年最低5000元最高5500元(供河北考生参考)
天津轻工职业技术学院是一所位于天津津南区的理工类大学,属于双高计划之类的国内高水平大学,办学性质为公办专科院校,隶属于天津市管辖。据河北省教育考试院网站公布的数据显示,天津...
2024年承德护理职业学院收费明细:一年5000元(供湖南考生参考)
承德护理职业学院是一所位于河北承德市的医药类大学,办学性质为公办专科院校,隶属于河北省管辖。据湖南省教育考试院网站公布的数据显示,承德护理职业学院2024年在湖南省招生的各专业...
图文资讯
最新资讯
- 广西幼儿师范高等专科学校2024年学费明细:每年最低5500元最高8600元(供江西考生参考)
- 2024年武汉文理学院收费明细:一年最低18000元最高23000元(供甘肃考生参考)
- 南京交通职业技术学院2024年学费标准:每年5300元(各专业收费标准)
- 湖南商务职业技术学院2024年每年多少学费?每年3200元-7800元(供广东考生参考)
- 辽宁现代服务职业技术学院2024年在黑龙江学费是多少?黑龙江考生2025年参考
- 武汉警官职业学院2024年学费明细:每年5000元(供四川考生参考)
- 肇庆医学院2024年在广东录取分数线和招生计划以及学费
- 中国科学院大学2024年最低录取分数线和位次(全国各地数据汇总)
- 长春电子科技学院2024年全国录取最低分数线和最低位次公布
- 四川科技职业学院2024年学费明细:每年15900元(供湖南考生参考)
- 云南艺术学院2024年学费明细:每年8500元-10000元(供重庆考生参考)
- 2024年茂名职业技术学院学费明细:一年5250元到6410元(各专业收费标准)
- 内蒙古大学创业学院2024年学费多少钱?每年15000元(各专业收费标准)
- 武警海警学院2024年录取最低分数线公布:北京考生2025年参考
- 山西金融职业学院2024年每年多少学费?每年4000元-5200元(供山东考生参考)
