专利智能检索,数据库怎么选?可以试试这篇文章中的“三步走”
发布时间:2021.12.09 北京市查看:2043 评论:0
数据库的选择是专利检索过程中非常重要的一个环节,在专利智能检索过程中如何选择合适的数据库来提高检索精准度和速度,相信也是很多朋友关心的问题。
个人觉得专利智能检索的数据库选择有以下几个需要注意的原则。
第一,目标文献出现概率最大原则
这个原则是任何检索方式都需要一致遵循的。例如选择搜索公众号文章,不能去百度,而是要去搜狗。
具体到专利检索,也会存在一些预判:
对于大学和科研院所的专利申请,由于技术先进性比较高,且大多会发文章,因此可首选非专利数据库进行检索。
对于某技术集中在特定几个国家的专利申请,例如日本或美国的一些优势技术,优先选择在这个国家的专利库检索可能有惊喜。
对于具有特色数据库的技术,例如中药,有机化学等,也可优先选择在相关的数据库中检索。
对于生活类的发明专利,可以选择在购物网站,推荐视频网站以及论坛等检索。
......
这个原则是最基本的,巧妇难为无米之炊,没有目标文献的数据库,哪怕检索技能再高超也派不上用场。
第二,尽可能检全原则
不管哪种检索方式,检全的意义还是很重大的。
在传统的布尔检索,由于浏览的限制,我们需要将文献数量限定在合适范围内,检全难度较大。但是智能检索不同,语义排序可以让浏览冲破检索结果数量多的束缚。
全文库检索有两个好处。
第一是尽可能多的包含检索要素的文献圈进来,提高查全率。
第二是语义引擎是基于大数据多信息的比对,信息过少例如仅仅是摘要的比对,容易产生偏差。
因此,在智能检索时,推荐优选全文库。
第三,适配性原则
这里的适配性主要涉及布尔检索要素的表达和语义基准的语言选择。
随着越来越多的外文文献被翻译成为中文,形成了外文全文中文数据库。很多时候我们可以用纯中文来检索外文专利文献。
不过,相同的检索词在不同的语言表达下,其唯一性和精准性有所不同。为了准确检索,选择与检索词精准表达语言相适配的数据库也能提高检索精准度。
还有,不同语言的数据库,其语义模型有所不同。在相关特定语言的数据库中检索时,系统识别的是与之对应语言的文本,如果不相同,机器会做自动翻译工作。
由于翻译会导致一部分内容失去原本的味道,因此,建议使用与检索数据库对应的语义基准进行排序,例如在检索美国全文数据库时,可优先选择美国同族专利作为语义基准进行语义检索和排序。
智能检索数据库选择三步走
从上述分析也可以看出,三个原则彼此是递进选择的关系。
优先考虑第一个原则,在一个没有对比文件的数据库里面,哪怕你的检索的一个技巧再进再精确,哪怕你用再高深的语义结束系统,你也是不能获得对比文件的。
因此在检索前,充分理解发明,了解背景技术,储备整个技术发展的脉络,深入分析专利申请的非技术信息如申请人类别等,这样才能够让我们在选择数据库的时候有的放矢。
检索就是要需要尽可能的做到查全和查准,非得选一个,在智能检索条件下,优先选择检全,让浏览交给语义排序吧。
在查准的过程中,就是考虑适配性的问题。
可以小结一下,对于数据智能检索的数据库的选择,可以分为三步走
第一步,预判对比文件可能出现在哪个数据库,选择相应的数据库。
第二步,选择数据库的全文数据库模式,尽量做到查全,把浏览交给语义排序。
第三步,注重语义基准和关键词的表达,适当选择翻译库还是原文库。
以上仅仅为一家之言,检索是一件非常个性化的事情,适合自己最重要。
本文内容仅代表个人观点。
您也可以读读近期这些文章:
四种方式,四种情景,四种思维
四种专利智能检索方法一图展示,清晰明了
一种基于智能检索也许能够查准,又能查全的方法
专利智能检索,从语义基准的选择开始
专利智能检索简介以及如何面对专利智能检索
THE END
评论列表
- 暂无评论数据
快速回复
XY先生说
[2]思博村村长
主题:24 回帖:39 积分:8
热帖推荐
分享
收藏(3)
点赞
举报