加载中...
推荐位 推荐位

解读《专利审查研究(第十辑)》--“基于语义相似原理程式化扩展关键词”

发布时间:2021.12.14 福建省查看:927 评论:3

我的公众号原文链接:https://mp.weixin.qq.com/s/gPtFesYd4q-SLAIlvafHtQ
-------------------------------------------------

本文解读的对象,为《专利审查研究(第十辑)——检索特辑》书中“检索理论研究”部分论文之一。本书由国家知识产权局专利局专利审查协作北京中心组织编写、郭雯主编。以下跟读均仅代表本人观点,不代表国家知识产权局专利局专利审查协作北京中心、郭雯观点。如有其他理解欢迎交流。

 


《专利有效性检索》这本书没剩几个案例了,我正在找对应专业领域大佬,后期会更新解读。但学习不能停啊,因此马上开始下一本吧。
 

1.jpg

本文开始解读《专利审查研究(第十辑)——检索特辑》。这本书是国家知识产权局专利局专利审查协作北京中心组织编写的,结集了40篇检索论文,共分为“检索理论研究”、“检索实践与经验”、“检索工具与运用”三个部分。——简言之,这是本北京审查员们的论文集主要结集了理论、技巧及数据库使用三个方面的论文。粗粗看了几篇,写的深度还是很足够的,不太建议刚准备入门检索的朋友们看。
 
本书论文我不会每一篇都写,出于必要性、领域等各方面原因,我会挑选部分论文进行解读。

“基于语义相似原理程式化扩展关键词”的作者是黄蕾、赵良、刘婉姬,这是本书第五篇论文。

 

根据摘要及引言,本文主要解决的是,难以选取及扩展关键词的问题。什么时候会难以选取及扩展关键词?我在往期的解读中有举例:浅读检索--《浅谈夹具领域如何提高检索效率》浅读检索--《包含通用结构专利的检索和审查》。总结的说,某个检索要素是多领域通用的,那么选取及扩展会带来巨大噪音;某个检索要素是含糊的,即便说明书也没有具体解释,那么选取及扩展是很难的;其他。

 

既然关键词很难选取及扩展,那就用语义检索来帮助解决关键词选取及扩展问题,这便是这篇论文的主要解决目的。

 

作者认为:

 

从文献中抽取的关键词是进行语义检索的基础,其反映了构成文献文本及其技术方案的主要特征。若从批量语义相关文献的集合中获取关键词,则能反映本领域此类文献通用的意思表达方式。当本申请技术方案中包含不易表达的待扩展检索要素时,通过映射语义相似文本的关键词的比对和推导,就可能找到本领域准确表达待扩展检索要素的表达方式[1]

 

2.jpg

 

乍一看是有点懵的。但浓缩总结一下就是:
 
我从检索对象中抽出一些内容进行语义检索,然后从语义检索的检索结果中找到若干有相似度的专利,从中选取关键词

 

3.jpg

应该秒懂了吧。既然关键词不好直接选取及扩展,那么我就拐个弯,我从语义检索入手,然后找与检索对象有一定相关性的文献,之后再从中选取关键词。选取了就可以总结并扩展了,然后就可以构建检索式了。
这个思路有没有很熟悉呢。
没跑了,就是补充检索。陪大家回忆一下,什么是补充检索。补充式检索大概有三种情况:
1)随时根据浏览到的新信息进行补充
在实施块检索策略时发现了相关的分类号或关键词,及时进行补充。这是根据浏览到的新信息进行补充的一种情形。另一种可能的情形是,我们会发现一些相关的,但是被我们遗漏的可选取分类号或可扩展关键词。这样的补充检索情形是三种补充式检索情况中最常见的。我们几乎不可能一开始就选取到最准确且全面的分类号和关键词,因此我们在检索过程中浏览发现的新信息就是很重要的分类号及关键词补充,甚至是补充参考。
2)在具体国家数据库再次使用原策略
3)以证据组合思路补充思考继续策略
 
2和3与本篇论文中补充检索不是一个类型,因此我就不详述了。那写到这里,我们知道了,本篇论文中作者讲到的以语义检索来选取扩展关键词的方式其实是关键词补充检索方式的一种,也就是说并不是非得用语义检索的方式才能达到补充检索的目的。那么其他方式呢?
 

4.jpg

1)可以借用相似检索,在与检索对象的相似文件中选取及扩展关键词,前提是检索对象是一篇专利而非交底书或其他文献;

5.jpg

2)可以查阅百度、期刊论文等现有技术,基于对技术更深的了解后,便能进一步选取和扩展关键词了,这种方式往往出现在对检索对象技术领域专业词汇或业内用语不熟悉的情况。

6.jpg

其他方式就不举例了。回到本篇论文。
理解了原理之后,本篇论文剩下的部分就能一眼看明白了。作者阐述,“模糊检索要素之所以难以表达,是因为难以预期其在本领域中的准确描述方式。扩展起点往往是一种'意会',或者是检索要素所在句子、段落或整个文本。[1]这种方式往往出现在对检索对象技术领域专业词汇或业内用语不熟悉的情况,这与我提到的可用的“查阅百度、期刊论文等现有技术”的补充检索技巧很适配。语义检索和查阅现有技术都是可以解决不熟悉特定领域的问题。书中58页有张图,是基于语义相似原理的程式化扩展路径,在此分享一下,顺便手中有书的朋友注意下,这里有错别字。

7.jpg

作者提到应该根据扩展的预期来选择或调整检索命令。也就是说,并不是随意输入什么内容都能很好的利用语义检索来达到选取关键词的目的。这是由语义检索的特质决定的:
 
...若某一非发明点的技术特征出现多次时,在语义检索的词频统计过程中会对技术特征赋予较高权重,反而将真实发明点的权重降低...[2]
 
语义检索有效性的影响因素会包括输入内容的词频及词义,因此输入内容不可随意,尤其我个人非常不建议直接输入专利号或权利要求内容进行语义的方式。虽然作者在论文中这么用了,但我还是不建议大家这么做。输入这些内容,相当于直接利用了专利全文或者权要整体内容进行语义检索,即我们对于检索输入内容是没有进行调整的,语义检索的有效性完全且随意的取决于我们直接搬运的内容。
 
那么怎么解决语义检索的这个问题?既然问题是我们直接搬运引起的,那我们不直接搬运就可以了。
 
这一方面可以反向利用其逻辑,控制输入内容的词频,另一方面控制输入内容的表达,具体的说可以控制输入要素的表达准确度,及输入要素间的位置远近。第二点解决技巧就不具体阐述,不是本文重点。
 
刚才我提到作者在论文中用了通过申请号或权利要求两种方式。权利要求另说,单说输入申请号进行语义,经我实践来看其实准确度是比不上直接拿申请号文献进行相似检索的,这里我建议大家如果一定要用申请号,那么多试试相似检索。
 
总结。
 

8.jpg


1)语义检索可以是补充检索的一种关键词选取手段。
2)语义检索挺好用,尤其是降低了对特定领域技术理解的依赖性。说白了有点万金油。
3)因为是万金油,针对很多很多检索案例其实并不好用,他有噪音极大准确率极低的特点,容易空费检索耗时,建议大家一定要重视检索式的构建及调整的学习。
 

参考文献:

[1]国家知识产权局专利局专利审查协作北京中心.专利审查研究(第十辑)——检索专辑[M].北京:知识产权出版社,2019:55-63

[2]胡莹莹,.论布尔检索与语义检索的联合运用策略[J].中国发明与专利,2019,(16):161-166

 


 

 

黑娃

许利民,思博论坛ID“黑娃”

1)泉州振科技术服务有限公司信息技术总监、泉州合连知识产权管理有限公司法人、思博论坛版主及检索讲师、检索分析师;

2)擅长无效检索、侵权检索、稳定性检索、公众意见检索、查新检索,有涉诉无效检索经验;

3)有对企业、代理机构及高校的专利检索培训经验,有依托思博论坛和合享(incopat)平台的直播检索讲课经验


分享(1)

收藏(4)

点赞(1)

举报

评论列表

  • 第1楼
    卷心菜来啦

    2021/12/14 09:33 [来自北京市]

    收起回复 0 举报
    • 2021-12-14 10:57:52 [来自福建省]

      回复 0 举报
  • 第2楼
    一枚卷心菜

    2022/02/11 10:27 [来自上海市]

    0 举报

快速回复