检索策略分享—外文检索,检索词的不准确而出现大量噪音怎么办?
发布时间:2020.07.24 河南省查看:1908 评论:3
主题:检索交流讨论
问题1:英文检索的时候英文词的翻译,大家是用什么软件进行翻译的,
在进行外文检索时,老是因为检索词的不准确而出现大量噪音。——提问人 刘斌
问题2:查准查全,有一个判断标准么?查准感觉好判断一点,查全如何定性?——提问人 TANG_tang
2020年7月24日
主题:检索交流讨论
群聊名称:黑娃·检索交流 (群聊二维码放最后了 )
主角:粢饭团,黑娃
课代表:我叫阿良
问题1:英文检索的时候英文词的翻译,大家是用什么软件进行翻译的,
在进行外文检索时,老是因为检索词的不准确而出现大量噪音。
1、zhc:
专业词汇的可以用 cnki的翻译助手
2、黑娃:
谷歌翻译
输入中文关键词后查看对应外文专利,看外文专利中外国人的对应表达。
可以借用专利汇。噪音的确大但是结果会多一些。
查全难在领域和关键词的扩展。
相关性排序一般按照所选关键词出现在摘要权要中的频率数量。但是相关性低的呢。可能在背景技术也会出现想要的文件。
尽量穷举检索式
不同检索式尽量扩展关键词
3、粢饭团:
先用中文检索,因为数据库会有自动翻译功能的。
所以一定能找到相关的专利,然后看这些专利的用词。
第二可以 直接搜国外龙头企业的专利,看他们的用词
英文去噪,比较难。
比如现在的数据 输入多个单词 无人艇 unmanned vehicle。
对这个词分别检索,一定要用好连词符和间词符
英文检索的时候 英文关键词一定要 选好 并且多种组合 用不同的连词符和间词符进行多次检索
不断地更新和组合检索策略
跟中文检索一样的,如果有分类号直接能代表关键词 就用分类号
分类号+关键词(与分类号不重复的) 能最快的确定检索范围
基本上初级检索 都是查准 查全的意义不大
除非你做企业分析或者行业分析 以及FTO 不然没必要查全
(黑娃觉得:查全比查准容易,个人习惯了,比较熟练,就是耗时比较多)
(粢饭团认为:准确率是可以人工去噪提升的,查全就是检索策略的调整问题,所以查全反而会比较难)
粢饭团举例:比如说我当时做无人艇, 一开始都是 无人(智能/自动)+船(海上航行 或 艇等)这样的思路
后来通过企业验证查全率的时候,发现了 竟然有很多人把无人艇 定义为 水上机器人
查全率 检索完成之后。 随机挑选4-5个企业,人工阅读看他们所有公开的专利中 你检索到的专利/真实相关专利
举例:你在通过对这4家企业的全部专利进行检索,然后阅读,发现跟你主题相关的专利其实是有150,那么查全率就是 60%
查准率 检索完成后 随机抽4-5个企业的专利,然后人工阅读 你看 真实相关专利/检索的专利 这个就是查准率
举例: 你检索一个专利文件 共得 1200条专利。 随机抽样了4个企业,检索中他们的专利数总量是 90件,
通过对这90件阅读,你发现 有20件是不相关的。 那么查准率就是 70/90=77.78%
然后你就要分析噪音出现的原因 以及漏检的原因,再进行补充检索和去噪,来回反复最终得到有效的 检索数据库
这组关键词看完,就换其他组关键词 ,多换几种关键词,还找不到其他的对比文件,就结束了去比对对比文件,这样容易出问题
所以要 先验证查准,如果先验证查全 你只比较数据总量 会出问题
问题2:查准查全,有一个判断标准么?查准感觉好判断一点,查全如何定性?
粢饭团:查全和查准的判断方法就是 抽样 估算整体
加以下任意微信,备注——进检索交流群
群主:SIPO--heiwa
管理员:xiaoxiaoxuetu_leyan
课代表:CCZ-NEW-IP
群规:
1.主要是检索交流
2.可备注代理师、IPR或律师等
3.不打广告
4.不开车
5.不辱骂、人身攻击、敏感话题
6.不过度闲聊(如长时间****特没谱等)
7.能达成目的的检索就是好检索
评论列表
快速回复
我叫阿良-善良的良
[5]思博市市长
主题:17 回帖:209 积分:846
haibo
2020/07/24 15:35 [来自广西壮族自治区]
收起回复 0 举报飞舞的狮子
2021/03/03 17:19 [来自河北省]
0 举报