加载中...
推荐位 推荐位

都告诉你了,PSS很莫名其妙的

发布时间:2020.02.14 北京市查看:1430 评论:1

本帖最后由 木三 于 2020-2-14 17:43 编辑

不少胖友看完上期✍专利族的泥石流概念以后,纷纷表示“糊涂了!”。君真的是太难了……emmmm……我怀疑有人来砸场子,但是我没有证据。
点击查看源网页


往事随风,过去的就让它过去吧!

今天要从 专利族 的角度来讨论一下 PSS 系统,被酱油君搞糊涂或者还不清楚专利族是啥的小伙伴们我还是推荐你们把上期再复习一下,说不定多看两遍就茅塞顿开了。

你们可以,你们能行!

鉴于PSS系统在圈内实在是没什么通称,叫“专利检索及分析系统”的有之,叫“专利检索与服务系统”的有之,叫“外网S系统”的有之。先来明确一下:本文所说的PSS,全称叫做Patent Search and Analysis,也就是我们从果汁局官网进去后的专利检索及分析系统,之所以叫PSS,是因为它的官网地址是http://pss-system.cnipa.gov.cn/
在上期中,提到了WIPO定义的6种同族:简单专利族、复杂专利族、扩展专利族、国内专利族、内部专利族和仿专利族。当然了,这6种定义并不是为了玩什么花样,而是有着十分现实的意义☟☟:
在不同的专利检索系统中,如果系统采用不同的专利族定义,得到的检索结果数量会大不相同。


目前,在主流的检索系统中,专利族有三种形式:

1. 以Espacenet为代表的简单专利族
简单专利族的呈现形式为:专利族成员优先权完全一致。业界传闻,欧专局的Espacenet系统检索结果页面中显示的“Also published as”中的信息就是根据简单专利族的定义给出的。但是这个地方酱油君要打个问号,因为根据酱油君的检索,并不是这样,“Also published as”给出的不完全是简单专利族。

咱们可以举一个专利界的经典例子,NL8901402、NL9000338、UA73532C2和CA2475414A1这四篇文献。为防止把你们绕晕,我们姑且依次简称为ABCD吧!看Original Document的著录项目,它们的优先权关系是:A没有优先权,B的优先权是A,C和D这两篇文献的优先权均同为A和B。BUT,你去查C,费解的是它的“Also published as”里只有A这一篇文献。这是少了的情况。

有的小伙伴说,你这个孤例不能代表什么,再说这个文献那么老。那OK,再来一个,CN108024365A这篇文献,它的优先权申请为CN201610974102和CN201710007820。CA3042828A1这篇文献,它的优先权申请为CN201610974102、CN710007820以及CN710686460。而CN108024365A的“Also published as”里,居然出现了CA3042828A1,怎么看它们的优先权申请也不是“完全一致”啊喂!而且它们不老,都是16、17年的文献哦。这是多了的情况。

一会儿少了,一会儿多了,“Also published as”究竟是个什么路数,酱油君也闹不清,反正,反正不完全是简单专利族。

Anyway,简单专利族要求成员优先权完全一致,收录范围最小。(注:下图是旧版Espacenet截图,新版Espacenet的使用方法马上推出)



2. 以I**ADOC为代表的扩展专利族
欧专局的I**ADOC是国际专利文档(INternational PAtent DOCumentation)的缩写。I**ADOC专利族的呈现形式为:一个专利族的文献之间至少能通过一个优先权发生关联。当然,这就是扩展专利族的定义了。

还需要注意,I**ADOC中还具有少部分的人工专利族。这是由于早期的文献中包含大量等同专利,但是这些等同专利并没有通过优先权来进行关联,因此,EPO的检索小组通过发明人、申请人、发明主题等找到这些等同专利,并为其分配虚拟优先权号,作为一个专利族。总体来说,I**ADOC专利族实际上是扩展同族与早期没有优先权号专利的人工专利族的合集。

I**ADOC采用扩展专利族,会收录很大范围的文献量,但由于基于优先权理念和同族的意义的放宽,可能引入技术相关但发明内容毫无关联的专利。



3. 以DWPI为代表的人工专利族
DWPI,德温特世界专利索引数据库(Derwent World Patents Index)。德温特的专利族由两部分组成:

第一部分的构成与简单专利族类似,但在1992年第16周以前,如果A文献与已经记录在德温特系统中的B文献具有同样的最近优先权,A文献被定义为相同专利。1992年第16周以后,A文献的所有优先权必须准确地与专利族中其他专利文献的所有优先权匹配,才被划归到专利族。

第二部分是将没有优先权数据的等同专利通过人工改写归为一条记录。这种专利与基本专利的申请人相同并且发明主题也相同,但由于是在原始申请之后的12个月之后申请,而不能享受优先权,不满足优先权完全匹配的条件。德温特注重依赖发明内容之间的关联度,它的人工改写理念是“一记录一发明”。

“一记录一发明”这种人工改写理念,极大地造福了专利的情报分析和信息利用,因为有这样不重不漏的数据源,可以充分提高专利情报分析、专利信息利用的有效性和准确性。因此,DWPI也在咱们专利界树足了“靠谱”的形象,收到IPer的欢迎。

理论上,DWPI同族的范围要大于简单同族,而小于I**ADOC专利族。

目前,很多专利检索系统都意识到了简单专利族和I**ADOC专利族的局限性:简单专利族的收录范围过窄,而扩展专利族又过于宽泛。

因此,国内许多商用专利检索分析系统都在向DWPI的人工专利族方向发展,但是,它们目前尚无法完全实现德温特的人工改写模式,而是通过优化算法和机器学习等方式来优化自身的同族合并功能,主要原理包括两种:
①基于I**ADOC同族数据进行优化
采用这种优化原理的平台主要有Incopat、智慧芽、万象云等,主要思路是去除I**ADOC同族中与发明内容明显无关的专利。它们通常在工具的界面同时提供“简单同族”、“I**ADOC”同族和“优化后的同族”三种类型的同族功能供用户选择。

当然了,鉴于每家平台采用的算法和逻辑不一样,如果你去检索几个专利族,大概率在不同平台得到的结果数也不会一样。

②基于“内容相似度”优化同族关系
采用这种优化原理的平台主要是Patentics,它同样采用了“I**ADOC同族”的数据,主要思路是引入一个“最早优先权日”的参数,仅将I**ADOC同族数据中的最早优先权日相同的文献作为一个同族。

此外,Patentics还提供了一种叫做“相似度排序”的功能,可以反映同族文献之间在发明内容上的相似关系。但是,目前Patentics只是提供了这个功能,并未利用“相似度”理念对I**ADOC同族的数据进行优化。日后,如果采用发明内容相似度对其进行优化,那大概是极好的,可以很大程度上减少无关专利的引入,提供同族合并功能的质量,使得同族分析更加准确。

*,“向DWPI的人工专利族学习”这种事,……,而国内目前正在做这件事的商用机构又都是小本生意。同族或者说专利族这种“高端”服务,无一不是要收费、要会员的。作为知产界的小P民,一年好几万的会员费用,怎么可能拿得出来,每每此时,只好扼腕叹息,问君能有几多愁,恰似一江春水向东流。

我们举几个小例子,简单了解一下果汁局的PSS系统、Espacenet的“Also Published As”栏目和I**ADOC得到的专利族结果差异。这样做的目的嘛,很简单,酱油君只想告诉大家:PSS的专利族检索功能,可能也许不咋靠谱!





例子1:公告号CN106454800B 北京小米移动软件有限公司
这是一篇关于手机身份验证的已授权发明专利。首先我们在PSS系统中检索这篇文献,检索结果页显示有4个同族,然后点入同族文献信息页,发现有6条结果。哈?到底是4个还是6个?


在同族文献信息页仔细数一数,PSS系统列出了以下6篇文献(包括CN106454800B本身):


而从申请号来看,这6篇文献其实就是3个申请。
那我们到EPO的Espacenet上再看一下,有多少同族呢?在“Also Published As”一栏,可以看到有5篇文献,加上CN106454800B本尊,一共是6篇文献。


再查一查I**ADOC,只有3篇:


所以,如果不把同一申请的不同公布阶段的版本合并计算,数量应该是6;如果把同一申请的不同公布阶段的版本合并计算,数量也应该是3。

那么现在问题来了,PSS系统检索结果页上的“同族4”是怎么出来的呢?莫名其妙ing。


例子2:CN108040360A 北京小米移动软件有限公司
这一个例子也是小米的,关于屏幕显示控制。如果你从上一个例子中学到的是“不要看检索结果页的同族数量,要看同族文献信息页的同族数量”,那你就大错特错了。

比如,我们在PSS系统中检索CN108040360A这篇文献,检索结果页显示有4个同族,然后点入同族文献信息页,发现有4条结果——嗯,这次数量倒是对上了。


PSS系统中显示,它的同族包括WO2019109564A1、US2019172403A1、CN108040360A、EP3499494A1这4篇文献。

下面我们在Espacenet系统中验证一下:


“Also Published As”给出了EP3499494A1、KR20190088001A、US2019172403A1、WO2019109564A1共4篇文献,而加上CN10840360A本尊,一共是5篇文献。

PSS系统4篇,Espacenet则显示5篇,差了哪一篇?对比了一下,发现是KR20190088001A。那就看看:


根据WIPO ST.9关于INID(专利文献著录项目代码)的规定,(30)表示优先权数据,明明白白优先权号是CN201711265201。所以PSS系统,这篇KR的文献怎么没有?是你给吃了吗?


例子3:公告号CN103001079B 小米科技有限责任公司
这篇文献还是关于小米手机的,是一篇关于SIM卡卡槽的发明。
首先我们在PSS系统中检索这篇文献,检索结果页显示有4个同族,然后点入同族文献信息页,同族文献信息页也是4条结果。


到Espacenet系统看一下,OK,也是3+1=4篇。


在I**ADOC系统中,则显示10篇同族,这就是扩展同族的强大了。


其实PSS的同族逻辑一直都是很迷的,不是简单同族,也不是扩展同族,好像加了一些人工干预,但是怎么干预的也没人说得清楚。


有的小伙伴要问了,为什么酱油君你非要举三个小米的例子呢?

不是非要,君就是随手检索了一下小米的专利,得到这三个例子,起码其中有两个例子,PSS的结果都不尽如人意。有一句话是说,如果你随随便便就在屋里看见了一只蟑螂,那可能这个屋子里其实已经到处是蟑螂了…emmm…君的意思,大家自行体会…

总体来说,PSS系统是一个检索结果页和同族文献信息页的数量可能对不上、同族文献信息页的数量也不一定对、在简单同族的基础上还可能缺失文献,以及上述三种情况出现概率较高的系统。这里君要手动微笑:


突然想起,2019年,马云爸爸在浙商大会上表示:不要把双十一看作是阿里的成功,其实对阿里巴巴来讲没多大意义,更多的是一个技术测试。双十一所需要的所有技术、设备,是十年以后整个中国科技、经济发展的一种基础设施。

PSS系统的数据、技术和设备,何尝不是十年以后中国科技、经济发展的一种基础设施呢?试问果汁局,您觉得基础设施这么个样,可还行?


来源 | 果汁焗酱油 公众号
作者 |
果汁焗酱油
编辑 | 木三
版权归原作者所有,转载请注明来源。
原创作者投稿请投递至邮箱tougao@mysipo.com或联系@木三。




分享

收藏

点赞

举报

评论列表

  • 第1楼
    厉害 满满干货。第一眼看成游戏机PS5

    2020/02/18 21:35 [来自江苏省]

    0 举报

快速回复