1985-2024:大数据解读中国发明专利40年
发布时间:2024.07.30 浙江省查看:1041 评论:2
从中国专利正式颁布,距今刚好40年,今天使用全新大数据模组来一次时空解读,全面解析中国专利发展至今走过的历程,也用数据回应到底中国专利的症结在哪里?方向在何处?
数据的呈现,采用对比的方式,在同一图中同时展现对应年份的申请量以及当年申请且最终获得授权的授权量,请大家注意的是,这些数据均为发明专利申和发明专利授权,具体呈现如下:
第一部分:数量对比
首先非常直观的看蓝色部分的变化,即申请量的变化,确实是随着我国加入世贸组织后就开启了发明专利的快速增长,看对应的授权变化,似乎要平缓了很多,同时考虑到国知局的审查效率并不低,所以可能确实反映了授权环节是一个某种意义上的“关卡”,把一些不符合规定的专利申请就拒之门外了。当然具体还要往下看其它数据的反映。
第二部分:平均权利要求数量
不得不说这幅图展示出来了更多的信息,首先申请时刻平均权利要求数量的体现来自两个层次,一个是申请人自己努力,技术越复杂,可以去写的自然就多;另一个是代理人的平均水平,代理人本身水平高,自然会去主动为自己的客户撰写更多层次,但是“巧妇难为无米之炊”,技术本身拉跨,自然也不可能去创造太多的范围。
就申请的角度看,中国加入世贸的前后,我国专利的平均权利要求数量达到了历史巅峰。这个不难理解,因为当时来华申请专利的主力是跨国企业,而且不得不说这个似乎是老牌资本主义的黄金时代,他们的技术积累也是有的,自然会体现出这个状态来。
不过除此之外,上图还有两个能观察到的细节:
第一个是2015年左右的时候,发明申请的平均权利要求数量已经低于同期后期授权的专利的平均数值了,如果结合同时期的申请量来看,这个数据的背后逻辑是,当年申请已经到了一种疯狂的地步,完全的冲量不管不顾,所以申请时似乎已经不在乎撰写了,这反而让授权后的平均值能超越,大量的垃圾专利应该是倒在了实审阶段,对应的数据也就消失了,反而是优质一些的幸存者,尽管按常理同样是会被限制一部分范围,但是总体计算平均值的结果依然是反超了申请时的状态。
第二个是近几年的数据,首先看总体上的趋势都是授权相对于申请会有一定的损失(除了2015那几年),这个逻辑是正常的,因为实审的时候审查员会限制一部分主张,自然会损失。但是近几年的这个数据并不正常,因为看似申请时撰写的水平提高了,更多的平均权利要求数量出现了,但是授权的时候貌似缩水的程度要相对于整体更严重,大家可以观察蓝绿差,这种差距已经属于目视可见了。而且有一个非常有趣的现象就是时间越近,蓝绿差越大!这个背后的逻辑应该是快速申请这部分专利,也就是说越是短平快的申请并获得授权的专利,貌似其授权的专利文本质量越差。这里不是说审查员有什么问题,而是应该是申请人们为了达到这种结果似乎是不择手段,不顾一切。为了验证这一点,看下面的数据。
第三部分:权利要求1的保护范围(特征度)
平均主权项技术特征个数,小为佳,中国实用大为佳。
首先还是接续上一段进行观测,非常明显的是确实是有同样的问题存在,即最近几年看,时间越接近当前,蓝绿两种数据的差值越大,也就是申请与授权的差值逐渐增大,这背后的逻辑大概率还是会指向通过快速申请快速获权的这部分专利,至少这部分专利会在其中发挥相当的作用,因为近期年份的这种剪刀差是非常直观的。
除此之外,图中直观的看,申请时的特征度几乎是一条直线,特别是把时间拉长以后看,这背后恐怕代理机构发挥的作用更大一些。而授权后的保护范围显然是随着时间的推移变得越来越糟糕了,即体现在特征度越来越大这方面。
但是,终归文本的表达最多也就是能够反映这些专利的法律价值,专利的核心要体现在体现市场价值上,可以借助Patentics全新开发的一组经济价值指标来观测。
第四部分:市场化率
其定义为市场主体参与这个相关专利技术布局的百分比。
上图是市场化率,最高值是100,也就是100%,它代表市场主体的参与度,非市场主体主要涵盖大学、科研院所以及个人。
从图上看,至少三个特征非常明显:
1. 绝大多数情况下,授权专利明显要在市场化率这个指标上高于申请的专利,也就是授权的专利确实是市场主体们参与程度更多的,请注意,此时的统计并不是去简单的计数该年份中公司们拥有的申请和授权占比,而是具体统计计算到每一件专利,挖掘其相关技术的参与者的百分比,然后汇总统计的数值;
2. 在最近几年发生了非常反常的情况,即授权的专利的市场化率反而在降低,这个逻辑大概率是一些有竞争性的专利技术可能遇到了挑战,没有获得授权,而有相当数量的“编造”专利或者说是为了获得授权而不顾一切的“过时”技术,在授权时幸存了!当然,任何逻辑都要禁得住推敲,也不排除,这不是编造专利在作祟,而是很多大学院校的原创性专利在涌入,并且获得了授权,完全也可能是这个逻辑。具体是什么呢?!其实大家设计一个实验,选定一些视角完全可以把这件事情排查清楚,碍于篇幅今天不讲。
3. 这个指标同样会指出一个专利的黄金时代,也同样还是中国加入世贸的时间段,那个时间段的市场化率是非常高的。
其实数量,权利要求数量、权利要求1的特征度以及市场化率,它们的计算逻辑彼此根本没有关联,但是确实都能指向一个黄金时代,也都能指向一个近期几年的“奇怪”现象。这就是数据的互证能力!精彩还在继续。
第五部分:全球化率
表达外国主体在中国市场参与相关专利布局意愿的指数
非常惊人,峰值依然出现在中国加入世贸的时间段,这个不难理解;其次授权专利再一次体现出在全球化率上普遍高于同一年份的申请集合,当然,近几年的数据再一次成为了例外!
我们想这个问题确实比较严重了,背后的逻辑有这么几种可能:
1. 我们现在确实脱钩断链了,或者说是被,也就是外国主体都不来了;
2. 并非不来了,而是我们自己的占比太高了,灌水把外国主体的分量或者说是含量给冲淡了,但是请注意,我们的数据并非简单统计整体外国主体占比,而是基于每一件专利,锚定其相关技术集合进行外国主体占比计算,这样得出。
此时,我们马上会想到一个数据,即同族,这个数据结合上面的数据,也许能说明白一些事情。
第六部分:平均同族数量
果然,尽管同族和全球化率在计算逻辑上完全不同,同族本身是一个忠实记录数值,有就是有,没有就是没有,有多少就计数多少;而全球化率来自于单一专利相关技术集合的锚点计算。但是两者反映的趋势居然有相当的同现规律。同样的黄金年代,同样的脱钩断链。当然结合两者看,我们更多的认为这种下降的趋势应该是这样三个底层逻辑:
1. 有没有可能最大的影响是我国已经是全球第一生产加工制造业基地,相关专利就在我国企业手里产生;
2. 我国各类主体确实在大量产生专利,外国来华被淹没是必然的;
3. 我国很多专利主体确实专利意识还停留在初级阶段,不往海外走,或者说确实也是海外没有想过需求,这个也是客观的事实。
我们相信大部分读者看到这里已经目瞪口呆,因为你们重来没有见过大数据会有这么多种类,有这么强的解读能力,别着急,还有更厉害的,技术水平的考量模式或者说建议模式,你们想看吗!?
第七部分:技术壁垒
反映技术水平高低,数值越高代表技术水平越高
技术水平的测量是考虑跨越时间的测量,即不能认为2024年的光刻机就比1785年的蒸汽机厉害很多很多,考虑的是这个技术在当时的条件下,它产生的难易!跨越时间的公平比较。
除了早期的不稳定,后面几乎可以认为人类科技的攻坚克难能力是平稳的,是有差距,但是在一个宏观数据上体现出来差距不大。谁更厉害一些呢?还是那个黄金时代,即加入世贸的时间段上。宏观大数据是这样的,但是清华比北大可不是这样的,中石油比中石化也不是这样的,张三比李四更不是这样的。你们别着急,我们以后会给大家讲的。
好了,看到这里会明白人类至少在当前这40年来看,啃硬骨头开发技术的水平大致比较稳定,有高有低但是差距不是很大,这和大家的基本认知也应该是一致的。
但是呢,借此我们也额外看一个数值,看看它在评价专利技术水平上是多么的无力。
第八部分:被引用度
看到大数据你才能相信,被引用这个逻辑在专利里面非常的弱势。不排除单篇专利通过它的被引用数量来证明其是多么的被关注,多么的成功。但是这个并不普遍应用于专利时间,因为不像论文,专利领域,我国的专利制度对此并没有额外的要求和限制,因此也没有人会专门去做这个引用他人,也就无法形成有效的被引用。
被引用的局限性一个在于个案,另一个在于时间,它是一个发生了才能去读取的状态,因此是一个非常典型的“后验”类型的参数,其并非没有意义,但是更多的意义应该体现在为相关专利颁发“终身成就奖”这种事情上,而且还很有可能会漏掉很多“德艺双馨”的老艺术家们。
好了,今天的分享暂时到这里吧,大家先消化消化,新做的指标远不止今天介绍的市场化率、全球化率与技术壁垒。这才是三分之一都不到。会陆续为大家展示更多更惊人的数据真相,敬请期待!
评论列表
快速回复
专利检索与分析
[1]思博村村民
主题:317 回帖:330 积分:20
小付同学
2024/07/30 18:50 [来自安徽省]
0 举报kexincheng最棒
2024/07/31 09:23 [来自江苏省]
0 举报