推荐位 推荐位

专利工作评价?看看deep seek怎么讲!

发布时间:2025.03.10 浙江省查看:253 评论:0

评价央企专利工作不能没数据胡说八道,给大模型准备好靠谱的数据是第一步。

央企集团中国发明专利授权后且维持有效的检索式:antype/央企 and ls/有效 and db/cnpat

检索得到数据后是进入分类器,右键点击空白处调出选择界面,选择大数据分析,弹出大数据分组界面,选择“标准申请人”,参数设置top20,选定数量后点击“确认”。

 

我们此次示例分析,选择了央企集团的前20,右键点击主节点“央企-有效-中国授权”进行“组合”操作,点击下图中组合窗口处的“生成”,系统自动生成excel表格。

excel表格就直接制造完成了:

事实上很多数据,列的编号编到了AL,行数一共是20个从发明保有量来计算的头部20名。

这样的数据很多,就类似的分析也做的挺多。人类来分析这些数据会怎么弄呢,分组呗,难道挨个去讲么?挨个讲的坏处就是你没有初始逻辑对不对,分组,把相关的数据扎堆放一起,比如质量的,技术的,这样分。我们这次换个口味,直接给AI,而且不做更多的限制性提示,就是比如告诉他你分个组什么的,就简单问,具体如下:

思考用时28秒,然后自动给分了五个层面,一个总结,我们觉得不仅仅是乍看起来是那么回事,而是确实也还行。我们拆开看一下,当然我们也不能纯偷懒,我们也会就着人工智能的给出对应部分属于我们自己的解释。

这个没毛病,简单,纯数数,说上两嘴也是不输给任何人类,当然也要看到一个问题,就是各位专利分析师,你们打算以后继续数数么?如果真的打算这样,以后你们最多也就是多找出几个数据分析的维度切片来数数了。

 

头部效应这里,人工智能是就数据说数据,前五占了前20的50%,当然啊,央企20名开外,就专利这件事确实也更没战斗力了,不是说人家企业不行,而是人家企业类型就不是玩儿专利的,不是一个领域自然不是一个逻辑,没啥好多说的。

 

另一个就是技术资源集中度这个表述,我们看到以后也犹豫了,专利数量能反应出来这个问题吗?!但是好像如果你思考哪些不整专利的央企,好像确实也是不负责技术,所以貌似也没毛病。

这个其实看出来一个问题,人工智能大模型训练时间和现实的时间差,小众的领域和内容,确实即便没有时间差,大模型也不是特别清楚它们的定义。比如质量度,是基于权利要求数量、独立权力要求1的特征度、独立权力要求数量等整体二次计算的一个指标,反应的是这份权利要求书的水平,可以看成是文本质量,也可以看成是后期法律层面的保护范围的评价指标。就数字看数字,大模型看的没错,整体弱就一个字,就中国移动、中国信息通信等少数领先,但是这地方deep seek写错了,出现了“中国宝武钢铁”数据没错,但是把一个倒数的放在领先组里夸,这个也是让我们觉得大模型现在你要是让它写东西,然后一眼不看就ctrl cv 貌似会出事的。

 

新颖度和技术壁垒,这个同理,我们欠大模型一个基础的解释,其实也好办,你问问题的时候说一嘴就行,或者等后期上传附件可以同时联网检索也行,再或者类似做一些知识库把相关信息告诉它,反正解决方案很多,也很简单。

这个与上面第2点同理,仔细看,大模型说的都没问题,挑数据也可以的,没有出现上面的那种感觉把举例子放错例子的问题。这里面你要说有问题也同样是我们的问题,就是没有把完整的定义告诉大模型。如果有完整定义,我们看人工智能目前这个看图说话的能力是不错的,而且别忘了他是看了一张大图,然后提炼了给你说,而且每个数据应该都是看了,所以它会讲类似整体国际化水平偏低这样的表达。

这里面我们发现大模型还是真实能思辨,它注意到被引用度整体弱,有一个中国信息通信高,觉得可能是异常,但是同时它也思考也许就是人家企业强呢,这个逻辑做数据分析真的是非常对的!

 

来吧,你们想要的数据excel找我们的客服,直接给你了。


分享

收藏

点赞

举报

评论列表

  • 暂无评论数据

快速回复


请输入正文
网络异常,请稍后重试
查询错误,刷新页面重试