专利工作评价？看看deep seek怎么讲！

发布时间：2025.03.10 浙江省查看：253 评论：0

评价央企专利工作不能没数据胡说八道，给大模型准备好靠谱的数据是第一步。

央企集团中国发明专利授权后且维持有效的检索式：antype/央企 and ls/有效 and db/cnpat

检索得到数据后是进入分类器，右键点击空白处调出选择界面，选择大数据分析，弹出大数据分组界面，选择“标准申请人”，参数设置top20，选定数量后点击“确认”。

我们此次示例分析，选择了央企集团的前20，右键点击主节点“央企-有效-中国授权”进行“组合”操作，点击下图中组合窗口处的“生成”，系统自动生成excel表格。

excel表格就直接制造完成了：

事实上很多数据，列的编号编到了AL，行数一共是20个从发明保有量来计算的头部20名。

这样的数据很多，就类似的分析也做的挺多。人类来分析这些数据会怎么弄呢，分组呗，难道挨个去讲么？挨个讲的坏处就是你没有初始逻辑对不对，分组，把相关的数据扎堆放一起，比如质量的，技术的，这样分。我们这次换个口味，直接给AI，而且不做更多的限制性提示，就是比如告诉他你分个组什么的，就简单问，具体如下：

思考用时28秒，然后自动给分了五个层面，一个总结，我们觉得不仅仅是乍看起来是那么回事，而是确实也还行。我们拆开看一下，当然我们也不能纯偷懒，我们也会就着人工智能的给出对应部分属于我们自己的解释。

这个没毛病，简单，纯数数，说上两嘴也是不输给任何人类，当然也要看到一个问题，就是各位专利分析师，你们打算以后继续数数么？如果真的打算这样，以后你们最多也就是多找出几个数据分析的维度切片来数数了。

头部效应这里，人工智能是就数据说数据，前五占了前20的50%，当然啊，央企20名开外，就专利这件事确实也更没战斗力了，不是说人家企业不行，而是人家企业类型就不是玩儿专利的，不是一个领域自然不是一个逻辑，没啥好多说的。

另一个就是技术资源集中度这个表述，我们看到以后也犹豫了，专利数量能反应出来这个问题吗？！但是好像如果你思考哪些不整专利的央企，好像确实也是不负责技术，所以貌似也没毛病。

这个其实看出来一个问题，人工智能大模型训练时间和现实的时间差，小众的领域和内容，确实即便没有时间差，大模型也不是特别清楚它们的定义。比如质量度，是基于权利要求数量、独立权力要求1的特征度、独立权力要求数量等整体二次计算的一个指标，反应的是这份权利要求书的水平，可以看成是文本质量，也可以看成是后期法律层面的保护范围的评价指标。就数字看数字，大模型看的没错，整体弱就一个字，就中国移动、中国信息通信等少数领先，但是这地方deep seek写错了，出现了“中国宝武钢铁”数据没错，但是把一个倒数的放在领先组里夸，这个也是让我们觉得大模型现在你要是让它写东西，然后一眼不看就ctrl cv 貌似会出事的。

新颖度和技术壁垒，这个同理，我们欠大模型一个基础的解释，其实也好办，你问问题的时候说一嘴就行，或者等后期上传附件可以同时联网检索也行，再或者类似做一些知识库把相关信息告诉它，反正解决方案很多，也很简单。

这个与上面第2点同理，仔细看，大模型说的都没问题，挑数据也可以的，没有出现上面的那种感觉把举例子放错例子的问题。这里面你要说有问题也同样是我们的问题，就是没有把完整的定义告诉大模型。如果有完整定义，我们看人工智能目前这个看图说话的能力是不错的，而且别忘了他是看了一张大图，然后提炼了给你说，而且每个数据应该都是看了，所以它会讲类似整体国际化水平偏低这样的表达。

这里面我们发现大模型还是真实能思辨，它注意到被引用度整体弱，有一个中国信息通信高，觉得可能是异常，但是同时它也思考也许就是人家企业强呢，这个逻辑做数据分析真的是非常对的！

来吧，你们想要的数据excel找我们的客服，直接给你了。

收藏
点赞
举报

评论列表

暂无评论数据

快速回复

请输入正文

专利检索与分析

[1]思博村村民

[浙江省]

主题：289 回帖：302 积分：20

TA最近发帖

热帖推荐