绝不是网上导出的excel,2分钟内生成15万个专利名称=。=
发布时间:2019.08.20 辽宁省查看:1779 评论:9
跟教孩子学习的效率相比,那可不是提升了几倍的问题。。。。
实际上已经分分钟生成了好几十万个专利名称,可是附件大小有限制…………(这还只是B部的一小部分)
本次测试的目的:
筛选权利要求书中各部件在撰写过程中可能采用的全部动词,为后续搭建神经网络提供学习集。
具体过程:
1)通过jieba库从权利要求中筛出所有部件名称(即筛出名词,暂不考虑同义词的情况)(该步骤经过事先预处理,视频中不包括该步骤)
2)逐个提取各名词,并遍历全部权力要求,筛选出涉及该名词的短句,再从该短句中筛选出动词,按照附件格式进行存储。
数据自动筛选过程如下:
通过该程序筛出的数据(附件TXT截图):
运行视频中输入的1&5,是指IPC分类号对应的序号1~5,可任意修改。
这个是A01B的权力要求数据格式,一共是49160行,全部权利要求指的是A部和B部各小类的全部权利要求,大概有200个左右这样的文件
附件:
- 专利名称test.txt 下载
评论列表
快速回复
阿尔法度
[7]思博铁粉
主题:151 回帖:1112 积分:6004
热帖推荐
爱吃海苔的小助手
2019/08/20 11:16 [来自北京市]
0 举报fenrir
一句话就是:从大海里捞了一堆针,并让这些针按照特定格式排列
2019/08/20 11:27 [来自辽宁省]
0 举报六海
2019/08/25 14:23 [来自广东省]
0 举报fenrir
理想结果是通过输入发明点和少部分现有技术关键词,直接生成专利全文。(没图)
目前已经开发到:通过输入两个关键词,生成一个带有这两个关键词的短句,连接方式根据领域和专利名称自动生成。
2019/08/26 10:18 [来自辽宁省]
0 举报六海
哈哈.挑战工人智能最前沿. 不过我觉得, 等科学家解决了机器对语义的理解再来研究这个会好点. 这个可不是简单的词汇组合排列对照下就行的问题.
2019/08/26 11:44 [来自广东省]
0 举报fenrir
现在AI里有个单独的分支叫自然语言处理NLP,到是有不少可以借鉴的代码。
怎么转化只能走哪算哪吧,生成些语义简单的短句现在的数据量足够,但如何根据有限的关键词联想出相关的内容。。。。。
光这个功能不知道还需要储备多少数据,目前还没做到这,咱也不敢想
2019/08/26 12:34 [来自辽宁省]
0 举报