加载中...
推荐位 推荐位

绝不是网上导出的excel,2分钟内生成15万个专利名称=。=

发布时间:2019.08.20 辽宁省查看:1779 评论:9

本帖最后由 fenrir 于 2019-8-23 09:30 编辑

跟教孩子学习的效率相比,那可不是提升了几倍的问题。。。。
实际上已经分分钟生成了好几十万个专利名称,可是附件大小有限制…………(这还只是B部的一小部分)

本次测试的目的:
筛选权利要求书中各部件在撰写过程中可能采用的全部动词,为后续搭建神经网络提供学习集。

具体过程:
1)通过jieba库从权利要求中筛出所有部件名称(即筛出名词,暂不考虑同义词的情况)(该步骤经过事先预处理,视频中不包括该步骤)
2)逐个提取各名词,并遍历全部权力要求,筛选出涉及该名词的短句,再从该短句中筛选出动词,按照附件格式进行存储。

数据自动筛选过程如下:


通过该程序筛出的数据(附件TXT截图):



运行视频中输入的1&5,是指IPC分类号对应的序号1~5,可任意修改。


这个是A01B的权力要求数据格式,一共是49160行,全部权利要求指的是A部和B部各小类的全部权利要求,大概有200个左右这样的文件








附件:


分享

收藏

点赞

举报

评论列表

  • 第1楼
    看不懂。。。

    2019/08/20 11:16 [来自北京市]

    0 举报
  • 第2楼

    一句话就是:从大海里捞了一堆针,并让这些针按照特定格式排列

    2019/08/20 11:27 [来自辽宁省]

    0 举报
  • 第3楼
    让程序写专利?

    2019/08/25 14:23 [来自广东省]

    0 举报
  • 第4楼

    理想结果是通过输入发明点和少部分现有技术关键词,直接生成专利全文。(没图)
    目前已经开发到:通过输入两个关键词,生成一个带有这两个关键词的短句,连接方式根据领域和专利名称自动生成。

    2019/08/26 10:18 [来自辽宁省]

    0 举报
  • 第5楼
    fenrir 发表于 2019-8-26 10:18
    理想结果是通过输入发明点和少部分现有技术关键词,直接生成专利全文。(没图)
    目前已经开发到:通过输 ...

        哈哈.挑战工人智能最前沿.    不过我觉得, 等科学家解决了机器对语义的理解再来研究这个会好点. 这个可不是简单的词汇组合排列对照下就行的问题.

    2019/08/26 11:44 [来自广东省]

    0 举报
  • 第6楼
    六海 发表于 2019-8-26 11:44
    哈哈.挑战工人智能最前沿.    不过我觉得, 等科学家解决了机器对语义的理解再来研究这个会好点. 这个 ...

    现在AI里有个单独的分支叫自然语言处理NLP,到是有不少可以借鉴的代码。
    怎么转化只能走哪算哪吧,生成些语义简单的短句现在的数据量足够,但如何根据有限的关键词联想出相关的内容。。。。。
    光这个功能不知道还需要储备多少数据,目前还没做到这,咱也不敢想

    2019/08/26 12:34 [来自辽宁省]

    0 举报

快速回复