漫谈人工智能与专利检索

发布时间：2019.01.09 北京市查看：1517 评论：1

来源 | 专利检索分析（ID：zhuanlijsfx）
作者 | 赵星

近来，关于人工智能的话题持续升温。一方面普罗大众对人工智能期待越来越高，要把人工智能推向神坛，另一方面，理性的专业人士则不断进行无可奈何的警告，认为人工智能远没有那么成熟。

在知识产权圈，关于人工智能也开始引发热议，包括从法律层面上，人工智能创造的作品的知识产权问题，以及在技术层面上，人工智能与法律或专利大数据结合如何来解决本行业的问题。

专利检索分析作为知识产权中与数据联系最紧密的领域，笔者认为是人工智能未来能发挥威力的重要领域。笔者曾在往期文章详细介绍过人工智能可能应用的场景（人工智能（AI）：或许是解救苦海中IPer的一味良药（上），人工智能（AI）：或许是解救苦海中IPer的一味良药（下））。

本期笔者再给各位漫谈一下关于人工智能的话题。

从“包子西施”说起

作为一个在北方生活的南方人，有一个习惯是早上要出去“过早”，而在老家的早点摊基本是“百米一岗”，极为方便。到了北方发现要找个早点摊真是一大难事，而且即便有，品种口味也不敢恭维。直到发现小区附近一家还算过得去早点摊，做的小笼包还勉强过得去，于是基本就成了过早的标配。

由于笔者对早点摊其他品种基本不感冒，每次过去就跟老板娘说一句话：“一屉小笼包，打包带走”。除了出差或节假日，基本风雨无阻，而这这位年轻的老板娘也确实勤劳，每天一大早都在此守候，从不缺勤。就这样过了一个月、两个月…，有一天，在我拿到包子以后，说今天的包子怎么有点泛黄？老板娘说是碱放太重了。于是之后老板娘就再也没有给我这种碱太重的包子。

就这样过了大约半年，某天，笔者在跟老板娘说了”一屉小笼包，打包带走”以后，在接到热腾腾的包子后，一下囧了：”老板，我今天忘带钱了”。“没事儿，明天再给也行！”老板娘笑容可掬，“嗯，那好的！”而我似乎也心安理得。似乎有种默认的强规则已经在我和老板娘之间建立了某种信任。随着时间继续流逝，就这样又持续了近一年。某天，我一走到早点铺，老板娘就主动问我，“一屉小笼包带走，是吧？”“嗯！”我现在只需要直接付款即可。

下面，我们把卖包子的老板娘假想成一个机器人，再解读一下哪些行为会涉及到人工智能的元素。首先，笔者经过日复一日的重复，实际上是给老板娘灌输了大量的训练数据，通过这些训练，老板娘学习到了其中蕴含的潜在规则：这个客人经常出现在工作日的早上，只对包子感兴趣，而且碱不要太重，要打包带走，而且肯定会付钱。而这就是机器学习中的监督学习原理。

基于这个规则，当偶尔发生与规则不相匹配的情形时，老板娘就能做出一定的预测并进行决策：这个客户信用良好，这次只是偶尔疏忽，明天肯定会付钱，没事的。同时，老板娘的眼睛实际上就也一个图像扫描器，经过大量的学习，当下次再见到这副面孔时，就能调用大脑里存储的数据，并自动匹配到这个规则，而提前做出预测：这位客人又来买包子啦！

因此，人工智能（主要是指机器学习分支）的核心在于能够通过大量的训练数据，挖掘出蕴含在其中的规则，来对当前发生的事件做出分类、预测或决策的过程，而这种行为似乎就像机器会思考了一样。虽然笔者认为卖包子的老板娘可以作为人工智能改造的对象，但确又不希望这样，这样就感受不到老板娘勤劳和热情洋溢的可贵品质。

自动化≠人工智能

目前很多利用传统计算机或数学理论实现的高度自动化与人工智能之间的界限对于不太懂计算机理论的普通人来说是模糊的，因为非专业人士已经无法理解计算机的复杂计算和逻辑，把这片未知的领域统统归到人工智能，并因此而认为人工智能已经达到能够代替人的程度，这是极富浪漫主义的观点。正因为此，很多人工智能领域的专家一再发声，真正的人工智能还远没有到来。

笔者对于计算机编程也略有涉猎，计算机最有魅力的地方在于能够将很多脏活苦活自动化。尤其是借助数学理论，通过计算机实现一定的算法，来对现实进行模拟，从而来辅助人类解决很多问题。对于编程思想中对于笔者颇有触动的是其中的面向对象编程思想，这种思想将现实社会中的某些实物进行模拟形成类，然后设定其属性和动作，通过一个个类对现实复杂系统的进行精密的模拟，从而实现高度的自动化。

除了计算机领域的编程思想的创新之外，随着硬件的发展带来的计算能力的突破，数学理论也进一步与计算机进行融合，大大增强计算机的算法水平。比如说，笔者以前学线性代数和概率论的时候，压根就不知道这玩意儿有什么用，基本是看老师，线性代数老师特漂亮，因此一路做前排，学的那个认真。而对概率论的老师则无感，就经常在后排晃荡。

而后来在关注文本处理和检索算法的时候才知道，这些数学理论是多么的重要。通过将一段段文本形成矩阵向量，对应到一个向量空间，通过计算两个文本向量的余弦值来计算两者的相似度，就能自动检索到与一段文本最为相似的文本，而这也是语义检索的最基础的理论。但这个看似很复杂高度自动化算法是否属于人工智能呢，笔者认为还不是，这仍然属于传统数学建模的方法，当然如果加入了训练集具备了自行决策或预测的算法另当别论。

因此，对于这种具有算法思想的高度自动化，普通非专业人员也会将其归为人工智能，因为确实超出了人脑的想象，显得很高大上，但是这种只是高度自动化而已，并不属于真正意义上的人工智能。

专利检索能否实现人工智能化

在回答这个问题之前，首先要明确两个基本问题：

1.专利检索不是纯粹的技术问题，而且也是法律层面的问题；

2.人工智能希望取代的做这个项工作“人”是谁，审查员、代理人、专业检索人员、企业IPR、研发人员还是律师？

对于第一个问题，专利检索的关键问题是获取最相关的文献，而核心问题还在于基于法律对这些相关文献的判断，是否影响新创性、是否成为无效证据、是否有侵权风险？人工智能可以在技术上协助尽量找到最相关的文献，但是对上述法律问题的判断是无能为力的，至少笔者是这样认为。

审查员的核心价值在于根据专利法的要求进行新颖性和创造性的判断，且不说各国的专利法不尽相同，单就创造性的判断本身就是极其复杂的智力劳动过程，在可预见的将来这是无可替代的。代理人的核心价值在于专利法律文本的形成、答复OA，虽然会涉及到专利查新，但是并不是主流工作，尤其是在审查员无法替代的情况下，代理人是不可能被机器替代的。再说企业IPR、研发人员和专利律师，只是在主流工作中会略微涉及专利检索，其智力活动更为复杂，就更不可能被替代了。

这样看来，对于所谓的专业检索咨询人员，似乎是最有可能被替代的。但是我们再回到第一个问题，专利检索不仅是一个技术问题，还是一个法律问题，专利检索人员作为一个知识产权领域的一个细分，要帮研发人员筛选专利并判断技术上的相关性；帮代理人进行专利申请前的查新检索，做出新颖性和创造性判断；帮企业IPR或律师进行无效检索自己侵权检索等。这些工作显然也不是机器能够替代的。

可见，人工智能对于专利检索的价值在于，能够借助计算机技术实现相关专利文件更为准确的查找，无疑能大大降低检索人员的工作强度，提升行业整体的平均水平和工作效率。尤其是对于不懂专利检索的人员来说，人工智能能够快速获得相对精确的相关文献，并给出建议性的结论，而更便于人来进行决策。

结语

人工智能更像是一个人类所共同追求的一个梦想，看似触手可及，实则遥不可及。而这并不能让人们放弃对梦想的追逐，想要调集人类所有的智慧去攻破。而在这个追逐的过程中，技术实现一次又一次革命，人类对世界的认知实现一次又一次的飞跃，或许这才是我们追求人工智能的真正意义。

地址 | https://mp.weixin.qq.com/s/WBymCGNeDMBT54cu-J017A

#本文不代表思博立场#

收藏(1)
点赞
举报

评论列表

wanderlust1973

第1楼

人工智能这个概念在几十年以前就已经出现，经过了几代的发展，现在所称人工智能实际是模式识别。十多年之前在电子工程系念信号与信息处理专业研究生的时候就知道本专业有一个分支叫模式识别。但是当时还没有将模式识别与高大上的人工智能联系在一起，所以当时这个小分支方向并不火爆。前不久有一位诺贝尔物理奖获得者宣称人工智能只是已有统计方法的改进。虽然存在反对意见，但模式识别确实是在概率与统计理论基础上的信息处理技术的新发展。本人同意原贴认为自动化≠人工智能的观点，以及“通过计算两个文本向量的余弦值来计算两者的相似度，就能自动检索到与一段文本最为相似的文本”，“这个看似很复杂高度自动化算法是否属于人工智能呢，笔者认为还不是”的看法。因为这种计算似乎没有利用到模式识别中的概率论方法，更没有涉及采用大量训练数据的进行学习的过程。要知道人工智能还有一个反应其重要特征的名称，机器学习（计算机系的专业分支名称）。通过输入大量训练数据，使得机器通过学习形成某种思维和判断模式。现有的人工智能由于采用机器学习或模式识别算法，需要使用大量数据对机器进行训练，而真正的人脑在学习对某些事物的识别与判断的过程中并不需要如此巨量的训练数据。从这种角度出发，现在的人工智能对人脑的模仿还很粗糙，还不够“智能化”。因此，人工智能未来的发展方向并不确定，也许下一代人工智能会离开甚至完全抛弃模式识别（机器学习）的方向。所以本人深度认同原贴的结语“人工智能更像是一个人类所共同追求的一个梦想，看似触手可及，实则遥不可及。而这并不能让人们放弃对梦想的追逐，想要调集人类所有的智慧去攻破。而在这个追逐的过程中，技术实现一次又一次革命，人类对世界的认知实现一次又一次的飞跃，或许这才是我们追求人工智能的真正意义。”

2019/01/16 17:06 [来自四川省]
1 举报

快速回复

AlexFincher

大版主

[未知属地]

主题：3790 回帖：4674 积分：21027

TA最近发帖

热帖推荐