当我们聊专利与大数据时聊什么
发布时间:2014.07.22 北京市查看:3161 评论:17
大数据虽在在去年得到空前的关注,但是这种关注除去跟风和鼓吹之外还有多少实质的内容,《纸牌屋》的案例被重复多遍,主动寄送计生用品的案例早已说烂,但是有多少真正是大数据,对大数据还有迷信的人不妨去看看这两篇文章:《为什么说影视业里的大数据应用,多半是个噱头》,同样是跨行业,看看别人如何看待大数据的真与虚。
大数据不是大的数据
我理解中对于数据的分类大致可以分成这样两种,结构化数据和非结构化数据,大数据关注的是非结构化数据。
对于专利而言,著录权项数据应该算得上结构化数据,对这种结构化数据的分析是目前专利分析的主要组成部分,不过大家也都清楚,专利分析最值钱的是对专利内容、以及将专利同产业结合到一起的分析,这种分析面对的是非结构化的数据。当下我们的专利分析中,通过标引将专利内容这种非结构数据转化成结构数据绘制的各种专利地图都已经站在了专利分析的顶端。
其实对于大数据而言,最大的问题不是量的不足,而是理解的不足,是数据处理的不足,没有做到这点,仅仅把数据做大,对于分析工作而言也是 金山在前却无工具。
大数据内涵与工具
大数据内涵更多的在于如何从小样品跨到全样本,如何跨,要不要跨,跨过去有没有价值,才是观念转变的重点
如果大数据的观念仅停留在大上,谈到大只想到单机、硬盘,这种纯技术领域,那下一步是不是要聊聊各种云服务器平台和各种数据库架构上。
Access SAS,SPSS、R语言这些数据处理工具和大数据关联不大,只是统计学专业最基本的几个软件工具,难道当专利分析遇到大数据就是要分析人员去学诸如K-means这样的大数据处理算法吗?
专业人做专业的事
对于专利分析而言,大数据似乎在未来肯定将是得力的助手,本领域人员只要能够真正了解专利分析的全部,知道如何使用大数据,开发的活完全可以交给专业的人去做。当下传统的专利分析尚未找到自己真正的持续的被广泛认可的市场定位,专利分析人员更应该关注的是如何找到自身的价值。
说句实话,写文章的有多少人知道大数据处理到底是怎么一回事,相应的懂大数据处理的又有几个人知道具体应用是什么东西,
专业的事情让专业的人做。作为行业人事面对大数据,我们只要知道大数据可以干什么,我们要考虑的是我们可以用大数据干什么,至于大数据到底怎么处理,纵使专业人员告诉我们估计也没有几人能听懂。
不要去谈大数据的基本概念
数据产生的目的性、数据格式的限定性是否会影响数据分析,答案是肯定的。
在分析角度上,当我们把专利看成一件两件的数字时,这种影响就会更加明显,但是当我们把专利看成一个个技术点的披露时,这种影响或许没有多少。即便当下,专利分析的切入角度已经无比丰富,如果再结合非专利数据,专利分析的角度更是五花八门。
专利文件的数据处理,或许会遇到法律文件带来的桎梏,但是总觉得结构化数据比非结构化数据处理起来可能更为容易,完整的全样本的结构化数据对大数据而言是极好的,不过这又是大数据处理本身的问题而不是大数据应用的问题,我不懂。
关于专利分析的时效性问题,如果没有时效的数据,再多样的先进的动态的处理便没有意义,但是回过头来看,如果借助大数据都不可以弥补时效性的问题,那当下的专利分析是如何解决这个问题呢,还是那就话,作为大数据的应用者,我们应该将注意力集中在自己的领域,用大数据这个工具提升自己的工作
对于用户信息要慎重
如果类比购物大数据,专利分析平台记录和分析用户的检索、分析行为,这样实在不妥。 在我接触专利分析的第一次培训课上,讲课老师就提及国内专利分析问题的时候就说过,当下国内保密单位对于信息情报最为重视,中国信息情报业的发展也源于其推动,他们在采购情报工具时一般都要求是本地版,为什么?
“我的研发动向,我可以知道,你不能知道”,这一点是无论怎样都不会让步的底线。对于普通企业而言估计也是如此,除非我的信息能够给我带来不可替代的好处。当下和未来,单单专利分析估计都没有这种这种吸引力
大数据问题很多时候都涉及到个人信息安全的边界问题,涉及到个体与群体、人与社会这个宏观的哲学论题。昨晚刚看过德普新片《超验骇客》,到今天还沉浸在诺兰宏达的主题之中……对于价值千金的用户数据一定要慎之又慎。
--------------
微博网友精彩评论:
@专利矿工: 看了这么多吐槽大数据的,哥也说两句,大数据的核心在于据,据数以致知。就数据量而言,专利数据根本扯不上大,所以专利大数据不能从数据量理解,其本质在于还是在于数据分析进而决策,只不过分析角度、手段、工具等发生变化了。 (7月19日 10:15)
@晏阳智财-IPsolar:吐槽半天,论调都偏灰暗,德温特的关键词共现不算大数据应用么?大家总是引用的等高图不算么?专利大数据,是先于现在热炒的互联网大数据的。任何行为都是有规律的,关键在于发现规律性,并呈现出来。数据量大小只是样本数量而已,非根本因素。
@北郊老林:有人通过专利分析得到过令人信服的有价值的信息吗?求案例!我倒是想过通过专利分析获得一些信息,作为投资科技类股票(不是**)的一个参考(仅仅是参考),但不知道是否可行,未有论证。
作者:天天4479
来自:优智博知识产权
大数据不是大的数据
我理解中对于数据的分类大致可以分成这样两种,结构化数据和非结构化数据,大数据关注的是非结构化数据。
对于专利而言,著录权项数据应该算得上结构化数据,对这种结构化数据的分析是目前专利分析的主要组成部分,不过大家也都清楚,专利分析最值钱的是对专利内容、以及将专利同产业结合到一起的分析,这种分析面对的是非结构化的数据。当下我们的专利分析中,通过标引将专利内容这种非结构数据转化成结构数据绘制的各种专利地图都已经站在了专利分析的顶端。
其实对于大数据而言,最大的问题不是量的不足,而是理解的不足,是数据处理的不足,没有做到这点,仅仅把数据做大,对于分析工作而言也是 金山在前却无工具。
大数据内涵与工具
大数据内涵更多的在于如何从小样品跨到全样本,如何跨,要不要跨,跨过去有没有价值,才是观念转变的重点
如果大数据的观念仅停留在大上,谈到大只想到单机、硬盘,这种纯技术领域,那下一步是不是要聊聊各种云服务器平台和各种数据库架构上。
Access SAS,SPSS、R语言这些数据处理工具和大数据关联不大,只是统计学专业最基本的几个软件工具,难道当专利分析遇到大数据就是要分析人员去学诸如K-means这样的大数据处理算法吗?
专业人做专业的事
对于专利分析而言,大数据似乎在未来肯定将是得力的助手,本领域人员只要能够真正了解专利分析的全部,知道如何使用大数据,开发的活完全可以交给专业的人去做。当下传统的专利分析尚未找到自己真正的持续的被广泛认可的市场定位,专利分析人员更应该关注的是如何找到自身的价值。
说句实话,写文章的有多少人知道大数据处理到底是怎么一回事,相应的懂大数据处理的又有几个人知道具体应用是什么东西,
专业的事情让专业的人做。作为行业人事面对大数据,我们只要知道大数据可以干什么,我们要考虑的是我们可以用大数据干什么,至于大数据到底怎么处理,纵使专业人员告诉我们估计也没有几人能听懂。
不要去谈大数据的基本概念
数据产生的目的性、数据格式的限定性是否会影响数据分析,答案是肯定的。
在分析角度上,当我们把专利看成一件两件的数字时,这种影响就会更加明显,但是当我们把专利看成一个个技术点的披露时,这种影响或许没有多少。即便当下,专利分析的切入角度已经无比丰富,如果再结合非专利数据,专利分析的角度更是五花八门。
专利文件的数据处理,或许会遇到法律文件带来的桎梏,但是总觉得结构化数据比非结构化数据处理起来可能更为容易,完整的全样本的结构化数据对大数据而言是极好的,不过这又是大数据处理本身的问题而不是大数据应用的问题,我不懂。
关于专利分析的时效性问题,如果没有时效的数据,再多样的先进的动态的处理便没有意义,但是回过头来看,如果借助大数据都不可以弥补时效性的问题,那当下的专利分析是如何解决这个问题呢,还是那就话,作为大数据的应用者,我们应该将注意力集中在自己的领域,用大数据这个工具提升自己的工作
对于用户信息要慎重
如果类比购物大数据,专利分析平台记录和分析用户的检索、分析行为,这样实在不妥。 在我接触专利分析的第一次培训课上,讲课老师就提及国内专利分析问题的时候就说过,当下国内保密单位对于信息情报最为重视,中国信息情报业的发展也源于其推动,他们在采购情报工具时一般都要求是本地版,为什么?
“我的研发动向,我可以知道,你不能知道”,这一点是无论怎样都不会让步的底线。对于普通企业而言估计也是如此,除非我的信息能够给我带来不可替代的好处。当下和未来,单单专利分析估计都没有这种这种吸引力
大数据问题很多时候都涉及到个人信息安全的边界问题,涉及到个体与群体、人与社会这个宏观的哲学论题。昨晚刚看过德普新片《超验骇客》,到今天还沉浸在诺兰宏达的主题之中……对于价值千金的用户数据一定要慎之又慎。
--------------
微博网友精彩评论:
@专利矿工: 看了这么多吐槽大数据的,哥也说两句,大数据的核心在于据,据数以致知。就数据量而言,专利数据根本扯不上大,所以专利大数据不能从数据量理解,其本质在于还是在于数据分析进而决策,只不过分析角度、手段、工具等发生变化了。 (7月19日 10:15)
@晏阳智财-IPsolar:吐槽半天,论调都偏灰暗,德温特的关键词共现不算大数据应用么?大家总是引用的等高图不算么?专利大数据,是先于现在热炒的互联网大数据的。任何行为都是有规律的,关键在于发现规律性,并呈现出来。数据量大小只是样本数量而已,非根本因素。
@北郊老林:有人通过专利分析得到过令人信服的有价值的信息吗?求案例!我倒是想过通过专利分析获得一些信息,作为投资科技类股票(不是**)的一个参考(仅仅是参考),但不知道是否可行,未有论证。
作者:天天4479
来自:优智博知识产权
评论列表
快速回复
AlexFincher
大版主
[未知属地]
主题:3790 回帖:4674 积分:21127
热帖推荐
HIKVISION
2014/07/22 16:21 [来自浙江省]
0 举报kim-possible
2014/07/22 16:27 [来自北京市]
0 举报白龙马
2014/07/22 22:20 [来自北京市]
0 举报shirley6277
2014/07/23 08:35 [来自山东省]
0 举报与猪共舞
2014/07/23 09:09 [来自山东省]
0 举报与猪共舞
2014/07/23 09:09 [来自山东省]
0 举报