加载中...
推荐位 推荐位

评价方法探索——单向指标的评分

发布时间:2016.11.24 北京市查看:1419 评论:0

本帖最后由 bjzl 于 2016-11-24 22:51 编辑

评价方法探索——单向指标的评分




在探索如何评价专利撰写质量这个问题的过程中,我总结出了多项指标,这些指标都是跟专利撰写好坏存在关联关系的量化指标,因此最终可以用这些指标值来计算出一个综合评价值,用该值来量化专利撰写质量。

在想出这些指标后,曾经有一个问题比较困扰我,那就是怎么根据这些指标的值来计算出综合评价值?我想到,综合评价值应该用加权求和的方式进行计算,每项指标代表了专利撰写好坏的某一方面,如果能够根据每项指标的值给每项指标打个分出来,之后就可以根据各个方面的重要性对这些分数进行加权求和了。但是如何根据指标的实际值对每项指标打分呢?这个问题没有思考过的话还真是一下子给不出答案。

在我想到的这些指标中,很多指标都是“单向的”,所谓“单向”,就是指标值的大小与评价结论之间是一一对应关系,要么是指标值越大越好,要么是指标值越小越好。如何确定这些单向指标的评分公式是一个很关键的问题。

很显然,单向指标的评分问题并不是一个简单的线性计算问题,因为总会有一些指标值比较特别,大到“离谱”,或者小到“离谱”,但这样的样本所占的比例却很小。如果简单粗暴地用线性计算公式来打分,显然是不合适的,因为这样来算的话,那很可能大多数明明该得高分的指标值却得到很低的分数。

我想到,既然“评分是否合理”是受到指标值的分布情况影响的,那么何不利用“指标值的分布情况”来确定评分呢,于是这个问题就变得豁然开朗了。

假定某项单向指标的样本有10000个,也就是有10000个指标值,那么通过比较,可以确定出这项指标在这些样本中的上下限,即max和min。由于是“单向指标”,那么max和min必定是一个代表“最好”,一个代表“最差”的,假设“最好”用100来代表,“最差”用0来代表。那么对于一个中间值mid,评分应该是大于0而小于100的,具体是多少呢?

由于知道所有10000个指标值的大小,通过比较和统计,就可以知道小于mid的指标值有多少个,大于mid的指标值有多少个,这样就知道了mid这个值在这些样本中的“地位”,mid所超过的指标值个数在这10000个样本中所占的比例就代表着mid的“地位”,这个“地位”正是我们确定分数是不是“合理”的关键。假设mid超过了0%的指标值,那给它0分,假设mid超过了100%的指标值,那给它100分,假设mid超过了x%的指标值,那给它x分,于是这个评分公式就出来了,它与指标值之间不是线性关系,但跟“指标值的分布情况”是相关的。

回过头来看那些“离谱”的指标值,由于它们很小众,在样本中所占的比重很低,因此这些“离谱”的指标值得到的分数与距离它较远的指标值得到的分数其实是差不多的。好比10000个样本中9999个样本的指标值都在1至10之间,但有一个样本的指标值是1000,由于这个样本很“离谱”,指标值超过10的样本的占比和指标值超过1000的样本的占比,两者差值微乎其微,这样即使指标值1000远大于指标值10,得到的评分也和指标值为10时几乎相等。

利用多项单向指标来综合评价某个问题,应该可以用在很多方面。

这里再“理工科思维”一点。假如“嫁高富帅是人生目标”,理想是嫁给“最高最富最帅”的男士,有“大批量”的男士,在“高”、“富”、“帅”三个层面上,每位男士的条件都不相同。比如这位男士身高一米五,富可敌国,颜值堪忧,那位男士身高两米,只有自行车,长相英俊。。。。你要从这“大批量”的男士中选择人来嫁,你嫁谁?

假设有1000位男士,你手里有每位男士的身高值数据、每位男士的财富值数据、每位男士的颜值数据,你就可以设计出一套评分方法,算出来哪位男士最该嫁。1000个身高值,你可以用前面说的评分方法给每个身高值打分,类似地,1000个财富值和颜值都可以得出对应的分数。根据“高”、“富”、“帅”三个层面的重要性,你可以确定出它们各自的权重,最后对三个层面进行加权求和,就可以算出每位男士的“该嫁指数”。(捂嘴,玩笑是不是开大了)



分享

收藏

点赞

举报

评论列表

  • 暂无评论数据

快速回复