机器学习在专利价值评估中的应用

2021-07-02 12:59张军锋杲雯张航宋喆欣赵阳
科学与财富 2021年8期
关键词:机器学习权重高校

张军锋 杲雯 张航 宋喆欣 赵阳

摘 要:我国高校每年都会申请的大批专利中有一部分难以转化,经济价值较低,对于这部分专利,高校可以考虑适当减少专利维护时间。目前对于专利的评价一般都是由相关专家在专利公布较长时间以后完成。在专利公布初期,难以评估该专利的价值。我们使用机器学习算法,根据已有专利数据,确定各个指标的权重,找出专利申请初期各项指标和最终价值之间的关系。依据此关系对新申请的专利进行评估,作为高校评判的辅助。

关键词:机器学习;高校;发明专利;专利价值;权重

党的十八大以来,我国知识产权事业取得显著成效,知识产权作为国家发展战略性资源和国际竞争力核心要素的作用更加凸显。专利作为知识产权的核心,受到了更多的重视,新时代下我们不仅要追求高数量的专利,也应该要追求高质量的专利。但是目前对于专利的评估几乎都是在专利已经申请较长时间后进行,并且是由专家进行,评估方法复杂,评估效率低下。亟需一种高效、准确的评估方法来对专利价值进行评估。

我们小组在此次研究中,聚焦于高校专利,只选取了其中的发明专利进行评估,对于外观设计和实用新型的专利没有进行考虑,因此我们的评估方法不是适用于全部专利,有一定的局限性。对于高校中的发明专利,经过我们不断地调整和测试,误差控制在百分之一以内。同时我们使用了获得中国专利奖中的部分数据作为最终测试集,因此我们的系统具有较高的可靠性。

在数据的初步清理中,我们和专利相关方面的专家以及指导教师沟通后,我们最终确定了对专利的评分标准:

确定了专利分数以后,我们选取了申请人数量,专利审查时长,专利实审时长,简单同族数量,权利要求数量,IPC个数六项指标。初始时,我们希望可以确定这六项指标对专利价值的贡献权重,即确定这六项指标和专利价值的一次关系。我们将各个指标的权重作为遗传算法中的“染色体”,将专利价值和计算出的专利价值作为适应度函数,采用实数编码,以模拟二进制交叉(SBX)作为交叉算子,使用均匀变异作为变异算子,对权重解空间进行了搜索。我们设置了初始种群为1000,在种群经过了一千代以后,最佳权重不再发生大的变动,因此将该权重认为是解空间中的最佳权重。但是该权重下的适应度函数依然较大,即预测的价值和实际之间的价值误差较大,达到百分之五十左右。基于上述操作,我们认为专利的六项指标和专利最终价值之间不符合一次关系。

我们这次的数据选取了专利的六项指标,数据较多,因此我们希望通过使用主成分分析法对数据进行降维。我们首先计算了数据是否适合进行主成分分析,计算结果如下。

可以看出,KMO统计量在0.5以上,并且Sig.<0.05,因此我们认为符合标准,可以进行主成分分析法降维。

在进行主成分分析时,我们选取了总体数据的百分之七十作为样本矩阵,对这些样本数据进行规范化处理得到规范会数据矩阵。依据这些规范化数据矩阵我们得到样本的相关矩阵;求出样本相关矩阵的六个特征值和特征向量。我们将方差贡献值确定在百分之八十,经过计算确定了五个样本主成分。因为样本协方差矩阵的的特征值和特征向量是總体协方差矩阵的特征值和特征向量的极大似然估计,所以在后面的计算中,我们使用这里求出来的五个特征向量进行计算主成分。

在求出数据的主成分以后,我们接下来使用了一种较为经典的神经网络算法,BP网络。为了适应我们选取的激活函数:sigmoid函数,我们将专利的分数都除以了100,作为期望输出。我们选取了六个指标,因此需要有五个输入,中间层我们设置了十五个神经元,输出层只有一个神经元。经过了两万次的训练,数据的误差在百分之一以内,是较为理想的结果,我们记录下了此时BP神经网络中各个参数的数值。接下来,我们使用这组参数数值去计算获得了中国专利奖的专利,这些专利都获得了较高的分数。因此我们认为,我们的这组参数数值是符合实际,且具有较高可靠性的。因参数数值过多,这里就不再进行展示。具体计算方法即为经典BP神经网络计算方法。下图为部分专利的预测分数与实际分数的对比

在获得了专利价值评估模型后,我们将该模型置于网络平台内,可以方便高校快速、便捷的了解到专利的价值,同时我们平台也加入了企业入驻的功能,让入驻企业可以快速了解到各个高校的科研情况,假哭专利转化。在此平台内,企业也可以将在日常生产中产生的技术难题发布,交由高校进行研究,促进我国向知识强国的转化。

我们此次的研究,将机器学习算法和专利文献进行结合,得到的结论在一定范围内具有较高的可靠性。可以作为高校决定缴纳多久专利维护费的辅助,帮助高校对专利的价值有一个提前的预知。帮助我国专利由高数量向高质量进行转变。

参考文献:

[1]周志华.机器学习[M]. 北京:清华大学出版社,2016.

[2] 李航.统计学习方法[M]. 北京:清华大学出版社,2019.

猜你喜欢
机器学习权重高校
权重常思“浮名轻”
为党督政勤履职 代民行权重担当
基于公约式权重的截短线性分组码盲识别方法
前缀字母为特征在维吾尔语文本情感分类中的研究
中日高校本科生导师制的比较
层次分析法权重的计算:基于Lingo的数学模型