一种论文新颖性分析方法、装置、介质和设备

基本信息

申请号 CN202111467467.3 申请日 -
公开(公告)号 CN114201962A 公开(公告)日 2022-03-18
申请公布号 CN114201962A 申请公布日 2022-03-18
分类号 G06F40/279(2020.01)I;G06F40/216(2020.01)I 分类 计算;推算;计数;
发明人 高曼;李海燕;童元元;刘扬;李彦文;姚克宇;张雨琪;徐俊 申请(专利权)人 中国中医科学院中医药信息研究所
代理机构 北京远创理想知识产权代理事务所(普通合伙) 代理人 卫安乐
地址 100700北京市东城区东直门内南小街16号
法律状态 -

摘要

摘要 本发明公开了一种论文新颖性分析方法,包括构建论文集的语料库,利用LDA主题模型将词语集合中的词语分为多个主题,得到第二主题集合;根据第二主题集合和语料库,得到论文集中每一篇论文属于第二主题集合中的每一个主题的概率和第二主题集合中每一个主题的新颖度,并根据论文集中每一篇论文属于第二主题集合中的每一个主题的概率和第二主题集合中每一个主题的新颖度,得到论文集中每一篇论文的新颖度。本发明梳理了论文新颖性评价的工作流程,并结合特殊算法,实现计算机自动化处理不仅辅助人工评价新颖性,减低主观因素带来的误差,而且大大提高了工作效率。本发明还公开了一种论文新颖性分析装置、介质和设备。