一种基于词向量句子链的文章论点论据自动检测划分方法

基本信息

申请号 CN202010753418.5 申请日 -
公开(公告)号 CN111898375A 公开(公告)日 2020-11-06
申请公布号 CN111898375A 申请公布日 2020-11-06
分类号 G06F40/284(2020.01)I 分类 计算;推算;计数;
发明人 张云;蔡博克;张京鹏;贲忠奇;冷若冰;阚野 申请(专利权)人 混沌时代(北京)教育科技有限公司
代理机构 北京鱼爪知识产权代理有限公司 代理人 混沌时代(北京)教育科技有限公司
地址 100088北京市海淀区北三环中路44号4号楼4层406
法律状态 -

摘要

摘要 本发明提出了一种基于词向量句子链的文章论点论据自动检测划分方法,涉及自然语言处理领域。一种基于词向量句子链的文章论点论据自动检测划分方法,包含:基于大量语料进行预训练,得到词向量模型,词向量模型为使用多组数据通过机器学习训练得到,其中,多组数据的每组均包含词语及标记词语的语义的词向量;获取文章,并将文章进行分词以分别提取每句的若干个词语,将若干个词语分别输入词向量模型以根据各词语确认词向量;获取问题,并根据问题提取若干个关键词,将若干个上述关键词分别输入词向量模型以根据各上述关键词确认词向向。本发明能够基于文章的问题查找文章中的论点和论据,并且解决人工去标注大量样本造成耗力的问题。