基于知识图谱对大量直播弹幕数据意图标注方法

基本信息

申请号 CN202110651380.5 申请日 -
公开(公告)号 CN113408252A 公开(公告)日 2021-09-17
申请公布号 CN113408252A 申请公布日 2021-09-17
分类号 G06F40/169(2020.01)I;G06F40/186(2020.01)I;G06F40/247(2020.01)I;G06F40/289(2020.01)I;G06F40/30(2020.01)I;G06F16/215(2019.01)I;G06F16/74(2019.01)I;G06F16/75(2019.01)I;G06F16/78(2019.01)I 分类 计算;推算;计数;
发明人 李抒雁;沙涛 申请(专利权)人 上海适享文化传播有限公司
代理机构 南京鼎傲知识产权代理事务所(普通合伙) 代理人 刘蔼民
地址 200120上海市浦东新区成山路800号A座1106室
法律状态 -

摘要

摘要 本发明公开了基于知识图谱对大量直播弹幕数据意图标注方法,包括如下步骤:S1、根据弹幕信息提取关键词并对关键词归纳维度;S2、扩建关键词同音同义词;S3、多个维度组合作为一个特定意图的模板;S4、弹幕数据去重,无效数据去除;S5、弹幕数据过模板抽取观点意图;S6、人工校排查去除错误数据,本发明结构科学合理,使用安全方便,本发明为快速标注直播弹幕数据意图,高效率标注文本意图,克服了数据量庞大人工效率低,传统NLP在弹幕分析中效果差等缺点,对于数据中的语义进行定义,从而便于弹幕数据去重,降低了工作量,适合更好的推广使用。