基于知识图谱对大量直播弹幕数据意图标注方法
基本信息
申请号 | CN202110651380.5 | 申请日 | - |
公开(公告)号 | CN113408252A | 公开(公告)日 | 2021-09-17 |
申请公布号 | CN113408252A | 申请公布日 | 2021-09-17 |
分类号 | G06F40/169(2020.01)I;G06F40/186(2020.01)I;G06F40/247(2020.01)I;G06F40/289(2020.01)I;G06F40/30(2020.01)I;G06F16/215(2019.01)I;G06F16/74(2019.01)I;G06F16/75(2019.01)I;G06F16/78(2019.01)I | 分类 | 计算;推算;计数; |
发明人 | 李抒雁;沙涛 | 申请(专利权)人 | 上海适享文化传播有限公司 |
代理机构 | 南京鼎傲知识产权代理事务所(普通合伙) | 代理人 | 刘蔼民 |
地址 | 200120上海市浦东新区成山路800号A座1106室 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了基于知识图谱对大量直播弹幕数据意图标注方法,包括如下步骤:S1、根据弹幕信息提取关键词并对关键词归纳维度;S2、扩建关键词同音同义词;S3、多个维度组合作为一个特定意图的模板;S4、弹幕数据去重,无效数据去除;S5、弹幕数据过模板抽取观点意图;S6、人工校排查去除错误数据,本发明结构科学合理,使用安全方便,本发明为快速标注直播弹幕数据意图,高效率标注文本意图,克服了数据量庞大人工效率低,传统NLP在弹幕分析中效果差等缺点,对于数据中的语义进行定义,从而便于弹幕数据去重,降低了工作量,适合更好的推广使用。 |
