一种领域迁移学习的实体识别方法、系统和设备
基本信息
申请号 | CN202110740275.9 | 申请日 | - |
公开(公告)号 | CN113191153A | 公开(公告)日 | 2021-07-30 |
申请公布号 | CN113191153A | 申请公布日 | 2021-07-30 |
分类号 | G06F40/295(2020.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06N20/00(2019.01)I | 分类 | 计算;推算;计数; |
发明人 | 韩瑞峰;杨红飞;金霞;程东 | 申请(专利权)人 | 杭州费尔斯通科技有限公司 |
代理机构 | 杭州创智卓英知识产权代理事务所(普通合伙) | 代理人 | 张超 |
地址 | 310000浙江省杭州市滨江区西兴街道阡陌路482号B楼第七层 | ||
法律状态 | - |
摘要
摘要 | 本申请涉及一种领域迁移学习的实体识别方法、系统和设备,其中,该方法包括:用训练好的序列标注模型提取源语料和目标语料中实体的文本特征,建立训练样本,对训练样本的文本特征分别进行主成分分析,得到源域特征空间和目标域特征空间,进而计算得到测地线流核函数,通过测地线流核函数将语料进行映射,得到新的特征空间,根据新的特征空间对分类模型进行训练,用训练好的分类模型对无标注的目标语料进行实体识别。通过本申请,解决了实体识别中对标注样本依赖性强和开发效率低的问题,实现了在特征空间上重新映射的领域适应方法,将在映射后的特征空间上训练的分类模型直接应用在无标注的目标语料上,达到了迁移学习的技术效果。 |
