一种字符串的替换处理方法及装置

基本信息

申请号 CN201911399583.9 申请日 -
公开(公告)号 CN111159978A 公开(公告)日 2020-05-15
申请公布号 CN111159978A 申请公布日 2020-05-15
分类号 G06F40/126;G06F16/33 分类 计算;推算;计数;
发明人 董婉;刘宁;申亚男;胡茜;王静;吴志超 申请(专利权)人 北京爱医生智慧医疗科技有限公司
代理机构 北京路浩知识产权代理有限公司 代理人 杨明月
地址 102206 北京市昌平区科技园区生命园路9号院1号楼205室
法律状态 -

摘要

摘要 本发明实施例公开了一种字符串的替换处理方法及装置,方法包括:分别对第一数据库和第二数据库中的字符串进行序列标注,以将字符串表示成由各个词项构成的序列,得到第一集合和第二集合;根据序列标注结果,比较第一集合和第二集合;根据第一集合和第二集合之间的包含关系,对字符串进行替换。本发明实施例通过第一数据库中的字符串与第二数据库中的字符串之间的替换,避免了因第一数据库中的字符串与第二数据库中的字符串不一致导致无法自动地正确评估两个字符串是否表示同一个实体;直接使用字符串相似度无法利用语义信息,将字符串进行序列标注得到由各个词项构成的序列后再进行替换,更好的利用了语义层次的信息;方便做进一步地统计分析。