一种基于AI的对象化属性文本自动分类方法及系统
基本信息
申请号 | CN202110295365.1 | 申请日 | - |
公开(公告)号 | CN112966111A | 公开(公告)日 | 2021-06-15 |
申请公布号 | CN112966111A | 申请公布日 | 2021-06-15 |
分类号 | G06F16/35(2019.01)I;G06F16/951(2019.01)I;G06F40/126(2020.01)I;G06K9/62(2006.01)I;G06N20/00(2019.01)I | 分类 | 计算;推算;计数; |
发明人 | 王建伟 | 申请(专利权)人 | 北京星汉博纳医药科技有限公司 |
代理机构 | 上海氦闪专利代理事务所(普通合伙) | 代理人 | 李明;袁媛 |
地址 | 101312北京市顺义区经济核心区安祥街10号306室 | ||
法律状态 | - |
摘要
摘要 | 本发明属于数据分析和数据挖掘技术领域,尤其是一种基于AI的对象化属性文本自动分类方法及系统,包括分类方法,所述分类方法的核心步骤如下:建立字符编码库,把历史做过入库的所有文本数据进行字符化分解,单个字符在库中做唯一数字编号,编号规则,使用整数做自增编号;标准属性数据预处理,提取已入库的标准数据,作为待训练数据,字符串长度限制为60个汉字字符,如:药品通用名、药品规格、药品生产企业、批准文号等,能清晰表达数据属性特征的字段。通过本发明可以快速判断一段数据描述的主体属性类别,然后判断属性类别是否与主体设计一致;另外,也可以通过对多个近邻数据进行属性分类判断,在网页中定位主体描述信息位置。 |
