一种基于AI的对象化属性文本自动分类方法及系统

基本信息

申请号 CN202110295365.1 申请日 -
公开(公告)号 CN112966111A 公开(公告)日 2021-06-15
申请公布号 CN112966111A 申请公布日 2021-06-15
分类号 G06F16/35(2019.01)I;G06F16/951(2019.01)I;G06F40/126(2020.01)I;G06K9/62(2006.01)I;G06N20/00(2019.01)I 分类 计算;推算;计数;
发明人 王建伟 申请(专利权)人 北京星汉博纳医药科技有限公司
代理机构 上海氦闪专利代理事务所(普通合伙) 代理人 李明;袁媛
地址 101312北京市顺义区经济核心区安祥街10号306室
法律状态 -

摘要

摘要 本发明属于数据分析和数据挖掘技术领域,尤其是一种基于AI的对象化属性文本自动分类方法及系统,包括分类方法,所述分类方法的核心步骤如下:建立字符编码库,把历史做过入库的所有文本数据进行字符化分解,单个字符在库中做唯一数字编号,编号规则,使用整数做自增编号;标准属性数据预处理,提取已入库的标准数据,作为待训练数据,字符串长度限制为60个汉字字符,如:药品通用名、药品规格、药品生产企业、批准文号等,能清晰表达数据属性特征的字段。通过本发明可以快速判断一段数据描述的主体属性类别,然后判断属性类别是否与主体设计一致;另外,也可以通过对多个近邻数据进行属性分类判断,在网页中定位主体描述信息位置。