基于语义分析的短信犯罪识别方法、系统和可读存储介质

基本信息

申请号 CN201910798793.9 申请日 -
公开(公告)号 CN110633466A 公开(公告)日 2019-12-31
申请公布号 CN110633466A 申请公布日 2019-12-31
分类号 G06F17/27(2006.01); G06F16/35(2019.01); G06N3/04(2006.01); G06N3/08(2006.01) 分类 计算;推算;计数;
发明人 高磊; 肖安鹏 申请(专利权)人 深圳安巽科技有限公司
代理机构 深圳市恒程创新知识产权代理有限公司 代理人 深圳安巽科技有限公司
地址 518000 广东省深圳市福田区梅林街道梅都社区梅林路48号卓越梅林中心广场(南区)卓悦汇A1306
法律状态 -

摘要

摘要 本发明公开基于语义分析的短信犯罪识别方法、系统和可读存储介质,其中,短信犯罪识别方法包括:以文本概念为维,建立文本语义表示空间;根据所述文本语义表示空间,对输入的各种短信犯罪类型的样本短信数据进行机器学习,得到每种所述短信犯罪类型对应的语义特征和黑白样本;根据所述语义特征和黑白样本,研判真实短信数据是否为犯罪短信数据;若判定所述真实短信数据为犯罪短信数据,则输出研判结果信息。本发明的技术方案能解决现有技术中以字词为基本特征进行文本分类的方法在对短信内容进行分析时,难以真实重现短信文本信息,还原短信真实语义,进而难以准确识别短信犯罪的问题。