基于文本内容特征相似度和主题相关程度比较的内容过滤器

基本信息

申请号 CN01131420.6 申请日 -
公开(公告)号 CN1403959A 公开(公告)日 2003-03-19
申请公布号 CN1403959A 申请公布日 2003-03-19
分类号 G06F17/21;G06F17/16 分类 计算;推算;计数;
发明人 肖航;高建忠;王江;诸光;王楠 申请(专利权)人 宁波乐知甬创科技服务有限公司
代理机构 北京同立伟业专利 代理人 联想(北京)有限公司;乐知新创(北京)咨询服务有限公司;宁波乐知甬创科技服务有限公司
地址 100085北京市海淀区上地信息产业基地创业路6号
法律状态 -

摘要

摘要 一种基于文本内容特征相似度和主题相关程度比较的内容过滤器,内容过滤器包括过滤端和训练端,过滤端和训练端物理分离设置,过滤端通过数据接口与训练端进行数据交互;通过对文本内容的分析和判断实现过滤;内容过滤器为一通用的而非对特定主题专用的过滤系统,过滤的内容可通过学习得到,为使用过滤器提供了灵活性;并且,过滤器根据已训练类的特征识别待过滤内容,其过滤处理速度快,安装方便。