基于分词与多模匹配的房源标签自动提取装置及其方法

基本信息

申请号 CN201910070120.1 申请日 -
公开(公告)号 CN109739955A 公开(公告)日 2019-05-10
申请公布号 CN109739955A 申请公布日 2019-05-10
分类号 G06F16/33;G06F16/338;G06Q50/16 分类 计算;推算;计数;
发明人 张文战;杨丽娟;白峻峰;刘子曜;张凯 申请(专利权)人 诸葛启航(苏州)科技有限公司
代理机构 - 代理人 -
地址 100021 北京市朝阳区松榆东里37号楼1层104内110
法律状态 -

摘要

摘要 本发明涉及一种基于分词与多模匹配的房源标签自动提取装置及其方法,包括标签生成模块,用于发现房源描述词并生成标签库;标签放弃模块,用于对互斥的房源描述词进行放弃;分词模块,用于对标签库内的房源描述词进行分词;多模匹配模块,用于对输入的文本匹配出标签库中的多个目标词。本发明的优点是:方便购房者从冗长的房源描述中,提取出人们最关心的结构化特征,在比较醒目的地方展示,让购房者可以迅速了解,对比房源特色,判断是否对该房源敢兴趣。