一种网络商品信息抽取方法
基本信息
申请号 | CN201110363931.4 | 申请日 | - |
公开(公告)号 | CN102495847B | 公开(公告)日 | 2017-04-19 |
申请公布号 | CN102495847B | 申请公布日 | 2017-04-19 |
分类号 | G06F17/30(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 刘崟;吴浩苗 | 申请(专利权)人 | 浙江盘石信息技术股份有限公司 |
代理机构 | 杭州千克知识产权代理有限公司 | 代理人 | 赵芳;张瑜 |
地址 | 310011 浙江省杭州市拱墅区祥园路45号北部软件园C区盘石互联网广告大厦 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及一种网络商品信息抽取方法。本发明方法包括如下步骤:(1)、利用模板生成工具生成网络商品信息抽取的初始模板;(2)、应用所述初始模板对网站进行商品信息抽取。本发明采用一个模板生成工具,在信息抽取过程生成模板,并对模板进行处理和修正,属于半自动抽取,可从网页中准确快速的抽取并标注所需要的特定信息,例如商品名、商品图片URL、价格。本发明使工作更加直观,方便了相关操作,降低了差错率,提高了工作效率。 |
