一种网络商品信息抽取方法

基本信息

申请号 CN201110363931.4 申请日 -
公开(公告)号 CN102495847B 公开(公告)日 2017-04-19
申请公布号 CN102495847B 申请公布日 2017-04-19
分类号 G06F17/30(2006.01)I 分类 计算;推算;计数;
发明人 刘崟;吴浩苗 申请(专利权)人 浙江盘石信息技术股份有限公司
代理机构 杭州千克知识产权代理有限公司 代理人 赵芳;张瑜
地址 310011 浙江省杭州市拱墅区祥园路45号北部软件园C区盘石互联网广告大厦
法律状态 -

摘要

摘要 本发明涉及一种网络商品信息抽取方法。本发明方法包括如下步骤:(1)、利用模板生成工具生成网络商品信息抽取的初始模板;(2)、应用所述初始模板对网站进行商品信息抽取。本发明采用一个模板生成工具,在信息抽取过程生成模板,并对模板进行处理和修正,属于半自动抽取,可从网页中准确快速的抽取并标注所需要的特定信息,例如商品名、商品图片URL、价格。本发明使工作更加直观,方便了相关操作,降低了差错率,提高了工作效率。