一种新的工程机械租赁场景网页文本关键内容提取方法

基本信息

申请号 CN202010344614.7 申请日 -
公开(公告)号 CN111538829B 公开(公告)日 2021-04-20
申请公布号 CN111538829B 申请公布日 2021-04-20
分类号 G06F40/284(2020.01)I;G06F16/951(2019.01)I;G06N3/08(2006.01)I;G06F16/34(2019.01)I;G06N3/04(2006.01)I;G06F16/958(2019.01)I 分类 计算;推算;计数;
发明人 杨婷婷;王艺;郑龙 申请(专利权)人 众能联合数字技术有限公司
代理机构 南京众联专利代理有限公司 代理人 刘趁新
地址 210000江苏省南京市雨花台区宁双路19号6号楼易司拓大厦6楼及701室
法律状态 -

摘要

摘要 本发明提出了一种新的工程机械租赁场景网页文本关键内容提取方法,能够不需要根据HTML标签解析不同网页的内容,利用YEDA中文文本标注工具标注出网页中的机构名,地名,日期,货币,数字,工程名,工程内容,工程范围,工程规模,所属工程行业,工程施工阶段等信息,将标注好的数据输入到基于局部软注意力机制的深度网络模型中,在深度网络模型中以LSTM作为基础网络,同时在单词级别,短语级别使用全局注意力机制,在句子级别使用局部注意力机制,从而使得提取的网页关键性摘要信息可以让人不用大量的阅览网页,快速获取与工程租赁场景相关的感兴趣内容。