一种国际贸易文件处理方法、系统以及一种服务器
基本信息
申请号 | CN201710564744.X | 申请日 | - |
公开(公告)号 | CN108170697A | 公开(公告)日 | 2018-06-15 |
申请公布号 | CN108170697A | 申请公布日 | 2018-06-15 |
分类号 | G06F17/30 | 分类 | 计算;推算;计数; |
发明人 | 俞洲;吴思琪 | 申请(专利权)人 | 信号旗智能科技(上海)有限公司 |
代理机构 | - | 代理人 | - |
地址 | 200942 上海市浦东新区宝山区蕰川路6号B区1075室 | ||
法律状态 | - |
摘要
摘要 | 本发明提供一种国际贸易文件处理方法、系统以及一种服务器,所述方法包括:对图像国际贸易文件和文档国际贸易文件进行分类;识别图像国际贸易文件并将识别后的图像国际贸易文件和文档国际贸易文件统一转换为XML文件;根据XML文件附带的文件特征对XML文件进行分类;对XML文件进行分析处理确定XML文件中结构化部分和非结构化部分;对非结构化部分中的内容进行边界判别,确定标题区域和内容区域;对结构化部分有线框则依据线框,无线框则进行自适应投影;利用最大熵模型进行命名实体识别、根据规则判断句尾和基于本体表格的关系数据抽取,并将国际贸易信息元素以结构体的形式存储。所以本发明可完成国际贸易文件的结构化存储。 |
