行业解决方案:OCR应用场景:华为海关单据识别

优采云 发布时间: 2020-09-02 06:16

  OCR应用场景: 华为海关文件识别

  [用户故事]华为海关文件识别服务

  业务背景

  目前,华为有4个主要的海外供应中心. 全世界大约有35w的海关申报单(其中,中国*敏*感*词*5w,出口15w,香港进出口10w,其他子公司5w). 当前的文档处理方法仍然是手动将文档内容手动输入到系统中. 除效率低外,人工录入方式还存在因员工疏忽或疲劳造成的误操作. 如何快速,准确地处理如此大量的文档已成为供应链的主要需求.

  1. 问题描述

  海关申报文件是一种相对常见的文件类型. 它是指需要在进出口海关描述货物的报关单. 通常,各国海关部门将提供扫描图像. 每个公司获取扫描的副本后,需要将其存储在仓库中.

  图1-1海关文件示例视图

  

  随着近年来深度学习的发展,文本识别算法的性能也得到了极大的提高. 海关文件识别是文本识别的重要应用场景. 它指的是通过机器学习和图像识别技术自动实现的文档内容采集,而不是手动输入处理. 但是,与普通文本识别相比,海关文件识别主要存在以下困难:

  l*敏*感*词*图像质量差: 海关申报的扫描*敏*感*词*图像质量通常很差,包括许多干扰的虚线,倾斜,暗光,曝光,扭曲和许多杂点.

  2较高的识别精度要求: 由于涉及公司产品的出口,因此业务部门要求对文档的关键数字部分(例如税率和金额)具有100%的识别精度.

  3收据的内容很复杂: 收据中有很多不清楚的中文,小数点,相似的英语数字,特殊符号和连词. 很难识别,容易遗漏或误认.

  4多种文档模板: 不同国家的文档模板不一致. 例如,巴西的海关完全是文本格式,而不是普通格式的文档,这在文本检测和定位阶段会造成困难.

  第二,业务目标

  针对上述业务背景和业务问题,华为供应链推出了华为海关单据识别服务,以实现海关单据的自动识别并替代人工输入. 完成以下业务目标:

  对于排名前10的国家(例如英语,法语和*敏*感*词*语等拉丁美洲国家),每年的文档量约为50,000. 通过文档识别服务实现:

  1. 采集历史*敏*感*词*申报数据,新数据资产.

  2. 采集业务申报数据将在系统中自动分配,而不是手动输入.

  对于深圳在中国的POD供应,每年的文件量约为50万,而深圳国际POD的供应量约为每年13万. 通过文档识别服务实现:

  1. 识别和组织与审核相关的元素.

  2. 根据合同的不同类型,可以设置审核元素并自动确定审核结果.

  接下来,我们将使用华为海关文件识别服务演示来演示在华为供应链中自动识别海关申报文件的解决方案.

  三,解决方法

  本章将演示如何使用华为海关文件识别服务演示来实现海关申报文件的自动识别.

  操作步骤

  第1步,获取海关文件识别服务的演示.

  在以下地址获取演示压缩包: .

  第2步,将Demo项目导入Eclipse.

  1. 下载并打开Eclipse软件. 确保已使用正确的JRE路径配置“ Windows> Preferences> Java> InstalledJRE”.

  2. 右键单击左侧的“程序包资源管理器”页面,单击“导入”,选择“常规>将项目退出到工作区”,单击“下一步”,单击“浏览”,然后选择ais-sdk-demo本地位置.

  3. 单击完成,导入演示,导入后打开项目,项目目录如下:

  图2-1项目目录

  

  第3步获得AK / SK认证.

  登录HUAWEI CLOUD控制台,在“用户中心”页面上,“单击帐户管理->基本信息->管理我的凭据”,在“我的凭据”页面上,单击“管理访问密钥”“标签,添加访问密钥并下载身份验证帐户的AK / SK.

  步骤4修改代码文件中的AK / SK.

  修改ClientContextUtils.java文件,并将其替换为获取的AK / SK值,如图2-2所示.

  图2-2修改AK / SK代码

  

  步骤5修改要在代码中识别的海关文件图片的路径.

  根据本地图像或使用Demo的默认图像存储路径,请参考图2-3修改OcrFormDemo.java文件中的图像存储路径.

  图2-3修改要识别的图像的路径

  

  第6步,运行并查看结果.

  运行OcrFormDemo.java文件(“运行为Java应用程序”),控制台输出200指示程序已成功执行. 识别结果如图2-4所示.

  图2-4识别结果

  

  其中,运行结果为JSON字符串. 索引是文本块的序列号,排序是从左到右,从上到下的固定模板顺序. 相应的字是每个块的值(在此不识别标题,仅识别该值以供直接参考). 识别结果还可以另存为JSON格式的文件,如图2-5所示.

  图2-5识别结果文件

  

  ----结束

  四项业务价值分析

  当前,华为的海关文件识别服务已应用于华为的供应链中. 引入此服务后,它有效地节省了人力并控制了风险敞口,并提高了业务流程自动化的比例.

  通过用文档标识替换手动输入,可以实现收入:

  建立数据资产以确保完整填写海关申报信息并满足海关合规要求.

  清关业务自动化的比例大大提高.

  建立数据资产以确保准确记录运输收据信息,以满足财务管理要求.

  POD审核业务可在几秒钟内实时完成,并及时触发客户*敏*感*词*.

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线