專欄文章

「開箱即用」AWS AI Solution Kit:告別繁瑣實體資料,AI 發票、表單、文件辨識處理自動化!

「開箱即用」AWS AI Solution Kit:告別繁瑣實體資料,AI 發票、表單、文件辨識處理自動化!

您的企業是否還在為堆積如山的紙本文件感到困擾?員工是否疲於應付繁瑣的文件處理工作,導致效率低下?傳統紙本文件處理,不僅耗時費力,更可能因人為疏失導致錯誤,成為企業數位轉型的一大絆腳石。CKmates 將介紹如何運用 AI 技術,自動掃描辨識資料轉換成數位檔案,並連結至您的自有軟體,簡化時間以及人工成本。 

 

什麼是 AI Solution Kit? 


AI Solution Kit 是 AWS 針對 AI 技術所提供的開箱即用整合解決方案,其中包含光學字元辨識 (OCR)、圖像理解、自然語言理解 (NLU)、人臉檢測等。 

 

以上功能皆為「開箱即用」,可透過 Amazon API Gateway 自動創建 RESTful API,您可以依照所需要的解決方案內容,選取需要的 AI 模型,若有不同的需求也可以進行客製化靈活調整。 

 

此次我們需要使用到的內容為光學字元辨識 (OCR),以下將詳細講解其用作內容以及。 

 

圖/AI Solution Kit提供各式與影像辨識有關的商業應用,皆為隨需啟用!

圖/AI Solution Kit提供各式與影像辨識有關的商業應用,皆為隨需啟用! 

 

什麼是 OCR (光學字元辨識)

 

OCR 技術是將圖像或掃描文件中的文字轉換為可編輯、搜尋的數位格式的關鍵。AWS AI Solution Kit 提供多種 OCR 引擎,將文件轉換為機器可讀取的數位化檔案,高階 OCR 模型可支援簡體中文、繁體中文、越南文、日文、韓文、英文等多種語言,以及數字、字母和符號的辨識,客製化 OCR 模型可依據特定格式文件(如發票、表單)建立模板,提升客製化辨識效率。此方法可以運用於各產業,如醫療業者可運用 OCR 處理患者紀錄,簡化醫院手動工作;又如銀行業者可以運用 OCR 技術處理借貸文件等,除了降低出錯率,借數位化並增強交易安全性。  

 

AWS AI Solution Kit 與 OCR 運作方式 

 

AWS AI Solution Kit 透過電腦視覺技術分析文件圖像,精準辨識表格結構,如邊框、線條與儲存格。結合機器學習模型,從大量數據中學習,大幅提升辨識的準確性。辨識表格後,AWS AI Solution Kit 進一步分析其結構: 
 

  1. 列與欄的偵測:找出水平與垂直線條,精確定位列與欄。 

  1. 儲存格的分割:將表格分割為獨立儲存格,並判斷合併情況。 

  1. 表格關係的建立:理解儲存格間的關係,如哪些儲存格屬於同一表頭。 
     

接著,AWS AI Solution Kit 的 OCR 引擎辨識每個儲存格的文字內容,並將文字與對應的儲存格關聯。最後,AWS AI Solution Kit 將辨識出的表格及欄位資料轉換為結構化且易讀的 JSON 格式,方便後續的資料處理與分析。 

 

企業的各式紙本資料,可透過AI Solution Kit的OCR技術數位化, 針對轉換為JSON格式供自有系統介接。 

圖/企業的各式紙本資料,可透過AI Solution Kit的OCR技術數位化, 針對轉換為JSON格式供自有系統介接。 

 

此次商業應用演示為企業經典的發票報銷自動化流程,雲端架構為經典的無伺服器 ML 架構,透過 AWS AI Solution Kit 進行資料萃取後,使用 Amazon Bedrock 進行大語言模型的分析後,歸檔進入企業用的資料庫。此架構將運用 AWS API Gateway 以及  AWS Lambda 的無伺服器架構,結合 Amazon Sagemaker 的 AI 模型託管能力執行影像辨識模型的運作,並整合 Amazon Bedrock 強大的 AI 分析能力對發票影像辨識的結果做格式化的整理後,輸入至企業資料庫以利後續企業商業流程。 

 

/此次範例所使用的企業報帳用發票明細。

 圖/此次範例所使用的企業報帳用發票明細。

 

Amazon SageMaker 託管模型架構

 

如上圖,此次所使用的無伺服器以及 Amazon SageMaker 託管模型架構,其中Amaon API Gateway 作為端點可介接企業自有軟體,AWS Lambda 可串接模型功能與自有商業邏輯,Sagemaker 託管AI影像辨識用所需之AI模型,並且運用Bedrock進行AI 大語言模型的文本處理、分析及格式化。 

 

AWS CloudFormation 將基礎設施視為程式碼,可讓您對 AWS 和第三方資源進行建模、佈建和管理。



AWS CloudFormation 將基礎設施視為程式碼,可讓您對 AWS 和第三方資源進行建模、佈建和管理。透過 CloudFormation,使用者可以迅速部署 AI Solution Kit 解決方案架構。
 

透過程式化 API  串接後,取得該發票的影像辨識結果。 


透過程式化 API  串接後,取得該發票的影像辨識結果。 
 

透過 Amazon  Bedrock,可以有效分析與整理此發票的內容成為指定格式。 


透過 Amazon  Bedrock,可以有效分析與整理此發票的內容成為指定格式。 
 

 

將最終的資料放入企業資料庫,作為後續商業應用。 
 


將最終的資料放入企業資料庫,作為後續商業應用。 

 

綜上範例,我們可以看到透過 AWS AI Solution Kit,可以大幅提高實體紙本至數位化商業應用的效率與精準度。此解決方案不僅簡化了紙本資料處理流程,因為採用了AWS Lambda 等無伺服器服務,企業無需管理基礎設施,可專注於業務邏輯的開發,更透過機器學習模型實現了高度自動化,快速將紙本資料轉換為有用資訊,減少了人為錯誤的風險,加速數據分析與決策! 

 

銓鍇國際 CKmates:您企業數位轉型的最佳夥伴,引領您邁向智能未來 


CKmates 助您運用雲端技術,節省成本,我們提供全天候的雲端專業服務,並提供完整的企業資料治理及資料處理解決方案,結合 AWS AI Solution Kit 的強大功能,幫助您成功實現 AI 時代的企業數位轉型,引領您邁向智能未來! 

 

AWS AI 服務系列專欄: 

運用 AWS 打造生成式 AI !多元產業應用指南
電商必備 AI 行銷神器!如何運用 Amazon Personalize 黏住客戶、提升業績
ChatGPT 最強大的競爭對手 - Claude 2.1 現已被 Amazon Bedrock 支援

打造最了解您的企業級生成式 AI 助理!Amazon Q 使用指南 

 

最新文章

加入 Line 好友 加入 Line 好友 歡迎來聊聊 寄信給我們 訂閱電子報
joinline