News:企業神器 快速提取PDF內容

文章日期:2021年08月31日

【明報專訊】一般辦公室工作人員對PDF檔案應該不會陌生,但有時要在數以百頁計的PDF中提取需要的資料和數據也不容易。Adobe最近推出Adobe PDF Extract API(Application Programming Interface)和Adobe Document Generation API兩個全新應用程式界面,協助用戶快速釋放PDF的資料並以編程方式生成具動態數據的檔案。

助PDF內容應用於編程語言

品牌近年建構電子檔案服務、以雲端為基礎的API和SDK(Software Development Kit,軟體開發套件),讓不同企業的IT人員更順暢地開發創新的電子檔案解決方案。品牌估算每年約有2.5萬億個新建立的PDF檔案。PDF Extract API可分析來自掃描和原生PDF的結構,提取文字、表格數據、圖像等所有PDF元素,同時了解相對位置、跨欄和分頁的閱讀順序,用戶可以將這些資料重新應用到任何現代編程語言或平台。企業可利用PDF Extract API快速準確地提取數據以用於機器學習模型、分析、製作索引或儲存,使用RPA(Robotic Process Automation,機械人流程自動化)和NLP(Natural Language Processing,自然語言處理)等技術將下游流程自動化,以及重新發布適用於多個媒體的PDF內容。

自動整理ERP、CRM數據

不少企業也需要經常將數據輸入到ERP(Enterprise Resource Planning,企業資源規劃)、CRM(Customer Relationship Management,客戶關係管理)系統等各種數據庫的檔案。這項工序向來需手動操作,複雜又費時,Document Generation API則讓開發人員快速設計自訂的Microsoft Word範本,以及生成具動態數據的Word和PDF檔案。它亦可與適用於Microsoft Power Automate的Adobe PDF Tools連接器使用,將預備發票、協議等檔案的流程自動化。

整理:張曉冬

相關字詞﹕軟件 PDF檔案 每日明報-FEATURE