用 AI 自動處理文件：發票、合約、表單資料擷取完整教學

財務小姐每天上班的第一件事，是把昨天收到的三十幾張供應商發票，一張一張看過、把廠商名稱、發票號碼、未稅、稅額、總計，手動敲進 Excel 再轉進會計系統。一張兩三分鐘，三十張就是一個半小時，而且敲到第二十張眼睛開始花，金額抄錯一個位數，月底對帳就要加班抓鬼。這不是哪一家公司的特例，這是台灣絕大多數中小企業每天都在重演的日常。

這篇要解決的問題：教你用 AI 把發票、合約、報價單、表單這些「非結構化文件」自動轉成「乾淨的結構化資料」，從選工具、寫擷取指令到設覆核機制，做到可上線、不出包。 適合誰讀：財會、行政、採購、人資、法務助理——任何每天要從一堆文件裡抄資料進系統的人，沒有技術背景也跟得上。 讀完你會得到：一套文件自動化的完整心法、一張工具選擇對照表、五個實作步驟、可直接複製的擷取 Prompt、一個台灣貿易公司導入前後的真實數據對照，以及最容易出包的錯誤清單。

TL;DR：把文件自動化做成功的關鍵，不是「找一個最強的 AI 一鍵全包」，而是「先 OCR 再理解、用 JSON 定義欄位、加信心分數讓人工只覆核少數件」。先用無程式方式驗證 Prompt 準確率，再串系統，自動化率可達八成以上而錯誤被擋在進帳之前。

免責聲明：本文涉及的會計、稅務與合約欄位擷取為流程教學示範，AI 擷取結果可能出錯；正式記帳、報稅與合約簽署前，務必由具會計師、稅務或法務專業者覆核原始文件。

為什麼「文件處理」特別值得用 AI

很多老闆對 AI 的想像停在「寫文案、做圖」，卻忽略了 AI 最能立刻省錢的場景，其實是這種沒人想做、又不得不做的文件搬運工作。原因有三個。

第一，它是純粹的重複勞動，價值低但量大。把發票金額抄進系統不需要創意、不需要判斷，卻每天都要做、做不完。這種工作交給人，是用昂貴的時間做廉價的事；交給 AI，剛好物盡其用。

第二，人工出錯率高且難察覺。連續敲三十張發票，少打一個零、把 6 看成 8，這種錯不會當下跳出來，要等月底對帳對不上才爆。AI 不會疲勞，再加上自動的交叉驗證規則，反而比人更不容易讓金額錯誤溜進系統。

第三，過去做不到，現在才做得到。十年前要自動讀發票，得為每一種版型刻一套模板，廠商一改版就壞，維護成本高到只有大企業玩得起。現在的多模態 AI 是「理解」文件內容而非「比對」固定位置，所以它能容忍版型變化，中小企業也負擔得起。這是這兩年才真正成熟的能力，值得重新評估。

換句話說，文件自動化是 AI 投資報酬率最高、最容易看到成果的起手式。你不需要先有宏大的數位轉型藍圖，光是把「抄發票」這一件事自動化，就能立刻釋放出一個人力。

核心概念：從「非結構化」到「結構化」

要理解這件事，先搞懂一個關鍵詞：非結構化資料。一張發票對人來說一目了然，但對電腦來說，它只是一堆像素或一段沒有欄位標記的文字——電腦不知道哪個數字是「總計」、哪串文字是「統一編號」。文件自動化的本質，就是把這種「人看得懂、電腦看不懂」的東西，翻譯成「電腦能直接存進資料庫」的結構化資料。

這個翻譯過程分成兩層能力，很多人會混淆，務必分清楚：

能力	它做什麼	像什麼	代表工具
OCR（光學辨識）	把影像上的文字「認」出來變成可選取的文字與座標	把照片裡的字打成逐字稿	Google Document AI、Azure Document Intelligence、AWS Textract
語意理解／擷取	從文字裡判斷「哪段是發票號碼、哪個是稅額」	看懂逐字稿並填進表格	GPT、Claude、Gemini 等多模態大型語言模型

關鍵心法是：清晰的數位 PDF 或截圖，可以直接丟給多模態 AI 一步到位；但掃描檔、手寫、傾斜、低解析度的影像，要先過 OCR 再交給 AI 理解，準確率會高很多。 不要因為多模態模型「也能看圖」就全部直接丟圖，遇到爛掃描檔它一樣會猜錯。先 OCR 再理解，是專業做法與玩票做法的分水嶺。

下表幫你快速判斷不同文件該怎麼處理：

文件類型	常見挑戰	建議做法
數位發票／電子報價單（PDF）	通常清晰、欄位固定	多模態 AI 直接擷取
掃描紙本發票	歪斜、模糊、蓋章遮字	先 OCR 校正再交 AI
手寫表單／簽收單	字跡潦草	專業手寫 OCR ＋人工覆核高比例
多頁合約	條款散落、跨頁	切段＋指定要抓的條款清單
跨欄表格（對帳單）	欄位對齊困難	用能輸出座標的 OCR 保留表格結構

實際做法：五步打造可上線的文件自動化

Step 1：盤點文件類型與欄位清單

不要一開始就想「把所有文件都自動化」。先挑一種量最大、最痛的文件（通常是進項發票），列出你每次要從它身上抄哪些欄位。這份「欄位清單」就是 AI 擷取的標準答案，也是你日後驗收準確率的依據。

以進項發票為例，欄位清單可能是：供應商名稱、統一編號、發票號碼、開立日期、未稅金額、稅額、含稅總計、品項明細。把它寫清楚，後面每一步都會用到。

Step 2：選對工具——OCR 還是多模態

依照前面的對照表，判斷你的文件主要是哪一種品質。數位 PDF 為主，就用 ChatGPT、Claude 這類能讀檔的多模態工具起步；掃描與手寫多，就先接一個專業 OCR。不確定時，最快的驗證法是各拿五份真實文件，分別用兩種路徑跑一次，比對哪個準。延伸的工具選擇可參考最佳 AI 自動化工具盤點。

Step 3：寫結構化擷取 Prompt

這是整套流程的心臟。重點是不要讓 AI 用一段文字回答你，要它回傳機器讀得懂的 JSON。Prompt 裡要把欄位、型別、規則全部寫死（找不到填 null、金額去逗號與貨幣符號、日期統一成 YYYY-MM-DD）。完整範例見下一節。

Step 4：設信心分數與人工覆核

這一步決定你敢不敢把它上線。要求 AI 對每個關鍵欄位額外輸出一個信心分數，再加上業務邏輯驗證規則（未稅＋稅額是否等於總計）。把「低信心」或「驗證對不上」的件數自動標記出來退給人工，其餘自動放行。這就是所謂的 human-in-the-loop（人在迴圈中）——你不是要 100% 全自動，而是要 80% 自動＋20% 聚焦覆核，整體又快又不出包。

Step 5：串接系統與歸檔

最後把擷取出來的 JSON 寫進 Excel、Google Sheet 或會計／ERP 系統，原始檔依「日期＿供應商＿發票號碼」之類的規則自動改名歸檔。小量手動貼即可；要每天自動跑，就用 Make、n8n 把「收信附件→OCR→AI 擷取→寫表→歸檔」串成一條 Workflow，整套流程設計可參考 AI Workflow 設計教學，現成範本到 /workflows 直接套用。

可複製的擷取 Prompt

把下面這段貼進 ChatGPT 或 Claude，連同發票檔案一起送出。實務上請依你 Step 1 的欄位清單增刪欄位。

你是專業的財會文件擷取助理。我會提供一張發票（圖片或 PDF）。
請只輸出 JSON，不要任何其他文字或說明。

擷取規則：
1. 嚴格依照下方欄位結構輸出，欄位順序不可更動。
2. 任何欄位若文件中找不到，一律填 null，不要省略該欄位、不要猜測。
3. 金額一律輸出純數字，去除逗號、貨幣符號與空白；日期統一為 YYYY-MM-DD。
4. 每個關鍵欄位附一個 confidence（high / medium / low），表示你對該值的把握。
5. 額外做一個交叉驗證：判斷 untaxed + tax 是否等於 total，
   結果填入 validation.amount_check（true / false / null）。

輸出格式：
{
  "supplier_name": "",
  "tax_id": "",
  "invoice_number": "",
  "invoice_date": "",
  "untaxed": 0,
  "tax": 0,
  "total": 0,
  "line_items": [
    { "description": "", "qty": 0, "unit_price": 0, "amount": 0 }
  ],
  "confidence": {
    "tax_id": "high",
    "invoice_number": "high",
    "total": "high"
  },
  "validation": { "amount_check": true },
  "needs_human_review": false
}

最後依規則自行判斷：若任一關鍵欄位 confidence 為 low、
或 validation.amount_check 為 false，請把 needs_human_review 設為 true。

這段 Prompt 的設計重點有三個：強制 JSON 讓下游程式好接、強制保留 null 欄位避免漏抓、內建信心與驗證讓系統知道哪些要退人工。要處理合約或其他文件時，把欄位換成你的清單即可，合約條款擷取的進階技巧見 AI 合約審閱教學。

台灣中小企業實作案例：一家貿易公司的進項發票自動化

公司背景：台中一家做五金零件進出口的貿易公司，二十多人，每月要處理約 600 張進項發票，來自上百家國內外供應商，版型五花八門。原本由一位行政人員負責 key-in 進會計系統。

導入前的痛點：

一位行政人員每天約花 2.5 小時抄發票，一個月超過 50 小時純人工。
月底常因金額抄錯（漏零、稅額算錯）導致對帳對不上，平均每月加班 6 至 8 小時抓錯。
旺季發票暴增時，發票積壓、請款延遲，影響與供應商關係。

導入做法：先用本文 Step 1 到 Step 4 的方法，拿 50 張真實發票在 Claude 上手動測 Prompt，把準確率調到滿意。確認可行後，用 n8n 串成自動流程：供應商寄來的發票附件進信箱→自動過 OCR→送 AI 擷取→低信心或驗證失敗的退到一個「待覆核」清單、其餘直接寫進 Google Sheet 並轉入會計系統→原始檔自動歸檔。整套花了約兩週建置，類似的登打自動化思路見 AI 資料登打自動化。

導入後成果（上線三個月後統計）：

指標	導入前	導入後
每月人工處理工時	約 50 小時	約 11 小時（僅覆核退件）
自動放行比例	0%	約 82%
月底對帳加班	6–8 小時	近乎零
金額錯誤進系統	偶發、難追	被驗證規則攔下
發票處理週期	1–3 天	當日完成

關鍵心得：負責導入的會計主管說，最有價值的不是「全自動」，而是「AI 先把八成做掉、把對不上的兩成清楚標出來，人只要看那兩成」。行政人員從每天抄兩個半小時，變成每天花二十分鐘檢查退件，省下的時間拿去做應收帳款追蹤，整個財務流程都鬆了下來。這套思路同樣適用於會計事務所的 AI 應用。

常見錯誤：八成的人都踩過

錯誤一：追求 100% 全自動，結果一個出包就全盤不信。 文件自動化的正確目標是「高自動化率＋低風險」，不是「零人工」。沒有覆核機制的全自動，遲早因一次錯帳被老闆叫停。先求穩，再慢慢提高自動放行門檻。

錯誤二：爛掃描檔直接丟多模態模型。 看到模型「能讀圖」就全部丟圖，遇到歪斜模糊的掃描件辨識率直接崩。記得分流：清晰的直接讀，爛的先過 OCR。

錯誤三：讓 AI 用自然語言回答，下游無法自動處理。 「這張發票總計是 12,600 元」這種回答程式接不住。一律要求結構化 JSON，並把欄位、型別、缺值規則寫死。

錯誤四：沒有交叉驗證，錯了也不知道。 只擷取不驗證，等於把 AI 的猜測當成真理。一定要加業務邏輯檢查（未稅＋稅＝總計、品項加總＝小計），讓系統自己抓出可疑件。

錯誤五：把高機密文件丟進公開版聊天工具。 合約、人事、客戶個資不該丟進可能拿去訓練的公開服務。改用 API 方案、確認資料不留存條款，並在送出前遮蔽敏感欄位。

錯誤六：一次想吃下所有文件類型。 同時自動化發票、合約、報價單、簽收單，每種都做不深、都不上線。先把量最大那一種做到能上線，嘗到甜頭再擴張。

結論

用 AI 自動處理文件，是中小企業導入 AI 投資報酬率最高、最快見效的一步。它不需要宏大的轉型計畫，只要挑出「抄發票」這種量大、低價值、又出錯率高的工作，用「先 OCR 再理解、JSON 定義欄位、信心分數讓人工只覆核少數件」這套方法，兩週內就能讓一個人力從重複勞動裡解放出來。

記住三個原則：目標是「可控的高自動化」而非「魯莽的全自動」、永遠用結構化輸出加交叉驗證、敏感文件要顧好資安。先用無程式方式把 Prompt 的準確率調好，再決定要不要串系統，你就能把每天那一個半小時的抄寫，變成每天二十分鐘的安心覆核。

想把這套自動化擴展到其他流程，可以接著看 AI 文件自動化的批次與歸檔流程、用自動化工作流範本直接套用現成設計，或到 /tools 挑選適合你文件類型的工具。

常見問題 FAQ

AI 擷取發票會不會把金額看錯，害我做錯帳？

會有風險，所以重點不是『相信 AI』而是『設計覆核機制』。標準做法是要求 AI 對每個欄位輸出信心分數，並加上交叉驗證規則（例如未稅＋稅額是否等於含稅總額、品項小計加總是否等於總計）。對不上的件數自動退給人工，對得上的才放行。這樣自動化率仍能到八成以上，錯帳風險卻被擋在進系統之前。

掃描品質很差或手寫的文件，AI 處理得了嗎？

純多模態模型對糊掉的掃描檔與手寫字辨識率會明顯下降。較穩的做法是先用專業 OCR（如 Google Document AI、Azure Document Intelligence、textract）把影像轉成文字與座標，再交給 AI 做欄位理解與結構化。先 OCR 再理解，比直接丟圖給模型穩定很多，尤其是手寫與低解析度文件。

我們文件有客戶資料與營業祕密，丟給 AI 會外洩嗎？

要看你用哪種服務。公開版聊天工具的資料可能被用於訓練，不適合放敏感文件。企業要用 API 方案或有資料不留存（zero retention）條款的服務，並在送出前做去識別化（遮蔽身分證、帳號）。合約、人事這類高機密文件，建議只擷取必要欄位、或評估可地端部署的開源模型。

做這套自動化需要會寫程式嗎？

看規模。十幾份的小量，用 ChatGPT 或 Claude 上傳檔案、貼擷取 Prompt 就能跑，零程式。要每天自動處理幾百份、還要寫進系統，就需要用 Make、n8n 這類自動化平台串接，或請工程師接 API。建議先用無程式方式驗證 Prompt 準不準，確認可行再投入串接。

合約這種長文件，AI 擷取條款可靠嗎？

合約擷取（金額、期間、違約金、自動續約條款）AI 能大幅加速初篩，但不能取代法務判斷。它適合做『把散落各頁的關鍵條款抓出來列成表』讓人快速比對，而非直接下『這份合約沒問題』的結論。重要條款一定要人工複看原文，AI 只是縮短你翻文件的時間。

一份文件要擷取的欄位很多，AI 容易漏抓怎麼辦？

把欄位清單寫死在 Prompt 裡，並要求 AI『就算找不到也要保留欄位並填 null』，避免它擅自省略。欄位太多時可拆成兩階段：先請 AI 判斷文件類型，再依類型套用對應的欄位模板。輸出用固定 JSON 結構，下游程式才好檢查哪個欄位是空的、需要補。

導入後維護麻煩嗎？廠商換了發票格式會不會整套壞掉？

用 AI 擷取的好處正是對版型變化的容忍度高——它理解的是『發票號碼長什麼樣』而非『發票號碼固定在第幾格』，所以廠商微調版面通常不會壞。真正要維護的是欄位清單與驗證規則：新增供應商、新增要抓的欄位時更新 Prompt 即可，不必像傳統樣板那樣重拉模板。

投入這套自動化，多久能回本？

取決於文件量。若一個月要人工 key-in 幾百份文件、每份平均 5 分鐘，一個月就是數十小時人力。導入後自動化率八成、人工只覆核兩成，省下的工時通常一到兩個月就能抵掉建置與 API 成本。文件量越大、越標準化，回本越快；量很小的反而不一定划算。

延伸閱讀

這篇對你有幫助嗎？

AgentAI 智庫團隊 ✓ 台灣實作團隊

我們是一群專注於 AI Agent、Prompt 與自動化工作流的台灣實作者。每篇教學都附可複製配方、誠實標示實測程度與限制，只分享真正能落地、可直接套用的方法——與其介紹工具，不如教你把事情做完。

關於我們 →看更多教學 →訂閱情報週報 →

每週把這類實戰教學寄給你

訂閱 AgentAI 智庫情報週報，新的 Prompt、AI Skills、工作流與教學第一時間收到。

免費 · 隨時取消