財務小姐每天上班的第一件事,是把昨天收到的三十幾張供應商發票,一張一張看過、把廠商名稱、發票號碼、未稅、稅額、總計,手動敲進 Excel 再轉進會計系統。一張兩三分鐘,三十張就是一個半小時,而且敲到第二十張眼睛開始花,金額抄錯一個位數,月底對帳就要加班抓鬼。這不是哪一家公司的特例,這是台灣絕大多數中小企業每天都在重演的日常。
這篇要解決的問題:教你用 AI 把發票、合約、報價單、表單這些「非結構化文件」自動轉成「乾淨的結構化資料」,從選工具、寫擷取指令到設覆核機制,做到可上線、不出包。 適合誰讀:財會、行政、採購、人資、法務助理——任何每天要從一堆文件裡抄資料進系統的人,沒有技術背景也跟得上。 讀完你會得到:一套文件自動化的完整心法、一張工具選擇對照表、五個實作步驟、可直接複製的擷取 Prompt、一個台灣貿易公司導入前後的真實數據對照,以及最容易出包的錯誤清單。
TL;DR:把文件自動化做成功的關鍵,不是「找一個最強的 AI 一鍵全包」,而是「先 OCR 再理解、用 JSON 定義欄位、加信心分數讓人工只覆核少數件」。先用無程式方式驗證 Prompt 準確率,再串系統,自動化率可達八成以上而錯誤被擋在進帳之前。
免責聲明:本文涉及的會計、稅務與合約欄位擷取為流程教學示範,AI 擷取結果可能出錯;正式記帳、報稅與合約簽署前,務必由具會計師、稅務或法務專業者覆核原始文件。
為什麼「文件處理」特別值得用 AI
很多老闆對 AI 的想像停在「寫文案、做圖」,卻忽略了 AI 最能立刻省錢的場景,其實是這種沒人想做、又不得不做的文件搬運工作。原因有三個。
第一,它是純粹的重複勞動,價值低但量大。把發票金額抄進系統不需要創意、不需要判斷,卻每天都要做、做不完。這種工作交給人,是用昂貴的時間做廉價的事;交給 AI,剛好物盡其用。
第二,人工出錯率高且難察覺。連續敲三十張發票,少打一個零、把 6 看成 8,這種錯不會當下跳出來,要等月底對帳對不上才爆。AI 不會疲勞,再加上自動的交叉驗證規則,反而比人更不容易讓金額錯誤溜進系統。
第三,過去做不到,現在才做得到。十年前要自動讀發票,得為每一種版型刻一套模板,廠商一改版就壞,維護成本高到只有大企業玩得起。現在的多模態 AI 是「理解」文件內容而非「比對」固定位置,所以它能容忍版型變化,中小企業也負擔得起。這是這兩年才真正成熟的能力,值得重新評估。
換句話說,文件自動化是 AI 投資報酬率最高、最容易看到成果的起手式。你不需要先有宏大的數位轉型藍圖,光是把「抄發票」這一件事自動化,就能立刻釋放出一個人力。
核心概念:從「非結構化」到「結構化」
要理解這件事,先搞懂一個關鍵詞:非結構化資料。一張發票對人來說一目了然,但對電腦來說,它只是一堆像素或一段沒有欄位標記的文字——電腦不知道哪個數字是「總計」、哪串文字是「統一編號」。文件自動化的本質,就是把這種「人看得懂、電腦看不懂」的東西,翻譯成「電腦能直接存進資料庫」的結構化資料。
這個翻譯過程分成兩層能力,很多人會混淆,務必分清楚:
| 能力 | 它做什麼 | 像什麼 | 代表工具 |
|---|---|---|---|
| OCR(光學辨識) | 把影像上的文字「認」出來變成可選取的文字與座標 | 把照片裡的字打成逐字稿 | Google Document AI、Azure Document Intelligence、AWS Textract |
| 語意理解/擷取 | 從文字裡判斷「哪段是發票號碼、哪個是稅額」 | 看懂逐字稿並填進表格 | GPT、Claude、Gemini 等多模態大型語言模型 |
關鍵心法是:清晰的數位 PDF 或截圖,可以直接丟給多模態 AI 一步到位;但掃描檔、手寫、傾斜、低解析度的影像,要先過 OCR 再交給 AI 理解,準確率會高很多。 不要因為多模態模型「也能看圖」就全部直接丟圖,遇到爛掃描檔它一樣會猜錯。先 OCR 再理解,是專業做法與玩票做法的分水嶺。
下表幫你快速判斷不同文件該怎麼處理:
| 文件類型 | 常見挑戰 | 建議做法 |
|---|---|---|
| 數位發票/電子報價單(PDF) | 通常清晰、欄位固定 | 多模態 AI 直接擷取 |
| 掃描紙本發票 | 歪斜、模糊、蓋章遮字 | 先 OCR 校正再交 AI |
| 手寫表單/簽收單 | 字跡潦草 | 專業手寫 OCR +人工覆核高比例 |
| 多頁合約 | 條款散落、跨頁 | 切段+指定要抓的條款清單 |
| 跨欄表格(對帳單) | 欄位對齊困難 | 用能輸出座標的 OCR 保留表格結構 |
實際做法:五步打造可上線的文件自動化
Step 1:盤點文件類型與欄位清單
不要一開始就想「把所有文件都自動化」。先挑一種量最大、最痛的文件(通常是進項發票),列出你每次要從它身上抄哪些欄位。這份「欄位清單」就是 AI 擷取的標準答案,也是你日後驗收準確率的依據。
以進項發票為例,欄位清單可能是:供應商名稱、統一編號、發票號碼、開立日期、未稅金額、稅額、含稅總計、品項明細。把它寫清楚,後面每一步都會用到。
Step 2:選對工具——OCR 還是多模態
依照前面的對照表,判斷你的文件主要是哪一種品質。數位 PDF 為主,就用 ChatGPT、Claude 這類能讀檔的多模態工具起步;掃描與手寫多,就先接一個專業 OCR。不確定時,最快的驗證法是各拿五份真實文件,分別用兩種路徑跑一次,比對哪個準。延伸的工具選擇可參考最佳 AI 自動化工具盤點。
Step 3:寫結構化擷取 Prompt
這是整套流程的心臟。重點是不要讓 AI 用一段文字回答你,要它回傳機器讀得懂的 JSON。Prompt 裡要把欄位、型別、規則全部寫死(找不到填 null、金額去逗號與貨幣符號、日期統一成 YYYY-MM-DD)。完整範例見下一節。
Step 4:設信心分數與人工覆核
這一步決定你敢不敢把它上線。要求 AI 對每個關鍵欄位額外輸出一個信心分數,再加上業務邏輯驗證規則(未稅+稅額是否等於總計)。把「低信心」或「驗證對不上」的件數自動標記出來退給人工,其餘自動放行。這就是所謂的 human-in-the-loop(人在迴圈中)——你不是要 100% 全自動,而是要 80% 自動+20% 聚焦覆核,整體又快又不出包。
Step 5:串接系統與歸檔
最後把擷取出來的 JSON 寫進 Excel、Google Sheet 或會計/ERP 系統,原始檔依「日期_供應商_發票號碼」之類的規則自動改名歸檔。小量手動貼即可;要每天自動跑,就用 Make、n8n 把「收信附件→OCR→AI 擷取→寫表→歸檔」串成一條 Workflow,整套流程設計可參考 AI Workflow 設計教學,現成範本到 /workflows 直接套用。
可複製的擷取 Prompt
把下面這段貼進 ChatGPT 或 Claude,連同發票檔案一起送出。實務上請依你 Step 1 的欄位清單增刪欄位。
你是專業的財會文件擷取助理。我會提供一張發票(圖片或 PDF)。
請只輸出 JSON,不要任何其他文字或說明。
擷取規則:
1. 嚴格依照下方欄位結構輸出,欄位順序不可更動。
2. 任何欄位若文件中找不到,一律填 null,不要省略該欄位、不要猜測。
3. 金額一律輸出純數字,去除逗號、貨幣符號與空白;日期統一為 YYYY-MM-DD。
4. 每個關鍵欄位附一個 confidence(high / medium / low),表示你對該值的把握。
5. 額外做一個交叉驗證:判斷 untaxed + tax 是否等於 total,
結果填入 validation.amount_check(true / false / null)。
輸出格式:
{
"supplier_name": "",
"tax_id": "",
"invoice_number": "",
"invoice_date": "",
"untaxed": 0,
"tax": 0,
"total": 0,
"line_items": [
{ "description": "", "qty": 0, "unit_price": 0, "amount": 0 }
],
"confidence": {
"tax_id": "high",
"invoice_number": "high",
"total": "high"
},
"validation": { "amount_check": true },
"needs_human_review": false
}
最後依規則自行判斷:若任一關鍵欄位 confidence 為 low、
或 validation.amount_check 為 false,請把 needs_human_review 設為 true。
這段 Prompt 的設計重點有三個:強制 JSON 讓下游程式好接、強制保留 null 欄位避免漏抓、內建信心與驗證讓系統知道哪些要退人工。要處理合約或其他文件時,把欄位換成你的清單即可,合約條款擷取的進階技巧見 AI 合約審閱教學。
台灣中小企業實作案例:一家貿易公司的進項發票自動化
公司背景:台中一家做五金零件進出口的貿易公司,二十多人,每月要處理約 600 張進項發票,來自上百家國內外供應商,版型五花八門。原本由一位行政人員負責 key-in 進會計系統。
導入前的痛點:
- 一位行政人員每天約花 2.5 小時抄發票,一個月超過 50 小時純人工。
- 月底常因金額抄錯(漏零、稅額算錯)導致對帳對不上,平均每月加班 6 至 8 小時抓錯。
- 旺季發票暴增時,發票積壓、請款延遲,影響與供應商關係。
導入做法:先用本文 Step 1 到 Step 4 的方法,拿 50 張真實發票在 Claude 上手動測 Prompt,把準確率調到滿意。確認可行後,用 n8n 串成自動流程:供應商寄來的發票附件進信箱→自動過 OCR→送 AI 擷取→低信心或驗證失敗的退到一個「待覆核」清單、其餘直接寫進 Google Sheet 並轉入會計系統→原始檔自動歸檔。整套花了約兩週建置,類似的登打自動化思路見 AI 資料登打自動化。
導入後成果(上線三個月後統計):
| 指標 | 導入前 | 導入後 |
|---|---|---|
| 每月人工處理工時 | 約 50 小時 | 約 11 小時(僅覆核退件) |
| 自動放行比例 | 0% | 約 82% |
| 月底對帳加班 | 6–8 小時 | 近乎零 |
| 金額錯誤進系統 | 偶發、難追 | 被驗證規則攔下 |
| 發票處理週期 | 1–3 天 | 當日完成 |
關鍵心得:負責導入的會計主管說,最有價值的不是「全自動」,而是「AI 先把八成做掉、把對不上的兩成清楚標出來,人只要看那兩成」。行政人員從每天抄兩個半小時,變成每天花二十分鐘檢查退件,省下的時間拿去做應收帳款追蹤,整個財務流程都鬆了下來。這套思路同樣適用於會計事務所的 AI 應用。
常見錯誤:八成的人都踩過
錯誤一:追求 100% 全自動,結果一個出包就全盤不信。 文件自動化的正確目標是「高自動化率+低風險」,不是「零人工」。沒有覆核機制的全自動,遲早因一次錯帳被老闆叫停。先求穩,再慢慢提高自動放行門檻。
錯誤二:爛掃描檔直接丟多模態模型。 看到模型「能讀圖」就全部丟圖,遇到歪斜模糊的掃描件辨識率直接崩。記得分流:清晰的直接讀,爛的先過 OCR。
錯誤三:讓 AI 用自然語言回答,下游無法自動處理。 「這張發票總計是 12,600 元」這種回答程式接不住。一律要求結構化 JSON,並把欄位、型別、缺值規則寫死。
錯誤四:沒有交叉驗證,錯了也不知道。 只擷取不驗證,等於把 AI 的猜測當成真理。一定要加業務邏輯檢查(未稅+稅=總計、品項加總=小計),讓系統自己抓出可疑件。
錯誤五:把高機密文件丟進公開版聊天工具。 合約、人事、客戶個資不該丟進可能拿去訓練的公開服務。改用 API 方案、確認資料不留存條款,並在送出前遮蔽敏感欄位。
錯誤六:一次想吃下所有文件類型。 同時自動化發票、合約、報價單、簽收單,每種都做不深、都不上線。先把量最大那一種做到能上線,嘗到甜頭再擴張。
結論
用 AI 自動處理文件,是中小企業導入 AI 投資報酬率最高、最快見效的一步。它不需要宏大的轉型計畫,只要挑出「抄發票」這種量大、低價值、又出錯率高的工作,用「先 OCR 再理解、JSON 定義欄位、信心分數讓人工只覆核少數件」這套方法,兩週內就能讓一個人力從重複勞動裡解放出來。
記住三個原則:目標是「可控的高自動化」而非「魯莽的全自動」、永遠用結構化輸出加交叉驗證、敏感文件要顧好資安。先用無程式方式把 Prompt 的準確率調好,再決定要不要串系統,你就能把每天那一個半小時的抄寫,變成每天二十分鐘的安心覆核。
想把這套自動化擴展到其他流程,可以接著看 AI 文件自動化的批次與歸檔流程、用 自動化工作流範本 直接套用現成設計,或到 /tools 挑選適合你文件類型的工具。
常見問題 FAQ
AI 擷取發票會不會把金額看錯,害我做錯帳?
掃描品質很差或手寫的文件,AI 處理得了嗎?
我們文件有客戶資料與營業祕密,丟給 AI 會外洩嗎?
做這套自動化需要會寫程式嗎?
合約這種長文件,AI 擷取條款可靠嗎?
一份文件要擷取的欄位很多,AI 容易漏抓怎麼辦?
導入後維護麻煩嗎?廠商換了發票格式會不會整套壞掉?
投入這套自動化,多久能回本?
延伸閱讀
每週把這類實戰教學寄給你
訂閱 AgentAI 智庫情報週報,新的 Prompt、AI Skills、工作流與教學第一時間收到。
免費 · 隨時取消