Appearance
OCR文字識別 ?
組件概述 ?
OCR文字識別組件通過調用OCR服務接口,將圖片中的文字內容轉換為可編輯和處理的文本數據,實現自動化文字提取功能。
配置說明 ?
OCR服務URL ?
- 作用:指定OCR識別服務的API接口地址
- 格式:完整的HTTPS端點地址,例如:
https://your-ocr-api-endpoint.com
圖片選擇 ?
提供多種方式指定需要識別的圖片源:
選擇圖片 ?
- 功能:手動上傳本地圖片文件進行識別
- 支持格式:JPG、JPEG、PNG、BMP、GIF、TIFF
圖片base64變量名 ?
- 功能:通過變量傳遞base64編碼的圖片數據
- 格式要求:完整的base64字符串(包含
data:image/...前綴)
圖片路徑變量名 ?
- 功能:通過變量傳遞圖片文件系統(tǒng)路徑
- 格式要求:有效的本地文件路徑(/path/to/image.jpg)
使用優(yōu)先級 ?
系統(tǒng)按以下順序選擇圖片源:
- base64變量(最高優(yōu)先級)
- 手動上傳
- 路徑變量(最低優(yōu)先級)
數據輸出 ?
分配給變量 ?
將識別出的文字內容保存到變量中
- 變量名稱:指定存儲識別結果的變量名稱
插入表格 ?
將識別結果插入到表中
- 選擇列:指定插入識別結果的表格列
應用場景 ?
- 發(fā)票信息自動錄入
- 證件文字提取
- 文檔數字化處理
- 圖片驗證碼識別
注意事項 ?
- 確保OCR服務可用且網絡連接正常
- 圖片質量直接影響識別準確率
- 建議對識別結果進行校驗和后處理

MakAgent在線文檔