識別掃描文件中的文字

您可以使用 Acrobat 來識別通過掃描轉換為 PDF 的文件中的文字。光學字元識別 (Optical Character Recognition,簡稱 OCR) 軟體使您可以搜尋、更正和複製掃描 PDF 中的文字。若要將 OCR 套用至 PDF,原始掃描器解析度必須設定為 72 dpi 或以上。

如需文字識別的詳細資訊,請參閱下列視訊:

備註: 採用 300 dpi 的掃描產生的文字最適合於轉換。OCR 精確度在解析度為 150 dpi 會略為降低。

識別單一文件中的文字

  1. 請開啟掃描建立的 PDF。
  2. 選擇「工具」>「識別文字」>「在此檔案中」。
  3. 在「識別文字」對話方塊中,請在「頁面」下選擇選項。
  4. 選擇性地按一下「編輯」開啟「識別文字 - 一般設定」對話方塊,然後依所需指定選項。

識別多份文件中的文字

  1. 在 Acrobat 中,選擇「工具」>「識別文字」>「在多個檔案中」。
  2. 在「識別文字」對話方塊中,按一下「新增檔案」,然後選擇「新增檔案」、「新增資料夾」或「新增開啟的檔案」。然後選擇檔案或資料夾。
  3. 在「輸出選項」對話方塊中,指定輸出檔案的目標資料夾,以及檔名偏好設定。
  4. 在「識別文字 -一般 設定」對話方塊中,指定選項,然後按一下「確定」。

識別文字 - 一般設定對話方塊

「主要 OCR 語言」
為 OCR 引擎指定用來識別字元的語言。

「PDF 輸出樣式」
確定要產生的 PDF 類型。所有選項均要求輸入解析度不得低於 72 dpi (建議)。所有格式均套用光學字元辨識 (Optical Character Recognition,簡稱 OCR) 和字型及頁面辨識至文字影像,並將其轉換為正常的文字。
「可搜尋的影像」
確保文字可供選擇和搜尋。此選項將保留原始影像,依照需要糾偏,並在影像上放置不可見的文字層。在同一個對話方塊「縮減取樣影像」中的選擇將決定影像是否會縮減取樣及其程度。

「可搜尋的影像 (精確)」
確保文字可供選擇和搜尋。此選項將保留原始影像並在影像上放置不可見的文字層。推薦選擇此選項來處理高度要求保留原始影像的文件。

ClearScan
使用低解析度副本,合成幾近於原字型的新 Type 3 字型,並保留頁面背景。

「縮減取樣至」
完成 OCR 後,減少彩色、灰階和單色影像中的像素數目。選擇要套用的縮減取樣程度。數值高的選項縮減取樣較少,產生高解析度的 PDF。