校對須知

特別注意

在刪除或廢棄(即不保存且關閉 FineReader 文件)「校對源」前,請務必將導出的 TXT 文件逐一打開確認內容無誤!

更新槪要

09月20日

保存辦法變更,即日起:

  • 校對成果導出格式由 Microsoft Word 改為 TXT 文件
  • 每頁單獨保存為一個 TXT 文件
  • TXT 文件名稱與源圖片文件名稱保持一致
  • 不再保存 FineReader 源文件
  • 具體操作說明見此

廢除後期修正;書童不再需要關注文本中的標點與空格。

09月01日

本《校對須知》首告

前言

主體的校對工作可分為以下三個步驟:

  1. 運行識別
  2. 校定字元
  3. 導出成果

這三個步驟的具體說明,可直接參見【校對步驟】。本文件中其餘部份(【軟件安裝】與【其它提示】)是校對工作的輔助說明,眾書童可因需參考。

軟件安裝

發給各位書童的識別軟件 ABBYY FineReader 有三個部份:

安裝的過程大體如下,具體細節可觀看安裝視頻。

  1. 解壓軟件包 ABBYY_FineReader_11_CE.exe
  2. 解壓完畢後,系統自動開啟安裝程序
  3. 安裝完畢後,手動將破解文件替代原裝文件
  4. 開啟 ABBYY FineReader 即可使用

需要特別說明的是,安裝時請用拉丁字元命名 ABBYY FineReader 安裝的文件夾,如果用漢字字元命名的話,將導致 ABBYY FineReader 無法運行。

校對步驟

以下是校對操作流程中的關鍵步驟。由於本步驟說明截屏中的界面用的是繁體中文,因此其用詞與簡體界面會有出入,煩請眾書童自行對應。

運行識別

打開 ABBYY FineReader 識別軟件後,先在[工作框][文件語言]中,選擇[繁體中文及英文]。然後再在該框的下方選擇[開啟影像/PDF…]

[開啟影像]框中,選擇需要導入識別的圖像並打開。由於一次性導入一本書的所有頁面耗時過長,且如果保存 FineReader 源文件過大,建議一次校對導入 10 頁校對。

校定字元

軟件在完成識別後,請點擊位於屏幕右側[文字框]上方的[驗證],開始對軟件用藍色標出;表示不確定的字元進行校定。

很多情況下,軟件表示不確定的字元,其實是正確的,或者軟件已在[驗證框]下方的[辯識差異]中給出了正確的字元,因此正確的字元通常都能在[辯識差異]找到。

然而,在少數情況下,軟件在[辯識差異]中也會無法提供任何候選字元。此時如果識別是正確的,那麼該字元的校定則必須由點擊[驗證框]右側的[忽略]來完成。

而如果識別是不正確的,此時就需要書童手工刪除錯識的字元,輸入正確的字元(生僻字的輸入,請參見【其它提示】部份的〖校定生僻字〗),然後再由點擊右側的[確認]來完成。

所以,為了提高效率;減少遊標在屏幕上運動的頻率,建議校定以雙擊[辯識差異]中的正確字元操作為主,只有在[辯識差異]無法使用的情況下才去藉由[驗證]框右側的[忽略][確定]來完成, 示意圖見下:

保存成果

十頁校對完成後,請將成果導出為 TXT 文件。請點擊屏幕上方[儲存/傳送]旁邊的[三角],在展開的列單中選擇[儲存至其他格式…]

[文件另存為]框開啟後,在[Save as type:]中選擇[文字(*.txt)]

在框下端的[檔案選項(L)]中選擇[為每個輸入檔案建立單獨檔案]1 ,然後再點擊右下角的[選項(O)…]

在開啟的選項框中,作如圖的選擇:

最後完成保存,保存完畢後請將導出的 TXT 文件逐一打開,確認內容無誤後再廢棄 FineReader 中的「校對源」,該項檢查異常重要,敬請眾書童務必於此用心!

其它提示

校對方式

即日起,書童只需要負責對 FineReader 用藍色標出的字元進行校定即可;書童不再負責去除空格及校正標點,空格與標點將由程序負責運算修正。

輸入生字

使用「字音輸入法」(各種拼音、注音)的書童,在遇到不確定讀音的字時,可通過輸入法中的手寫功能進行輸入。如果輸入法中不帶有手寫功能,或者需要進一步確定用字,請核查字典。使用 iPhone 的書童可以免費下載【古汉语字典】(其標誌如右),下載後打開,在 iPhone 上用手寫輸入,查找後獲取讀音,再在電腦上的輸入法中輸入讀音,找到所要的字。

後語

剛開始校對時,由於生疏,進度可能會慢一些,書童們不必著急。在校對過程中,有些相同的問題(比如某字元總被識別為另一字元)會重覆出現,校對一週後必可熟能生巧。因各書童所校書目的不同,在工作中會出現不同的情況,此處所述不能詳盡,如遇問題或有建議,敬請與校長賀甜甜聯繫,校長的聯繫方式見下:

感謝大家的付出

甲午2014年9月20日·【易墨軒】敬白

註釋

1[為每頁輸入檔案建立單獨檔案]將以原始圖片的文件命稱命名新保存的檔案,使兩者保持一致,方便對照;而[對每頁建立不同的當案]則不保存原名,使對照變得複雜。返回正文