整理一點 AI 翻譯工具的使用心得。
《Google 技術寫作課程(中文版)》已完成初步的校對與潤稿,我也想藉此機會整理一下這次使用 AI 工具輔助翻譯的一點心得。若下次要再給自己挖坑做翻譯,應該能避免再做一些無謂的嘗試,並進一步提升效率。
這次製作中文版的過程大概可以分三階段來說:
- 嘗試用 Gemini CLI 一次搞定。
- 改用其他工具。
- 校稿。
階段一:用 Gemini CLI
我想知道 Gemini CLI 在這個部分能幫我到什麼程度,所以一開始就打開 Gemini CLI,輸入提示詞,請它幫我:
- 爬 Technical Writing One 這個課程的網頁。
- 把每一頁儲存為 Markdown 格式的檔案,保存在當前的本機目錄下。
- 每一個 Markdown 檔案內容翻譯成台灣用語的繁體中文。
看到 Gemini CLI 開始忙碌工作,我驚喜不已。Gemini CLI 似乎真能一氣呵成地執行上述任務。
然而,整個工作流程後來因為碰到限制而中斷:抓取網頁內容的操作達到當日限額了。還好,這麼點小事,我只要手動去把網頁逐頁抓回來,並轉成 Markdown 格式的檔案,然後再請它翻譯成 Markdown 檔案就行了。
但轉頭一想,我有付費訂閱「沉浸式翻譯」的 AI 服務,所以這個翻譯 Markdown 檔案的工作並不是一定要靠 Gemini CLI。更何況,翻譯大量檔案時,還可能會碰到 Gemini CLI 當日免費 token 額度的限制而中斷。
於是,我把 Gemini CLI 目前已經幫我處理好的一部份中文翻譯結果(Markdown 檔案)保留下來,其餘的部分不再使用 Gemini CLI,而改用其他方式進行。(此時我還沒發現 Gemini CLI 處理好的檔案內容有問題,稍後會提到。)
階段二:改用其他工具
接下來,我開始用其他方法來處理 Gemini CLI 未能完成的頁面。我試了幾個抓網頁的工具,後來覺得,還是以半人工的方式,一頁一頁把網頁轉存成 Markdown 比較可靠,也省得再花時間去研究工具(大概可以這樣比喻:我覺得此 use case 不值得我再費力氣去磨利鋸子)。
也許有的人會盡力嘗試研究看看有沒有辦法讓 AI 全自動做到好,例如修改提示詞、加上 MCP server、使用 n8n……之類的。也許最終可以做到某種程度,但我沒有選擇這條路,因為我擔心全自動化流程產出的品質。
最後,我是在 VS Code 裡面透過 Markdown Paste 插件來將每個英文網頁以「選取、複製、貼上」的方式逐一轉成 Markdown 格式。有了正確的 Markdown 內容,剩下的翻譯工作就容易多了:先丟給 AI 工具翻譯,完成初稿後,再全部進行校稿和潤飾。
在翻譯階段,我使用的翻譯工具主要是這幾個:
- ChatGPT (GPT-4o)
- 沉浸式翻譯 (GPT-4.1 mini,有時切換至其他 AI 服務)
- Google 翻譯
階段三:校稿
翻譯初稿大致完成後,準備進行第一次校對。我開了兩個瀏覽器視窗,一邊是原文頁面,另一邊是中文翻譯。先核對各級標題是否正確而且沒有遺漏,然後逐一校對段落和句子。
這時,我發現一個問題:最初用 Gemini CLI 爬網頁、轉 Markdown、然後翻譯成中文,這個一氣呵成的方法所產生的結果缺少一些段落!不管是 AI 幻覺還是爬網頁過程出了錯誤,抑或其他原因,我沒有花時間去實驗和研究為何 Gemini CLI 生成的檔案缺了某些段落,總之就是缺漏。
這讓我有點懊惱,因為我必須把那些 Gemini CLI 處理過的檔案全部重頭檢查一遍,看看是哪個段落遺漏,再補上翻譯。這比對工作不像 git diff 那樣容易,而是必須把原文和譯文兩邊逐段落比對,有點麻煩、傷眼力,所以後來我決定捨棄 Gemini CLI 完成的那些稿件,而採用前面〈階段二〉所描述的工具和方法重新做一遍。重製那些有缺漏的部分之後,再進行校稿。
小結
前述翻譯流程並不是一定無法以 AI 工具全部自動做完。也許我一開始太急躁,把太多工作一次丟給 Gemini CLI,導致我沒發現中間某步驟輸出的結果有瑕疵。後來我理解到,要 AI 做事情,最好把整個流程拆分成許多小步驟,而且每個小步驟的輸出都要驗證(人工檢查)。
此外,如果只要「有東西做出來」就好,那麼文中描述的任務需求,理論上應該可以做到讓 AI 全自動完成。然而,如果沒有人工介入去比對、判斷、修改,其最終成果在可讀性和正確性方面恐怕還是無法達到我希望的品質。
總之,還是那句老話:AI 工具生成的結果不可照單全收。
沒有留言: