翻譯的好壞決定了一本書的生命

前年上資料分析的課，被老師的熱血精神鼓舞了，課後去誠品買了一本讀起來有實際例子可以跑資料分析的統計學教科書，沒想到是災難的開始。讀了幾頁還留著英文句構的中文句子之後就把它丟到一邊去了。

今年要準備考試（大概不會上吧）痛定思痛把它拿起來看，有些句子實在是令人混淆然後也很生硬。好把，找來原文書來對一下。有些地方真的翻得蠻不好的：比方說 sample size 的意思是一個樣本中所包含的資料量，翻譯成「樣本量」很直觀，但放在句子中應該翻譯成「樣本大小」比較好，比方說：一個 n=5 的樣本量，這是在說有五個樣本嗎？但翻譯成「一組樣本大小為 5 的資料」就不會有這個問題。另一句「當樣本量 n 相當大時，\(\bar x\) 的抽樣分配在形態上會近似常態」，這是在說我們有很多樣本的時候，\(\bar x\) 的抽樣分配在形態上會近似常態嗎？不是。原文是在說「（固定樣本數量，如每種都取 500 組但有著不同大小樣本 n=5, 10, 20, 30時），當樣本的大小相當大時，\(\bar x\) 的抽樣分配在形態上會近似常態」所以會造成語意上的誤會。都是英文在直接翻譯成中文時產生的語境落差。

下面這個例子：「The simplest approach to estimating a population characteristic involves using sample data to compute a single number that can be regarded as a plausible value of the characteristic. For example, sample data might suggest that 1000 hours is a plausible value for \(\mu\), the true mean lifetime for lightbulbs of a particular brand. In a different setting, a sample survey of students at a particular university might lead to the statement that .41 is a plausible value for \(p\), the proportion of all students who favor a fee for recreational facilities.」

我試譯作：「估算母體特徵最簡單的方法涉及(involves)使用樣本資料來計算出一個合理的值。舉例來說，樣本資料可能會顯示某個品牌燈泡壽命平均數之合理值是 1000 小時。在另一個情境中，對特定大學學生的抽樣調查可能會得出一個陳述：所有學生贊成休閒設施需要收費的比率之合理值為 0.41 。」

原譯是：「估計一個母體特徵的最簡單途徑，包含使用樣本資料來計算可被視為該特徵之一個可能值的單一數值。例如，樣本資料可能建議 1000 小時為 \(\mu\)，某一特定品牌燈泡之真正平均壽命的一個可能值。在一個不同情境下，在一所特定大學學生的一個樣本調查可能導致 .41 是 \(p\)，所有學生中贊成娛樂設施收費的比率，的一個可能值的陳述」。

P.S.

現在 google 翻譯已經由長足的進步，不知道是訓練資料增加還是模型設計上的進步，我把原文丟進去所得到的結果已經很像人做出的自然翻譯：

「估計總體特徵的最簡單方法是使用樣本數據來計算單個數字，該數字可被視為特徵的合理值。例如，樣本數據可能表明1000小時是 \(\mu\) 的合理值，即特定品牌燈泡的真實平均壽命。在不同的情況下，對特定大學的學生進行的抽樣調查可能得出這樣的說法：.41是 \(p\) 的合理值，\(p\) 是所有贊成娛樂設施費用的學生的比例。」

我們從一些小地方也可以看出 google 翻譯對與中文語境的掌握有很大的進步，比方說不翻譯比較不重要的詞：第一句原譯錯翻成「包含」的「涉及」 involve ，還有第二句連結子句的「即」等等都是。

搜尋此網誌

Statistics Reports for Gamers

翻譯的好壞決定了一本書的生命

留言

張貼留言