2014年10月21日 星期二

谷歌注音輸入法最新統計數據

  我曾將超自然輸入法(或預測型輸入法)的發展分為三個階段(層次),第一階段是充分利用統計技術,第二階段充分利用語法知識,第三階段充分利用語義理解技術。以前幾天發佈的蘋果原生輸入法看來,它對於第一階段的利用已經開發得快到底了,因此,第三方中文輸入法基本已經可以宣告沒戲了。其中的主因在於當前的其他中文輸入法,一來在統計上利用不足,二來對於語法知識的掌握不夠,三來完全沒有所謂的語意理解技術。所以只有當第三方輸入法能邁入第二層次時,開發蘋果第三方中文輸入法才有意義。但即使如此,由於蘋果當前的取碼數「在最理想狀態下(由於前一篇以及以下各篇的統計數據都排除了注音、拼音首字輸入的試錯按鍵數,因此數據看起來非常好。但如果包含這部份的按鍵數,則每一家的平均取碼數都至少要再拉高取碼數0.1-0.5左右)」已經1.4左右。因此,一般使用者不可能察覺那些取碼數在1.4以上或左右徘徊的輸入法的好處。所以,如果有人說中文第三方輸入法將在蘋果系統形成百家爭鳴的態勢,個人覺得那是天方夜譚。確實,可以有很多人繼續投入開發,但鐵定沒戲。尤其當使用者懂得用客觀的數據而非主觀的感受來衡量一個輸入法的好處時。
  自然,如果以超自然輸入法已經完成(包含設計思想)的部份,那麼蘋果原生中文輸入法即便是在第一階段也還有不少可以改進的地方,這些地方都改進後,即便尚未使用第二階段的技術,也足以將取碼數再降零點幾個百分點。這部份的「細節」或「技術」(目前寫於拙作《中文資訊處理》〈輸入法〉一章之中),等超自然輸入法正式發表後,再來談談。
  以下是對谷歌注音輸入法的最新測試,同樣採用首字輸入混合輸入,並取最好的結果加以記錄(因此事實上沒有人可以剛好第一次就全打出最好的結果)。統計結果可能隨著使用者的個人使用習慣而略有改變。統計樣本雖然小了一點,但還有些參考價值。畢竟人力與時間不足,因此只能用這樣小的樣本來加以統計,這一點請見諒。從這次的統計結果看來,谷歌的進步比較少,或者可能其實沒有更新(不太可能),但不管如何,以這次試驗的結果看來,蘋果幾乎完勝了谷歌。
  這一次挑選的句子,其實是很普通的句子,同時也沒有牽涉到人名、地名等。事實上,輸入法本身還得具備人名、地名識別等功能,所謂的「學習」功能才算達標。這一點,也等超自然輸入法推出後再來詳論。
  統計數據請見以下表格:
原句 長度 按鍵數 比率
你還好嗎 4 5 1.25
記得把東西放到冰箱 9 11 1.222222
要約幾點 4 12 3
我跟別人有約了 7 13 1.857143
今天想去哪吃 6 11 1.833333
我今天早上沒吃早餐 9 13 1.444444
什麼時候回家 6 8 1.333333
最近還好嗎 5 10 2
可以幫我一件事嗎 8 16 2
東西我已經發過去了 9 14 1.555556
你查收一下 5 10 2
在嗎 2 4 2
請儘快回覆 5 6 1.2
老闆通知週末加班 8 14 1.75
什麼時候是最後期限 9 12 1.333333
去樓下等我 5 10 2
五分鐘後 4 5 1.25
記得給我帶東西 7 14 2
我會晚點到 5 12 2.4
現在比較忙 5 7 1.4
怎麼可能 4 5 1.25
我會處理好 5 7 1.4
讓別人代替我先去一下 10 18 1.8
不可能的吧 5 7 1.4
快告訴我 4 6 1.5
你在哪裡 4 5 1.25
我在等你 4 5 1.25
週末小聚一下如何 8 14 1.75
有事請教你 5 8 1.6
還有其他的嗎 6 7 1.166667
還要等幾天 5 11 2.2
你看了嗎 4 7 1.75
回去再說吧 5 6 1.2
沒人知道的 5 7 1.4
就這樣吧 4 6 1.5
待會見 3 11 3.666667
你說這樣就這樣 7 8 1.142857
等我再檢查一次 7 12 1.714286
沒問題 3 3 1
等一下 3 5 1.666667
我還沒出發 5 8 1.6
東西還滿意嗎 6 7 1.166667
你有沒有想我 6 8 1.333333
  240 388 1.616667

2014年10月20日 星期一

蘋果輸入法最新測試


  




由於距離去年發表「超自然輸入法」的原型測試影片以來,已經接近一年了。因此,這一年來幾乎所有大企業(智能手機)的輸入法都應該獲得大幅度的改進。有鑑於此,為了體現最新的輸入法發展「局勢」,因此,筆者重新挑選了43句對各家輸入法進行測試。這一次,我們首先測試蘋果輸入法。測試的規則如下:
  一、輸入注音或拼音的音符,每一次計一。
  二、選擇輸入法選單欄位,每按一次計一。
  三、打開下拉式選單或滑動一次選單(蘋果選單可滑動),每滑一次計一。

  iOS 8 發佈後,蘋果中文輸入法有了飛躍式的增長。第一個改進,其中一如幾個月前的預測,在使用者尚未輸入任何字元時(或使用者按下斷行號,或按下標點後),蘋果已經有了預設選單!切莫小看這樣一個簡單到極點的改進,以之前超自然85%的預測選單的準確率來計算,假設有一億人「每天」選擇了這個預設選單兩三次,那節省下來的時間與能源,已經非常「可觀」!第二個改進,之前打「幾點下課」,假設「課」打錯了或選錯了,刪除了那個字元後,選單並不會自動再出現「課」(此時字幕上是「幾點下」,選單應該包含「課、班」等。),現在已經可以了。這表示,蘋果已經加入了中文分詞的技術(超自然一開始就加入了)。第三個改進,自動學習功能,以圖片中的例句(見截圖):「你說這樣就這樣」,當電腦學習後,下次再打,幾乎可以「從頭選到尾」:「你(句首預測預設選單)說(預測選單)這樣(預測選單)就(預測選單)這樣(預測選單)」。第四個改進,繁體中文注音輸入法增加了「首字輸入」選項。(簡體拼音系統老早就具備首字輸入了)
  其他比較次要的改進,就不多說。結論是,蘋果的原生輸入法藉由這些改進,使得整體效率大幅提昇,取碼數從2.3降低到1.4左右。基本上已經逼近了之前筆者說過的1.3門檻。也就是說,第三方輸入法(中文)幾乎無法在iOS的環境下存活了!因此奉勸有志於開發第三方輸入法的開發者可以放棄了蘋果了。因為,基本上不可能有賣點的。
  至於超自然輸入法,自然早就料想到今日的局面。只是從去年的幕資計畫上那冷清的反應看來,大概都能料到,真正高超的技術要在台灣獲得青睞,並不容易。而以上蘋果的改進,也都是一如預期的!(超自然第一版自然比這還先進一點)所以,當使用者認為蘋果輸入法好用時,切莫忘記,這樣好用的輸入法,原本是可以「土生土長」的。
  蘋果原生輸入法統計數據如下:
原句 長度 按鍵數 比率
你還好嗎 4 6 1.5
記得把東西放到冰箱 9 10 1.111111
要約幾點 4 12 3
我跟別人有約了 7 10 1.428571
今天想去哪吃 6 11 1.833333
我今天早上沒吃早餐 9 12 1.333333
什麼時候回家 6 7 1.166667
最近還好嗎 5 7 1.4
可以幫我一件事嗎 8 15 1.875
東西我已經發過去了 9 13 1.444444
你查收一下 5 9 1.8
在嗎 2 4 2
請儘快回覆 5 6 1.2
老闆通知週末加班 8 9 1.125
什麼時候是最後期限 9 16 1.777778
去樓下等我 5 8 1.6
五分鐘後 4 9 2.25
記得給我帶東西 7 10 1.428571
我會晚點到 5 8 1.6
現在比較忙 5 6 1.2
怎麼可能 4 5 1.25
我會處理好 5 6 1.2
讓別人代替我先去一下 10 11 1.1
不可能的吧 5 6 1.2
快告訴我 4 5 1.25
你在哪裡 4 5 1.25
我在等你 4 5 1.25
週末小聚一下如何 8 10 1.25
有事請教你 5 12 2.4
還有其他的嗎 6 8 1.333333
還要等幾天 5 8 1.6
你看了嗎 4 6 1.5
回去再說吧 5 7 1.4
沒人知道的 5 6 1.2
就這樣吧 4 6 1.5
待會見 3 6 2
你說這樣就這樣 7 9 1.285714
等我再檢查一次 7 11 1.571429
沒問題 3 4 1.333333
等一下 3 4 1.333333
我還沒出發 5 8 1.6
東西還滿意嗎 6 7 1.166667
你有沒有想我 6 7 1.166667
  240 350 1.458333




2014年4月27日 星期日

孫子兵法中翻英與谷歌自動翻譯00012

  最近一直在忙著「超自然輸入法」的收尾階段,其實無暇顧及於此。估計接下來的半個月或更忙。因此今天寫一篇交代一下。
  生、死、輪迴。
  「預知、預測」未來一個重要目的是趨吉避凶,因此關於被預測者的生與死、被預測家族的興盛與衰弱、被預測國家的崛起與滅亡,便是其中最被關注的一塊。在整個《預見未來》的智者群中,預測一個人的死亡或滅亡(滅亡通常伴隨著死亡之外的事情,譬如一個人導致一個家族、一個國家的消落等。),更是常見的例子。有些是預測一個人何時死亡!有些是預測一個人能不能得善終!有些則是預測一個人是否會遇到災難!預測的手法,非常多樣,從一個人的生理狀態(如華佗)到一個人的行事作風(如子貢),以致於純然的以命理、相術進行預測(如管輅),這些例子都不少見。
  比較有名的例子,大概是子貢預測魯定公的死亡,孫臏預測龐涓的死期、死地,司馬懿預測諸葛亮將死等等。很多是大家耳熟能詳的,很多則顯得陌生。這其中也有值得一談的現象,譬如叔孫豹預言了慶封的死期,但卻是季札預測了叔孫豹的死期!岑文本預測了馬周的死期,但卻是唐太宗預測了岑文本的死期!這體現出了預測者本身並非全能的一個普遍現象。有些知道自己必死,也坦然面對,甚至指導對手如何殺死自己!(也就是別歹戲拖棚了)
  其實還蠻精采的!因此,第一冊《預見未來》,筆者就以預測個人的生死的例子作為開端!大概也就十個單元一個小冊。每一冊都有一個篇名或卷名,因此這一卷可以稱為「彩蛋篇」。
  關於生死,《孫子兵法》也有兩則相關的譯文:
一、
  終而復始,日月是也;死而復生,四時是也。(《‪#‎孫子兵法‬》〈‪#‎勢‬〉)
  (奇、正)結束了又再開始,就像日、月的交替轉換;死去了又再出生,就像四季的輪替循環。(白話翻譯)
  Google中翻英:The end of the beginning again, just like the day, month alternating conversion; died born again, just like the seasons rotation cycle.
  For they end and recommence; cyclical, as are the movements of the sun and moon. They die away and are reborn; recurrent, as are he passing seasons.(‪#‎SamuelB‬. Griffith)
  Google英翻中:對於他們結束和重新開始;週期性的,因為是太陽和月亮的運動。他們死了和重生;反复發作,因為他是路過的季節。
   like the sun and moon, they end but to begin anew; like the four seasons, they pass away to return once more.(‪#‎Lionel‬ Giles)
  Google英翻中:像太陽和月亮,他們最終只能重新開始;像四季,他們去世返回一次。
二、
  五行無恒勝,四時無常立;日有短長,月有死生。(《#孫子兵法》〈‪#‎實虛‬〉)
  五行沒有永遠取勝的一方,四季沒有總是停留在某一季;日照的時間有長有短,月亮的形狀有盈有虧。(一切都是變化著的。)(白話翻譯)
  Google中翻英:Five party do not always win seasons do not always stay in a certain quarter; sunshine time have long or short, the shape of the moon has a surplus or lose. (Everything is changing.)
  Of the five elements, none is always predominant; of the four seasons, none lasts forever; of the days, some are long and some short, and the moon waxes and wanes.(#SamuelB. Griffith)
  Google英翻中:五行的,沒有始終佔主導地位;四季,沒有永遠持續;的日子,有些是長和短一些,月亮蠟和減弱。
  The five elements (water, fire, wood, metal, earth) are not always equally predominant; the four seasons make way for each other in turn. There are short days and long; the moon has its periods of waning and waxing.(#Lionel Giles)
  Google英翻中:五行(水,火,木,金,土)並不總是同樣優勢;四季讓位給對方反過來。有天短長;月亮有減弱和打蠟,其週期。
  關於「生、死」,語言在演進的過程中,在一些新的概念還未明晰之前,往往人們會用一些舊有的概念來替換。有時候,則是基於文學修辭的因素,而使用了一些比較生動的說法。因此「死、生」也可以理解、翻譯為「消失、出現」。四季、月亮都是如此,消失了,又出現,就像死去了又重生一般!
  生、死、輪迴!無止無盡!

2014年4月8日 星期二

孫子兵法中翻英與谷歌自動翻譯00011

  幾年前,iPhone還沒大火紅的時候,一位上海的朋友拿了一堆古籍英文問我是出自哪些典籍?前後大概十幾條,原來是他想要開發一個經典名句的App,順便考考我。我只答錯了一題,很像是出自《論語》的一句。但事實上那句翻譯有問題。其中,有談到《孫子兵法》的部份,譯文把「天」翻譯成「Sky」,我覺得翻譯成「Sky」不太對(指〈計〉篇),於是他說還有翻譯成「Heaven」的,我覺得那更扯。當然「Heaven」也可以翻譯成「天上、天空」,但至少許多人使用這個詞的時候是指「天堂」。兵法為什麼教人懂「天堂」?一本春秋時代的兵法又為什麼要它的讀者理解「天空」?那時候可沒什麼空戰、飛機之類的。事實上,從《孫子兵法》自身,譬如上次提到的〈火攻〉篇,以及所有先秦兵法、整部中國戰爭史(近現代以外),都知道,是「天候、天氣、氣候」對戰爭本身產生了極大的影響,而不是「天空」。在《孫子兵法》裡可以翻譯成「Sky」的只有幾個地方,譬如〈形〉篇的「九天」是比喻很高的天空。上次提到的〈火攻〉篇「時者,天之燥也」也直接翻譯為「天氣」。筆者在《策略的哲學》中也總結了古代戰爭中影響勝敗的一些因素,其中一個就是「天候」。同時也是孫子、吳起等人非常重視的因素。因此以下,我們就針對關於「天」的兩句翻譯做比較:
  此外,筆者最近打算把自己的著作全部轉移到Google Play Books販賣,不再自己銷售了。同時,售價上也會調低很多。過幾天,可能還會有一個優惠措施出來。因此,有興趣購買的讀者,可以稍待片刻。至於另一本書《預見未來》,由於筆者製造的電子書在Google Play Books上的銷售總量今天已經來到「4270」本。因此,筆者也打算改變策略。之前有一些組織統計過,電子書的字數最好維持在二萬字左右,一般讀者比較能接受。當然,篇幅與售價有關,因此二萬字的售價就不會太高,讀者的接受度更高。《預見未來》精華版後面付了一張表格,大概有五百位預言者(今天有熱心的讀者貢獻了「趙烈文預測清朝將要滅亡」的故事,改天再來談。),我想每天寫一篇也得寫兩年。但基本上筆者也沒這時間。最近一個月這個世界發生了一些怪事或大事,譬如馬航消失了,譬如服貿事件。馬航消失了,但因為找不到飛機,於是產生了資訊爆炸,一大堆臆測、猜測,一大堆專家分析,但飛機仍然沒找到。服貿事件也引爆了一場大爭論,一時間眾多人馬都成了「大預言家」,一大堆的推論、說法、預測,也困惑了很多人,這些人有些已經不知道怎麼樣去區分對的與錯的,甚至無法分析那些離奇古怪的論點。更離譜的是,很多人把焦點放在服貿,彷彿服貿成了唯一影響他們行業與個人盛衰存亡的因素,從而把其他更急迫的因素給完全摒棄了。最終,多數人回歸到本性,只選擇自己願意相信的。一個知識問題,轉變成了一個信任問題。《#預見未來》裡也有很多針對同一件事的預言,有些預言時間與實現時間遠一點,有些近一點,這之間的規律、規則是什麼?對於人們判斷一件事有哪些助益?顯然,這是非常切合當前氛圍的一個哲學、思想方法的探討。因此,筆者也將主要先從這部份的案例說起,並從中建構一套思考框架。相信這些內容可以幫助一些人走出知識(不管真假)的迷宮。

  以下翻譯:
  天者:陰陽、寒暑,時制也。(《#孫子兵法》〈#計〉)
  「天」是指:天氣的陰陽、天候的寒暑,它們的變化轉換是由時間來控制的。(白話翻譯)
  Google中翻英:"Day" means: the yin and yang weather, weather of summer and winter, they change by the time the conversion is controlled.
  By weather I mean the interaction of natural forces; the effects of winter's cold and summer's heat and the conduct of military operations in accordance with the seasons.(#SamuelB. Griffith)
  Google英翻中:受天氣我的意思是自然力量的相互作用;冬天的寒冷和夏季的高溫和軍事行動按照季節進行的效果。

  Heaven signifies night and day, cold and heat, times and seasons.(#Lionel Giles)
  Google英翻中:天堂標誌著晝夜,寒暑,時間和季節。

  從這裡不難看出Samuel與Lionel的翻譯,都差強人意。但至少Samuel把「天」理解為「weather」是正確的。「Heaven」的翻法,確實太誇張了。

2014年4月3日 星期四

孫子兵法中翻英與谷歌自動翻譯00010

  清「明」節快到了,我們把〈#火攻〉篇做個結束吧。清明節,是我喜歡的節日之一,因為這個節日提醒我們要:飲水思源!
  〈#火攻〉講些什麼?那些古代的用兵知識,對於現代的社會、不同的領域有些什麼作用?當讀者開始這麼思考古代兵法時,就已經開啟了學好它的那道門。火,其實就是一種武器。它可以用來消滅敵人的有生力量、毀滅敵人的物資、擾亂敵人的秩序。因此〈火攻〉篇首先告訴讀者,要攻擊哪些目標!而不是隨意的攻擊、漫無目的的放火。
  「火」受制於「風」,因此要把火攻玩好,就必須掌握天候、看準時機。否則等沒風的時候才來放火,或者處在下風卻放火,那結果都不會太好。
  那麼用火攻擊敵方時,整個互動過程有哪些常見的問題、現象、規律,怎麼應對、掌控、利用?這便是孫子接下來要講的。
  最後一段,是孫子從火攻聯想到了戰爭。不僅戰爭像火、怒火也像火,而戰火可能由怒火點燃。但戰爭不是兒戲,人被火燒死了、國家被火燒毀了,都無法再回復到以前的狀態了。因此孫子最後告誡君主、將帥,不要因為自己的怒火而點燃戰火。
  而《左傳》的一句關於「火」的名言,更是傳頌千古:「夫兵猶火也,弗戢,將自焚也。」玩火卻不懂得分寸,很容易就燒傷自己。
  此外,從這段日子貼上來的自動翻譯的成果看來,其實如果以「感覺」而論,個人認為並沒有比五年前好多少,甚至退步了。但事實上,整個世界的數據量每天都在海量的增加,因此也可見筆者之前所陳述的一個觀點,那就是大數據的方法有其侷限性(當然每一種方法都可能有局限性,這裡針對的是那些把大數據大吹特吹的人的論點)。此外,自動翻譯的成果也可能反過頭來影響自動翻譯的品質,因此,如果谷歌未來的演算法沒有產生大的變革的話,一個好的自動翻譯的品質,恐怕很難讓人期待。尤其在我們看到微軟之前在手機發佈會時,炫耀了一段即時翻譯、即時語音合成(類似不可能的任務裡面合成敵人聲音的技術,但讓說英文的人得以用他自己的語音說出翻譯好的中文。),如果真的要大規模檢驗的話,恐怕也是靠不住的。(對於Bing的翻譯成果,可見「中文魔方」的部份探索。嚴格說來,谷歌的技術還是領先很多。)

  以下:

  火攻,必因五火之變而應之。火發於內,則軍應之於外。火發,其兵靜而勿攻,極其火央,可從而從之,不可從而止之。火可發於外,無待於內,以時發之。火發上風,無攻下風。晝風久,夜風止。凡軍必知五火之變,以 數守之。故以火佐攻者明,以水佐攻者強。水可以絕,不可以奪。(《#孫子兵法》〈#火攻〉)
  使用火攻的時候,一定要憑藉著五種火勢的變化而做出相應的行動。這五種火勢的變化是指:
  (一)如果是從敵人的內部發動火攻,那麼軍隊就在外面發動進攻,做為接應。
  (二) 火攻發動了,敵軍卻很安靜,那就先不要攻擊他,等火勢擴大到極限後,可以追擊就追擊,不可以追擊就停止。
  (三)火攻可以從敵人外部發動,就不要等待從敵人內部發動,憑藉時機來決定發火的時間。
  (四)火攻在上風處發動,就不要攻擊在下風處的敵人。
  (五)白天的風如果吹得久,夜晚的風往往就會停止。凡是軍隊的統帥一定要知道這五種火攻的變化,用規律來掌控它。所以用火來輔助攻擊的將帥顯示出「明亮」的特質,用水來輔助攻擊的將帥顯示出「堅強」的特質。水攻可用來阻絕敵方,但不可用來奪取敵方的物資。(白話翻譯。)

  Google中翻英:
When using a fire attack must be by virtue of the fire and made ​​five changes accordingly. The five changes in the fire means:
(A) if it is to launch an internal fire attack from the enemy, then the army launched an offensive on the outside, as collusion.
(B) Fire Attack launched, the enemy is very quiet, it is the first not to attack him, and so the spread of fire to the limit, you can chase on the chase, not chase it stops.
(C) Fire will be launched from an external enemy, do not wait for the launch from the enemy, with the opportunity to determine the ignition time.
(D) Fire Attack upwind launch, do not attack the enemy downwind.
(E) If the wind blew a long day, the night wind often stops. Any military commander must know these five Huogong change, using the law to control it. Therefore, the use of fire marshals to assist the attack showed "bright" character, generals water to aid the attack showed "strong" character. Water can be used to block the enemy's attack, but can not be used to capture the enemy's supplies. (Vernacular translation.)

  Now in fire attacks one must respond to the changing situation.
When fire breaks out in the enemy's camp immediately co-ordinate your action from without. But if his troops remain calm bide your tie and do not attack.
When the fire reaches its height, follow up if you can. If you cannot do so, wait.
If you can raise fires outside the enemy camp, it is not necessary to wait until they are started inside. Set fires at suitable times.
When fires are raised up-wind do not attack from down-wind.
When the wind blows during the day it will die down at night.
Now the army must know the five different fire-attack situations and be constantly vigilant.
Those who use fire to assist their attacks are intelligent; those who use inundations are powerful.
Water can isolate an enemy but cannot destroy his supplies or equipment.
  (#Samuel B. Griffith)
  Google英翻中:
現在,在火力攻擊一個人必須應對不斷變化的形勢。
當發生火災時在敵人的陣營立刻未經協調的行動。但是,如果他的部隊保持冷靜硬質合金你的領帶和不攻擊。
如果你能當火達到它的高度,跟進。如果你不能這樣做,請等待。
如果你能提高敵方陣營以外的火災,這是沒有必要等待,直到他們在裡面開始。放火在適當的時間。
當火災復活風不從下風進攻。
當風在白天吹就會平靜下來,晚上。
現在,軍隊必須知道的五個不同的火攻擊的情況,並要時刻警惕。
那些誰使用火,以協助他們的攻擊是很聰明;那些誰使用氾濫是強大的。
水可以隔離一個敵人,但不能破壞他的物資或設備。

  In attacking with fire, one should be prepared to meet five possible developments:
(1) When fire breaks out inside to enemy's camp, respond at once with an attack from without.
(2) If there is an outbreak of fire, but the enemy's soldiers remain quiet, bide your time and do not attack.
(3) When the force of the flames has reached its height, follow it up with an attack, if that is practicable; if not, stay where you are.
(4) If it is possible to make an assault with fire from without, do not wait for it to break out within, but deliver your attack at a favorable moment.
(5) When you start a fire, be to windward of it. Do not attack from the leeward.
A wind that rises in the daytime lasts long, but a night breeze soon falls.
In every army, the five developments connected with fire must be known, the movements of the stars calculated, and a watch kept for the proper days.
Hence those who use fire as an aid to the attack show intelligence; those who use water as an aid to the attack gain an accession of strength.
By means of water, an enemy may be intercepted, but not robbed of all his belongings.
(#Lionel Giles)
  Google英翻中:
在用火攻擊,一應準備,以滿足五種可能的發展:
( 1 )當發生火災時內到敵方陣營,響應立即從沒有攻擊。
( 2 )如果有火警發生,但敵人的士兵保持沉默,等待時機,並沒有發作。
( 3)當火焰的力量已經達到了它的高度,跟進與攻擊,如果這是可行的;如果不是,留你在哪裡。
( 4 )如果有可能使火從外部的攻擊,不要等它內打出來,但提供你的攻擊在一個有利的時機。
( 5 )當您啟動火災,是它的上風。不要從下風進攻。
升起在白天的風持續時間長,但晚風很快下降。
在每一個軍,這五個發展與消防連接必須是已知的,計算的星星,手錶的運動保持適當的日子。
因此,那些誰使用火作為一種輔助手段,攻擊展會情報;那些誰使用水作為一種輔助手段,攻擊獲得力量的加入。
借助於水,敵人可能會被攔截,而不是搶了他所有的家當。

2014年3月25日 星期二

孫子兵法中翻英與谷歌自動翻譯00009


  〈火攻〉篇,就要接近尾聲了。今天要談的這句,與今本有很大差異的。「弗留」一般做「費留」,「費留」根本不通,也因為不通,所以很多註釋家為了把不通的說通,居然耗費了兩萬字去解釋它,可以與當年漢朝許慎時為了解釋一個「馬」字用了五萬字還說不清楚相提並論。然而就校勘學、訓詁學而言,「弗、費」互相「假借」(多數假借其實都是一種錯誤,很多情況是寫字的人不知道怎麼寫的情況下借了一個字來寫。)的情況只是很普遍的現象,普遍到隨便都能舉出例子。(請見〈孫子兵法論正.火攻.三〉(http://www.cos.url.tw/sunzi/Sun-3-12.htm#八.))然而因為多數的註釋家校勘學、訓詁學、文字學、音韻學的底子不厚,或者根本不清楚這些學問。因此,只好開始掰。即便曹操也不例外。但曹操的多數註釋只要不牽涉到以上學問的,都有很高的質量,因為他具備了軍事學的知識(別忘了他也是歷史上僅有的幾個能玩錦囊妙計的高手)。但很多註釋家其實對兵法、策略、戰略、戰術的理解不夠,即便一些很有名氣的人也是如此。所以大家現在看的一般通行本的《#孫子兵法》正充滿著類似這樣的錯誤。這些我們以後都會陸續看到,就略過不提。
  此外,最近台灣服貿問題吵得很兇。有利有弊,當然老讀者應該知道我不談這些的原因。因此在此我也不談,只是其中有一個現象頗引起我的注意。就是好像在這個期間裡,台灣突然出了一大堆的艾文托佛勒、凱文凱利、大前研一、席佛奈特一樣,突然間大師輩出,每一個人都能清楚的預測未來、描繪未來的輪廓了。這也讓我決定,四月份開始陸續將春秋卷這些幾乎沒參考其他人翻譯的部份,加上一些新的章節,看能否在四月底前把春秋戰國的部份完全翻譯完成,獨立成《#預見未來》東周卷,放在Google Play Books上出版。至於是否放上個人預測的部份,我會斟酌。不過美國大選很快又要開始啟動了,全世界都在看,都在猜,希拉蕊是否會成為美國第一任女總統。確實,我記得今年曾經在網路上看過一個叫做「埃德加.凱西(Edgar Cayce,生於1877年,逝於1945年。) 」的美國預言家曾經精準預言美國第44任總統是黑人。於是我們會好奇,那麼他有預測什麼時候美國會出一個女總統嗎?(第46任?)如果沒有,美國會出女總統嗎?
  在《#預見未來》,自然筆者會為埃德加.凱西獨立一章出來討論,當然,前提是他的預言是確實可信的!

  以下,〈火攻〉篇,這一段筆者的白話翻譯,目前看來我覺得還有修改的空間。不過大抵意義都到了。這段文字,其他白話與筆者的已經差異很大,兩位前輩的英譯部分自然差異更大了,以致於連討論的必要都沒有了。

  夫戰勝攻取,不修其政者,凶!命之曰弗留。(《#孫子兵法》〈#火攻〉)
  作戰取勝、攻城拔取,然而卻不修行德政的軍隊(應該改為:君主、將軍在佔領地卻不修行德政的),會有凶險!這樣的作法被稱為:不可停留。(白話翻譯。)
  Google中翻英:Fighting to win, disconnect the siege, but did not practice benevolent army(Monarchs, generals do not practice benevolent occupation of land), there will be dangerous! Such a practice is called: Do not stay.

  Now to win battles and take your objectives, but to fail to exploit these achievements is ominous and may be described as 'wasteful delay'.(#Samuel B. Griffith)
  Google英翻中:我們可以打勝仗,並把你的目標,但並不能夠利用這些成果是不祥的,並可以被描述為“浪費延遲”。

  Unhappy is the fate of one who tries to win his battles and succeed in his attacks without cultivating the spirit of enterprise; for the result is waste of time and general stagnation.(#Lionel Giles)
  Google英翻中:不高興是誰試圖贏得他的戰鬥並成功在他的攻擊沒有培育企業精神的命運,因為結果是時間和一般停滯浪費。

2014年3月19日 星期三

孫子兵法中翻英與谷歌自動翻譯00008

  相信很多讀者都會有疑問,像〈#火攻〉篇這樣的兵法思想,在當代還有用處嗎?在其他領域還有用處嗎?能發出這樣的疑問,是學好兵法的關鍵。事實上,《#孫子兵法》是一本擁有高度抽象化的用兵思想的兵法。像〈#火攻〉這樣的篇章,我們可以去思考,為什麼火攻在當時是重要的,它想要達到什麼樣的目的?它能達到什麼樣的目的?有哪些歷史實例可參考?
  火,可以燒毀一切。包含人、物資,而軍隊沒有物資(糧食、裝備、武器、交通工具)就沒有多大的作用了,沒有人就更不會有力量。火不僅可以燒毀一切,還可以製造混亂,可以製造恐懼,從而破壞敵人的整體力量。火攻製造的煙霧,也能蒙蔽敵人、或使敵人短暫喪失攻擊的能力。通常,地道戰時會用到煙霧,因此早在戰國時代的墨子就發明了把醋抹在眼睛上以消除煙霧對眼睛的傷害的方法。
  歷史上最著名的用火攻的例子,當屬於班超。永平十六年(73年),班超以36個人的「陣容」秉著「不入虎穴,焉得虎子」的勇氣,趁著夜晚用火攻,擊敗了數倍於自己的匈奴使者軍隊,威震整個西域。
  兵法中對付敵方火攻的策略,也被探討過。譬如《六韜》就曾指出,如果敵方在草地上放火攻擊我方,我方可以先自己燒掉自己所在地的野草、植物,以藉此得到一個安全的地點(因為這個地點已經不再有東西可以燒了),避免自己陣營因為逃避濃煙、野火,而亂了秩序,被敵人趁機了結。這其實接近於現代消防隊使用的「開闢防火道(防火線)」的策略。
  從「攻火有五」,我們也不難看出當代通行本的明顯錯誤,「五」就是五種目標,但當代的版本的第五個都因為文字上的訛誤而被曲解為一種「武器」。在我們展開整個英譯計畫的過程裡,我們還會看到更多、更荒謬的錯誤所造成的誤解。因此,曾經有人在爭論,既然《#孫子兵法》早在18世紀就在法國出版了(法國耶穌會士錢德明(Jean Joseph Marie Amiot)在巴黎於1772年出版,書名是Art Militaire des Chinois。),那麼拿破崙(Napoleon)是否看過《#孫子兵法》?
  不管拿破崙是否看過《#孫子兵法》,由於錢德明所根據的版本有著太多錯誤,同時經過一次翻譯,又產生一次失真,就算拿破崙真的看過《#孫子兵法》,也很難說真的能對他的用兵思想產生多大的影響(想想看錯誤的東西影響他是好還是壞?即便偶然因此成功都不能算是《#孫子兵法》的功勞)。何況,《#孫子兵法》不像《#戰爭論》,它不需要「名人、名將」來背書,也依然能在世界上繼續的綻放它的光芒。更真實的是,從春秋末年這本書誕生以來,它就一直在影響著整個中國歷史,而這是歷史學者不會告訴你,甚至是他們自己也意識不到的事情!(詳見《#孫子兵法論正》)
  附帶一提:目前我已將《#孫子兵法》(原文)、《#孫子兵法論正》、《#孫子兵法白話翻譯》都放到 Google Play Books 上了。值得慶祝的一天:319。

  凡攻火有五:一曰火人,二曰火積,三曰火輜,四曰火庫,五曰火地。(《#孫子兵法》〈#火攻〉)
  凡是使用火攻有五種主要目標:第一種是用火燒人,第二種是用火燒蓄積,第三種是用火燒裝備,第四種是用火燒倉庫,第五種是用火燒草地。(白話翻譯)
  Google中翻英:Any use Huogong There are five main objectives: (嗯,這句實在有點……)the first is people with fire, and the second is the accumulation by fire, and the third is to use fire equipment, fire is the fourth warehouse, fifth with fire grass.

  There are five methods of attacking with fire. The first is to burn personnel; the second, to burn stores; the third, to burn equipment ; the fourth, to burn arsenals; and the fifth, to use incendiary missiles.(#Samuel B. Griffith)
  Google英翻中:有火攻擊的五種方法。首先是燃燒人才;第二,燒店,第三,燃燒設備;第四,燒庫,以及第五,使用燃燒彈導彈。

  There are five ways of attacking with fire. The first is to burn soldiers in their camp; the second is to burn stores; the third is to burn baggage trains; the fourth is to burn arsenals and magazines; the fifth is to hurl dropping fire amongst the enemy.(#Lionel Giles)
  Google英翻中:有五種方法用火攻擊的。首先是燒士兵在他們的營地,二是燒店,第三是燃燒行李車;第四是燃燒武庫雜誌;五是投擲火下降之中的敵人。

相片:  相信很多讀者都會有疑問,像〈#火攻〉篇這樣的兵法思想,在當代還有用處嗎?在其他領域還有用處嗎?能發出這樣的疑問,是學好兵法的關鍵。事實上,《#孫子兵法》是一本擁有高度抽象化的用兵思想的兵法。像〈#火攻〉這樣的篇章,我們可以去思考,為什麼火攻在當時是重要的,它想要達到什麼樣的目的?它能達到什麼樣的目的?有哪些歷史實例可參考?
  火,可以燒毀一切。包含人、物資,而軍隊沒有物資(糧食、裝備、武器、交通工具)就沒有多大的作用了,沒有人就更不會有力量。火不僅可以燒毀一切,還可以製造混亂,可以製造恐懼,從而破壞敵人的整體力量。火攻製造的煙霧,也能蒙蔽敵人、或使敵人短暫喪失攻擊的能力。通常,地道戰時會用到煙霧,因此早在戰國時代的墨子就發明了把醋抹在眼睛上以消除煙霧對眼睛的傷害的方法。
  歷史上最著名的用火攻的例子,當屬於班超。永平十六年(73年),班超以36個人的「陣容」秉著「不入虎穴,焉得虎子」的勇氣,趁著夜晚用火攻,擊敗了數倍於自己的匈奴使者軍隊,威震整個西域。
  兵法中對付敵方火攻的策略,也被探討過。譬如《六韜》就曾指出,如果敵方在草地上放火攻擊我方,我方可以先自己燒掉自己所在地的野草、植物,以藉此得到一個安全的地點(因為這個地點已經不再有東西可以燒了),避免自己陣營因為逃避濃煙、野火,而亂了秩序,被敵人趁機了結。這其實接近於現代消防隊使用的「開闢防火道(防火線)」的策略。
  從「攻火有五」,我們也不難看出當代通行本的明顯錯誤,「五」就是五種目標,但當代的版本的第五個都因為文字上的訛誤而被曲解為一種「武器」。在我們展開整個英譯計畫的過程裡,我們還會看到更多、更荒謬的錯誤所造成的誤解。因此,曾經有人在爭論,既然《#孫子兵法》早在18世紀就在法國出版了(法國耶穌會士錢德明(Jean Joseph Marie Amiot)在巴黎於1772年出版,書名是Art Militaire des Chinois。),那麼拿破崙(Napoleon)是否看過《#孫子兵法》?
  不管拿破崙是否看過《#孫子兵法》,由於錢德明所根據的版本有著太多錯誤,同時經過一次翻譯,又產生一次失真,就算拿破崙真的看過《#孫子兵法》,也很難說真的能對他的用兵思想產生多大的影響(想想看錯誤的東西影響他是好還是壞?即便偶然因此成功都不能算是《#孫子兵法》的功勞)。何況,《#孫子兵法》不像《#戰爭論》,它不需要「名人、名將」來背書,也依然能在世界上繼續的綻放它的光芒。更真實的是,從春秋末年這本書誕生以來,它就一直在影響著整個中國歷史,而這是歷史學者不會告訴你,甚至是他們自己也意識不到的事情!(詳見《#孫子兵法論正》)
  附帶一提:目前我已將《#孫子兵法》(原文)、《#孫子兵法論正》、《#孫子兵法白話翻譯》都放到 Google Play Books 上了。值得慶祝的一天:319。

  凡攻火有五:一曰火人,二曰火積,三曰火輜,四曰火庫,五曰火地。(《#孫子兵法》〈#火攻〉)
  凡是使用火攻有五種主要目標:第一種是用火燒人,第二種是用火燒蓄積,第三種是用火燒裝備,第四種是用火燒倉庫,第五種是用火燒草地。(白話翻譯)
  Google中翻英:Any use Huogong There are five main objectives: (嗯,這句實在有點……)the first is people with fire, and the second is the accumulation by fire, and the third is to use fire equipment, fire is the fourth warehouse, fifth with fire grass.

  There are five methods of attacking with fire. The first is to burn personnel; the second, to burn stores; the third, to burn equipment ; the fourth, to burn arsenals; and the fifth, to use incendiary missiles.(#Samuel B. Griffith)
  Google英翻中:有火攻擊的五種方法。首先是燃燒人才;第二,燒店,第三,燃燒設備;第四,燒庫,以及第五,使用燃燒彈導彈。

  There are five ways of attacking with fire. The first is to burn soldiers in their camp; the second is to burn stores; the third is to burn baggage trains; the fourth is to burn arsenals and magazines; the fifth is to hurl dropping fire amongst the enemy.(#Lionel Giles)
  Google英翻中:有五種方法用火攻擊的。首先是燒士兵在他們的營地,二是燒店,第三是燃燒行李車;第四是燃燒武庫雜誌;五是投擲火下降之中的敵人。

2014年3月15日 星期六

預見未來:景陽

景陽

  前44年,3月15日。凱撒被刺23刀身亡。據說他生前曾接到23次警告,說有人要行刺他,但他不以為意。
  1961年4月17日,美國中央情報局發生「豬玀灣事件」,當時在位的是僅上任90天的甘乃迪總統。「豬玀灣事件」最終導致古巴向蘇聯靠攏,最終導致了1962年的古巴導彈危機。而這個事件也成為管理學、危機管理中有名的「群體迷思」案例。
  為什麼凱薩聽到23次的警告還沒有留意呢?怎樣破除「群體迷思」呢?
  改天我們在來談這個問題。上次提到的「景陽」的故事,如下:

  前312年,齊國、魏國、韓國一起攻打燕國,燕國國王派遣太子去向楚國求救。楚王派遣景陽率領軍隊前去營救。黃昏時,軍隊紮營休息,景陽命令左右司馬各自修築自己的營地壁壘,完成後,立起表(主要用來計算時間)。景陽巡察時,發怒說:「你們所修築的壁壘,如果大水來了都會淹過表,這哪裡可以休息呢!」於是便命令軍隊遷徙到別的地方。明天下起了大雨,山水大爆發,昨天司馬們所修築的地方,那水果然都淹過了表。這時候,軍中的官吏才服了景陽。於是景陽也不去援救燕國,轉而去攻擊魏國的雝丘,攻下後,把它送給了盟國宋國。這時候,齊、韓、魏三國感到恐懼,便停止了進攻燕國的軍事行動。魏國的軍隊駐紮在楚國軍隊的西邊,齊國的軍隊駐紮在楚國軍隊的東邊。楚軍想要撤退回國也沒辦法。於是景陽又施展謀略,打開軍營的西邊和門,早上用車兵、騎兵,晚上點亮蠟燭,派遣使者前去魏國軍營。齊國軍隊的主帥覺得很奇怪,以為燕國、楚國與魏國聯合起來想要攻打自己,於是就率領軍隊離開了。齊國軍隊離開後,魏國喪失了盟友,無法一起進攻楚國,只好趁著夜色撤退了。這時候,景陽才安然的率領楚國軍隊撤退回國了。

  從這個例子我們不難發現,景陽的能力在於預測。當然,孔明最高明的能力也在於預測。在《預見未來》中,筆者還曾提到歷史上玩過「錦囊妙計」的高手只有三個:「曹操、諸葛亮、劉裕」。因此《三國演義》為了神化孔明,便編造出「借東風」的故事,事實上果真孔明有這種控制能力,那統一天下就太容易了。怎麼說呢?
  首先,讓曹魏陣營的地區陷入乾旱,讓孫權陣營的地區陷入水災,讓劉備的地區年年氣候穩定,讓農民豐收,這是戰略面。戰術面,孔明每一次要攻擊魏國的某個城市時,就先讓它下個一個月的雨,把它的城牆破壞殆盡,戰鬥時放幾個風去攻擊敵人的軍隊。更多招數也還有,但我想這樣就差不多了。這樣子孔明還有多少敵人呢?不過我們都知道,這既沒發生過,也不可能發生。但說到底,要能把預測玩到「錦囊妙計」的程度,已經非常「神奇」了!僅從這點來看,就算沒借到東風,也無損於孔明的天才!

2014年3月12日 星期三

孫子兵法中翻英與谷歌自動翻譯00007

  有《三國演義》迷問我孔明真的借了東風嗎?我回答周瑜、黃蓋那些人是在地人,對於什麼時候會起風的規律一定有所掌握。小說只是想要神話孔明的能力,事實上,我們都知道沒有人可以借東風。
  所以這是一個「預測」的能力,而非「控制」的能力。大凡一個人能在事情發生以前知道一件事、提早說出來,有三種可能:一是他猜的,這是最多數的情況,沒有任何依據的猜測,或者憑直覺的猜測;二是他的預測,通常是根據了某些規則、規律所推導出來的結果;三是他控制了即將發生的事情,也就是說這是他的執行力得到了徹底的貫徹。當然,其他更離奇的,之前提到管輅時已經說過一些,這裡就不贅述了。
  戰國時代的「景陽」就屬於具有「預測」能力的將軍,至於他根據什麼預測?其實孫子在他的〈#火攻〉篇已經提到了一些規律,也就是底下要介紹的。除了孫子所提到的規律,孔子也曾經根據《詩經》提到的「月離於畢,俾滂沱矣。」來預測什麼時候會下大雨。而事實上,即便我們今日仍在使用的「二十四節氣」其實都是「行星運動」所造成的變化,而且也依然具有很高的準確率。這也就是物理學家一般認為不可能發生的事情(如認為行星作用力不可能是地震成因)。但孫子與孔子所根據的都是「月亮」與其他星球的關係,其實月亮對於地球的影響是確實存在的,至於月亮與其他星球的「視覺關係」可能隱藏著其他的真實、實際的規則,也就是視覺只是表象。總之,預測天候在古代或現代都比預測地震來得容易許多。現在的電腦已經可以演算出一個星期內的氣候變化,儘管無法顧慮到很多變化、變數。但至少比起無法預測的地震來,要好得多。
  下一則,我們可以介紹一下「景陽」的故事,但故事並沒有告訴我們他是怎麼預測的。所以你也可以說他是猜的,無妨。
  其他相關說法,可參見〈孫子兵法論正.火攻.三〉(http://www.cos.url.tw/sunzi/Sun-3-12.htm#三.)
  十幾年前也有消防的弟兄在天策府問過我如何滅火的策略,下一則,我們也可以來介紹一下古代將軍如何對付敵方火攻的兵法策略。

  行火有因,因必素具。發火有時,起火有日。時者,天之燥也;日者,月在箕、壁、翼、軫也;凡此四者,風之起日也。(《#孫子兵法》〈#火攻〉)

  行使火攻要有所憑藉,憑藉也一定要平常就該準備妥當。發動火攻有適當的時機,放火、起火有適合的日子。時機,是指天氣乾燥的時候;日子,是指月亮行經箕、壁、翼、軫這四個星宿的期間啊;月亮運行到這四個星宿的位置上,通常也是風開始吹起的日子啊!(白話翻譯)
  Google中翻英:Fire will be subject to the exercise of virtue, virtue must also respect the usual ready. There is an appropriate time to launch fire attack, fire, fire, there is a suitable day. Timing means when the weather is dry; day period refers to the moon passing Kei, walls, wing, Zhen these four planets, ah; run to four stars, the moon's position, usually the day the wind started blowing ah !

  To use fire, some medium must be relied upon. Equipment for setting fires must always be at hand. There are suitable times and appropriate days on which to raise fires. 'Times' means when the weather is scorching hot; 'days' means when the moon is in Sagittarius, Alpheratz , I , or Chen constellations, for these are days of rising winds.(#Samuel B. Griffith)
  Google英翻中:用火,一些中必須依賴。設備設置火災必須始終在眼前。有適當的時間和適當的日子上,以提高火災。“泰晤士報”表示,當天氣灼熱,'天'的意思時,月亮在射手座,壁宿二,我,還是陳星群,這些都是上升的風的日子。

  In order to carry out an attack, we must have means available. The material for raising fire should always be kept in readiness.
  There is a proper season for making attacks with fire, and special days for starting a conflagration.
  The proper season is when the weather is very dry; the special days are those when the moon is in the constellations of the Sieve, the Wall, the Wing or the Cross-bar; for these four are all days of rising wind.(#Lionel Giles)
  Google英翻中:為了進行攻擊,我們必須有辦法可用。為提高防火的材料應始終保持在準備狀態。有一個合適的季節進行攻擊的火,特別的日子開始一個大火。適當的季節是在天氣非常乾燥,在特別的日子是那些當月亮是在篩中,長城,榮或橫桿的星座,因為這四個上升的風的日子。
相片:  有《三國演義》迷問我孔明真的借了東風嗎?我回答周瑜、黃蓋那些人是在地人,對於什麼時候會起風的規律一定有所掌握。小說只是想要神話孔明的能力,事實上,我們都知道沒有人可以借東風。
  所以這是一個「預測」的能力,而非「控制」的能力。大凡一個人能在事情發生以前知道一件事、提早說出來,有三種可能:一是他猜的,這是最多數的情況,沒有任何依據的猜測,或者憑直覺的猜測;二是他的預測,通常是根據了某些規則、規律所推導出來的結果;三是他控制了即將發生的事情,也就是說這是他的執行力得到了徹底的貫徹。當然,其他更離奇的,之前提到管輅時已經說過一些,這裡就不贅述了。
  戰國時代的「景陽」就屬於具有「預測」能力的將軍,至於他根據什麼預測?其實孫子在他的〈#火攻〉篇已經提到了一些規律,也就是底下要介紹的。除了孫子所提到的規律,孔子也曾經根據《詩經》提到的「月離於畢,俾滂沱矣。」來預測什麼時候會下大雨。而事實上,即便我們今日仍在使用的「二十四節氣」其實都是「行星運動」所造成的變化,而且也依然具有很高的準確率。這也就是物理學家一般認為不可能發生的事情(如認為行星作用力不可能是地震成因)。但孫子與孔子所根據的都是「月亮」與其他星球的關係,其實月亮對於地球的影響是確實存在的,至於月亮與其他星球的「視覺關係」可能隱藏著其他的真實、實際的規則,也就是視覺只是表象。總之,預測天候在古代或現代都比預測地震來得容易許多。現在的電腦已經可以演算出一個星期內的氣候變化,儘管無法顧慮到很多變化、變數。但至少比起無法預測的地震來,要好得多。
  下一則,我們可以介紹一下「景陽」的故事,但故事並沒有告訴我們他是怎麼預測的。所以你也可以說他是猜的,無妨。
  其他相關說法,可參見〈孫子兵法論正.火攻.三〉(http://www.cos.url.tw/sunzi/Sun-3-12.htm#三.)
  十幾年前也有消防的弟兄在天策府問過我如何滅火的策略,下一則,我們也可以來介紹一下古代將軍如何對付敵方火攻的兵法策略。

  行火有因,因必素具。發火有時,起火有日。時者,天之燥也;日者,月在箕、壁、翼、軫也;凡此四者,風之起日也。(《#孫子兵法》〈#火攻〉)

  行使火攻要有所憑藉,憑藉也一定要平常就該準備妥當。發動火攻有適當的時機,放火、起火有適合的日子。時機,是指天氣乾燥的時候;日子,是指月亮行經箕、壁、翼、軫這四個星宿的期間啊;月亮運行到這四個星宿的位置上,通常也是風開始吹起的日子啊!(白話翻譯)
  Google中翻英:Fire will be subject to the exercise of virtue, virtue must also respect the usual ready. There is an appropriate time to launch fire attack, fire, fire, there is a suitable day. Timing means when the weather is dry; day period refers to the moon passing Kei, walls, wing, Zhen these four planets, ah; run to four stars, the moon's position, usually the day the wind started blowing ah !

  To use fire, some medium must be relied upon. Equipment for setting fires must always be at hand. There are suitable times and appropriate days on which to raise fires. 'Times' means when the weather is scorching hot; 'days' means when the moon is in Sagittarius, Alpheratz , I , or Chen constellations, for these are days of rising winds.(#Samuel B. Griffith)
  Google英翻中:用火,一些中必須依賴。設備設置火災必須始終在眼前。有適當的時間和適當的日子上,以提高火災。“泰晤士報”表示,當天氣灼熱,'天'的意思時,月亮在射手座,壁宿二,我,還是陳星群,這些都是上升的風的日子。

  In order to carry out an attack, we must have means available. The material for raising fire should always be kept in readiness.
  There is a proper season for making attacks with fire, and special days for starting a conflagration.
  The proper season is when the weather is very dry; the special days are those when the moon is in the constellations of the Sieve, the Wall, the Wing or the Cross-bar; for these four are all days of rising wind.(#Lionel Giles)
  Google英翻中:為了進行攻擊,我們必須有辦法可用。為提高防火的材料應始終保持在準備狀態。有一個合適的季節進行攻擊的火,特別的日子開始一個大火。適當的季節是在天氣非常乾燥,在特別的日子是那些當月亮是在篩中,長城,榮或橫桿的星座,因為這四個上升的風的日子。

2014年3月11日 星期二

孫子兵法中翻英與谷歌自動翻譯00006

  最近 #300壯士 :帝國崛起 正在熱映。(以下劇透。第一集是比較符合史實的。)其中有幾幕牽涉到火攻的。因此,最近我們就從〈火攻〉篇的名句說起。片中有一幕是波斯戰艦噴出黑油的一幕,其實以影片表現的方式看來,那是行不通的。因為一支火箭就可以結束那艘戰艦了。古代希臘確實有火攻的武器:希臘火。其實就是這部片想要表達的東西。這些細節,等最近有空再寫一篇中西方火攻的文章來介紹(《中西思維隨筆》25),最近我們就先介紹〈火攻〉篇的名句吧。

  主不可以怒興軍,將不可以慍用戰;合乎利而用,不合而止。怒可復喜也,慍可復悅也;亡國不可復存也,死者不可復生也。故明主慎之,良將警之,此安國之道也。(《#孫子兵法》〈#火攻〉)
  君主不可以因為憤怒而發動戰爭,將帥不可以因為惱怒而進行戰鬥;合乎國家利益的才能去做,不合乎國家利益的就要停止。憤怒可以回復到高興的狀態,惱怒可以回復到喜悅的狀態;但是滅亡的國家不可以回復到存在的狀態,死去的人民不可以回復到活著的狀態啊!因此對於這件事情,賢明的君主一定要謹慎,優良的將帥一定要警惕,這是安定國家的方法啊!(白話翻譯)
  Google中翻英:The monarch can not because of anger and war, generals and not because the angry and fight; meet the national interest to do it, do not meet the national interests must be stopped. Anger can revert to the state of happy, anger can revert to a state of joy; But the state can not return to the demise of the existence of the state, dead people can not return to the living state ah! So for this thing, wise monarch must be careful, excellent generals must be vigilant, this is the way the country's stability ah!(#TheArtofWar

  A sovereign cannot raise an army because he is enraged, nor can a general fight because he is resentful. For while an angered man may again be happy, and a resentful man again be pleased, a state that has perished cannot be restored, nor can the dead be brought back to life. Therefore, the enlightened ruler is prudent and the good general is warned against rash action. Thus the state is kept secure and the army preserved.(#Samuel B. Griffith)
  Google英翻中:一個主權不能起兵,因為他激怒了,也不能把一般的戰鬥,因為他是不滿。而對於一個憤怒的人可能會再次得到幸福,和一個怨恨的人又是高興,已經滅亡了的狀態不能恢復,也不能死被帶回生活。因此,明君是謹慎和良好的一般被警告不要貿然行動。因此,狀態一直保持安全和軍隊保護。

  No ruler should put troops into the field merely to gratify his own spleen; no general should fight a battle simply out of pique.
  If it is to your advantage, make a forward move; if not, stay where you are.
  Anger may in time change to gladness; vexation may be succeeded by content.
  But a kingdom that has once been destroyed can never come again into being; nor can the dead ever be brought back to life.
  Hence the enlightened ruler is heedful, and the good general full of caution. This is the way to keep a country at peace and an army intact.(#Lionel Giles)
  Google英翻中:沒有統治者應該把部隊到現場只是為了滿足他自己的脾臟,沒有一般應打一仗只是出於賭氣。如果是你的優勢,做一個向前移動,如果沒有,留你在哪裡。憤怒可能會在時間的變化,以喜樂;煩惱可能是由內容成功。但一國,曾經被破壞永遠無法再來應運而生,也不能死永遠不會起死回生。因此,明君是細心和良好的一般充滿謹慎。這是為了保持一個國家在和平與軍隊完整的方式。


三星手機鍵盤布局


  




  三星手機我用的是Grand2的截圖,其他的不清楚。三星的平板與手機的鍵盤布局不同。平板的空間比較大,確實可以給更多的資源,改變不大的話,也不會有學習曲線暴增的問題。
  三星手機鍵盤布局評價:中規中矩。但第一行稍嫌擠了點,多出的是標點「,。」。平板的注音符號布局基本不變,但底下又把標點擴增為四個「,。!?」,方便使用者直接輸入「!?」。
  但其實這裡就面臨了一個問題,為什麼是這四個標點。其實依據我個人針對五千萬語料庫的統計,「!」的使用次數還不如「、」的使用次數。因此,如果要放四個,應該把「!」換成「、」,比較能省下使用者更多時間。
  不管是谷歌還是三星的鍵盤布局,其實都還停留在QWERT的鍵盤格式(谷歌的把「ㄦ」的調動了,但其他基本沒變。)。這有點當今的鐵路軌距延續著羅馬戰車的軌距一樣的意思。事實上,注音符號總共41個。一般使用者即使在桌面型電腦上可以盲打,也不一定真的能默背出整個布局,要整個經驗移轉到單手操作的手機或平板上(當然也有人用雙手來打),其實並不是那麼直接的事情。因此,也有一些輸入法大刀闊斧的調動了整個排列方式。確實,以當前的方式來看,只是把注音符號從最開始的「ㄅ」一路由左至右的排列,遇到三個一組的再在上面安插上四個聲調符號。可見根本沒考慮過使用頻率與人體工學的問題。由於大家已經習慣了鍵盤上的排列,主流鍵盤也都是這種排列方式,因此很少有人會質疑是否有更好的排列方式。
  超自然輸入法初版還是會按照這個基本布局略作調動進行排列,不會有太大的差異。至於日後是否把個人的其他鍵盤布局放上來,要看初版的使用狀況而定。
  為什麼要開發超自然輸入法呢?之前已經說過,是因為我個人覺得在觸控式設備上打字實在太浪費時間了,也想實現以前的想法,完成自己的計畫。因此進行了開發。如此一來,「效率」便是超自然輸入法的主要考量。所以我的布局,雖然不會跳脫基本布局,但會有一些新的元素加入。在預測選單的設計上也有所不同。
  至於最後的成品如何,且請關心的讀者拭目以待。

  我一般不在這裡發表新文章,這裡主要放一些舊的「中文資訊處理」的文章。當然自從順利砍掉它以後,上面的文章都消失了。連同原本的粉絲也消失了,如果有興趣關注相關的議題,請參見:https://www.facebook.com/onlysoter 不過這跟以前不太一樣的是,以前的「中文資訊處理」頁面,比較偏重於學術上、理論上的探討,目前的主要跟自己的實作成品有關。

2014年3月9日 星期日

大數據的極限


孫子兵法中翻英與谷歌自動翻譯00005

  是故,始如處女,敵人開戶;後如脫兔,敵不及拒。(〈九地〉)
  因此,開始的時候,我方應該表現得像處女一樣的幽靜,使敵人喪失戒心而打開門戶;此後的行動則應該像脫逃的兔子一樣的迅速,使敵人來不及抗拒抵禦。(白話翻譯)
  Google中翻英:Thus, the beginning, we should behave like a virgin, like the quiet, wary of the enemy and the loss of open doors; subsequent action is like a rabbit escape quickly should, too late to resist against the enemy.

  Therefore at first be shy as a maiden. When the enemy gives you an opening be swift as a hare and he will be unable to withstand you.(Samuel B. Griffith)
  Google英翻中:因此,在第一個害羞的少女。當敵人給你一開口要快快的野兔,他將無法承受你。
  At first, then, exhibit the coyness of a maiden, until the enemy gives you an opening; afterwards emulate the rapidity of a running hare, and it will be too late for the enemy to oppose you.(Lionel Giles)
  Google英翻中:在第一,然後,表現出少女的羞怯,直到敵人給你一開口,事後模擬運行野兔的快速性,這將是太晚了,反對你的敵人。

  Griffith與Giles在翻譯「脫兔」時使用「hare」(野兔),雖然用了「swift、running」來形容它的速度,卻顯然沒有翻出原意與原味,不夠形象與精確。「脫兔」是指逃脫的兔子,這時的兔子由於驚恐而迅速逃脫,兔子逃命時,自然用盡全力。因此可以說這時候兔子的速度飆到最快的程度。單純用「野兔」之所以不夠味道,也不夠精確,在於野兔平常時並不會用盡力氣來跑。因此這不能讓讀者第一次讀到時,就感受到它的速度感。(尤其當今很多人根本沒機會看到兔子跑一次,無法感受它的速度。)
  春秋時代,常見的三種奔跑速度最快的動物是:馬、兔、狗。這裡之所以用「兔子」而不用「馬、狗」,是因為為了在文意上照顧「處女」。兩者都是屬於比較柔弱的形象,因此孫武前面用了「處女」,後面就用「兔子」來照應。正因為兔子很快,所以後來跑得很快的馬也有用兔子來形容或命名的,譬如「赤兔」。
  十三篇兵法的修辭藝術是很高的,因此劉勰才會稱讚孫武的文章「辭如珠玉」。關於這句原文的詳細說明與修辭剖析,請見〈孫子兵法論正.九地.卅三〉(http://www.cos.url.tw/sunzi/Sun-3-11.htm#卅三.)

2014年3月6日 星期四

孫子兵法中翻英與谷歌自動翻譯00004

  谷歌翻譯成效良好的原因,不在於演算法更為聰明,而是谷歌研究人員的想法就如同班科和布里爾,做法是輸入更多資料,而不只是輸入高品質的資料。……谷歌的人工智慧專家諾威格等人,就曾在一篇名為〈資料的非理性效果〉的文章中寫道:「簡單的模型、加上大量的資料,就會打敗很複雜,但資料較少的模型。」諾威格等人也指出,雜亂正是關鍵:「在某些方面,可以說谷歌語料庫還不如布朗語料庫,因為資料內容的網頁未經過濾,會有不完整的句子、拼字錯誤、文法錯誤,以及其他種種錯誤,而且也沒有經過人工精心修正、標註各種詞類資訊。但就因為它的規模是布朗語料庫的百萬倍,已足以蓋過所有缺點。」(《大數據》p58)
  以上這段話,應該還是成立的。那麼從我們最近貼的幾則翻譯看來,效果似乎毫無疑問不如人意。為什麼?這就牽涉到之前提到的「大數據的極限」。確實,谷歌翻譯的效果仍然還是可能領先其他的翻譯軟體,但如果它只是立足於以「大數據」為基礎來發展所有演算法,那麼它很容易就會面臨極限值,而難以甚至無法超越了。也就是「大數據」本身可以提供不錯的品質,但它也有個門檻在那裡,過了這個門檻,想要再往前進,幾乎是「寸步難行」了。這同樣適用於任何想要單純的利用大數據來進行預測的作法。
  我們以「輸入法」的最簡單預測方式為例,就是統計每一個字後面出現哪些字的字頻來做預測(譬如:「預」後面可以是「測、先」等字。)。因此,當數據量很小時,它的準確率是很低的,但當數據量超過一個臨界值之後,它的功效幾乎可以說「到頂」了,也就是即使不停的增加資料量,它的進步也非常非常有限,甚至不再進步了。以「一」這個字為例,在一萬字的語料庫裡,它後面可能跟了一百個字;在一個十萬字的語料庫裡,它後面可跟了三百個字;在一個一百萬字的語料庫裡,它後面可能跟了五百個字。但可能超過一百萬字以後,它後面跟的字與總字數的比率就會「驟減」。同時,更主要的一點是,可能在一百萬字以後它後面所跟的字的「排序」就幾乎不再變動了。這時候就算再增加十倍的語料,也對於它的預測能力沒有任何助益了。
  這個「現象」同樣適用於藉由「大數據」來做預測的其他領域。以「超自然輸入法」為例,這種預測方式僅是最基本的構件,要提昇預測型輸入法的預測能力,還得藉由其他手段來達成。
  我們在這裡以《孫子兵法》中翻英來對翻譯軟體進行度量,並不是想要借用它的成果(因為目前看來還不堪用),而是想要理解當前自動翻譯的程度,以及體現出的相關問題。同時拿這些來跟人工翻譯做一點比較。不過目前我還沒有那麼多時間放在這裡,如果以整本《孫子兵法》為例,每天放一則,也要放一年半才會放完。讀者可藉機用這種方式,無壓力的學習《孫子兵法》。一日咀嚼一句話,一年半載後也自然的看完了整本書。當然,這個過程,如果不放上點故事的話,顯然會比較枯燥的。因此,實際上的執行時間可能超過兩年。為了避免本站淪為簡單的名句轉貼,因此,大概每三句之後,會有一段論述,或者其他相關主題的闡述。
  今天要介紹的一句是:
  故兵知彼知己,百戰不殆;不知彼而知己,一勝一敗;不知彼不知己,每戰必殆。(〈謀攻〉篇)
  所以在戰爭中,能理解敵人也能理解自己的人,即使作戰一百次也不會有危險;不理解敵人而理解自己的人,有一半的機會獲勝,有一半的機會失敗;不理解敵人也不理解自己的人,每一次作戰都一定會有危險啊!(白話翻譯)
  Google中翻英:So in war, the enemy can understand people can understand their own, even though there will not be a hundred times the risk of war; do not understand the enemy and understand his own people, half the chance of winning, half the chance of failure; does not understand the enemy do not understand themselves, every battle will definitely be dangerous ah!

  Therefore I say:'Know the enemy and know yourself; in a hundred battles you will never be in peril. When you are ignorant of the enemy but know yourself, your chances of winning or losing are equal. If ignorant both of your enemy and of yourself, you are certain in every battle to be in peril.'(Samuel B. Griffith)
  Google英翻中:因此,我說:“知己知彼,百戰不殆,在百仗你將永遠處於危險之中。當你是無知的敵人,但了解自己,你輸贏的機會是相等的。如果無知和自己的兩個你的敵人,你一定在每一場戰爭將處於危險之中。“
  Hence the saying: If you know the enemy and know yourself, you need not fear the result of a hundred battles. If you know yourself but not the enemy, for every victory gained you will also suffer a defeat. If you know neither the enemy nor yourself, you will succumb in every battle.(Lionel Giles)
  Google英翻中:故曰:如果您知道敵人,知道自己,你不用擔心百戰役的結果。如果你知道自己,但不是敵人,每一個獲得了勝利,你也將遭遇慘敗。如果您知道既不是敵人也不是你自己,你會屈從於每一場戰鬥。

  從以上的翻譯可以明顯看出,不管是Griffith或Giles的翻譯也都未能盡如人意。至於那些已經被筆者改正的句子,翻譯後的語意自然就相差更遠了。


2014年3月5日 星期三

孫子兵法中翻英與谷歌自動翻譯00003

  前面提到的兩句經典名言:「故善者,立於不敗之地,而不失敵之敗也。」、「勝兵先勝而後戰,敗兵先戰而後求勝。」我們相信不懂的人應該非常少!那麼實際上怎麼執行呢?譬如我們問什麼叫做「先勝」?於是便可以引出怎樣才能「勝」?不知道怎樣才能勝、才算勝,自然不可能「先」勝!我們也可以問什麼叫做「不敗之地」?什麼情況下是「敵之敗」?
  於是我們看完這兩句話,就不只是懂得它的原始意義,而不會加以運用了。對於不同的領域、行業,勝的條件都不相同。這方面讀者要想「學以致用」就必須自己去總結自己領域的相關經驗。《孫子兵法》主要指出了一個大方向、給出一些框架(譬如具有哪些條件算勝),如果要運用到其他領域,那些細節必須讀者自行補充。由於細節隨著時代、環境、領域而變,因此《孫子兵法》不提細節,反而使它的適用範圍更廣、生命更長久。
  以下這句應該也是最有名的一句了:

  是故,百戰百勝,非善之善者也;不戰而勝,善之善者也。(〈謀攻〉篇)
  因此,將帥作戰一百次獲得一百次的勝利,這不是高明之中最高明的啊;將帥不與敵人作戰卻能取得勝利,這才是高明之中最高明的啊!(白話翻譯。我後來覺得「善之善者」其中的「善者」翻譯成「大師」也不錯。如此這句就變成「大師中的大師」了。似乎更有力。)
  Google中翻英:Therefore, generals fight a hundred times a hundred times to get the victory, this is not the wisest among the wise ah; generals do not fight with the enemy was able to win, this is the wisest among the wise ah!
  For to win one hundred victories in one hundred battles is not the acme of skill. To subdue the enemy without fighting is the acme of skill.(Samuel B. Griffith)
  Google英翻中:對於在百仗贏得百場勝利並不是技術的顛峰。制服敵人不戰是技術的顛峰。
  Hence to fight and conquer in all your battles is not supreme excellence; supreme excellence consists in breaking the enemy's resistance without fighting.(Lionel Giles)
  Google英翻中:因此,戰鬥和征服所有的戰鬥是不是至上精益求精;至上精益求精在於打破了敵人的抵抗不戰。

2014年3月4日 星期二

孫子兵法中翻英與谷歌自動翻譯00002


  故善者,立於不敗之地,而不失敵之敗也。(〈形〉篇)
  所以高明的人,先站立在不能被打敗的地方,而不會喪失打敗敵人的良機。(白話翻譯)
  Google中翻英:So clever man, standing in the first place can not be beat, and not lose an opportunity to defeat the enemy.
  Therefore the skilful commander takes up a position in which he cannot be defeated and misses no opportunity to master his enemy.(Samuel B. Griffith)
  Google英翻中:因此,熟練的指揮官佔據了,他不能被打敗,失誤沒有機會掌握他的敵人的位置。
  Hence the skillful fighter puts himself into a position which makes defeat impossible, and does not miss the moment for defeating the enemy.(Lionel Giles)
  Google英翻中:因此,熟練的戰士把自己變成一個位置,使戰勝不可能的,而且不會錯過的時刻克敵制勝。

2014年3月3日 星期一

孫子兵法中翻英與谷歌自動翻譯00001

  勝兵先勝而後戰,敗兵先戰而後求勝。(〈形〉篇)
  勝利的軍隊先取勝再作戰,失敗的軍隊先作戰再求取勝。(白話翻譯)
  Google中翻英:Victorious army first battle to win again, the failure of the military operations first and then seek to win.(再英翻中:勝利之師首戰再次奪冠,軍事行動的失敗,然後再尋求取勝。)
  Thus a victorious army wins its victories before seeking battle; an army destined to defeat fights in the hope of winning.(Samuel B. Griffith)
  Google英翻中:因此,一個勝利的軍隊贏得了勝利尋求戰鬥前,軍隊注定要失敗的戰鬥中獲勝的希望。
  Thus it is that in war the victorious strategist only seeks battle after the victory has been won, whereas he who is destined to defeat first fights and afterwards looks for victory.(Lionel Giles, M.A. (1910))
  Google英翻中:因此,它是在戰爭勝利的戰略目的只是戰役的勝利已經贏了之後,而他誰是注定要打敗第一打架,事後看起來勝利。

2014年2月11日 星期二

「超自然輸入法」第24號測試「學習功能演示」





  昨天下載了Android版的SwiftKey,想比較正式的研究一下。發覺IOS版的限制真的很多,Android版他就玩得很精采。在鍵盤的配置上,幾乎把拼音文字能玩的部份都玩了。其中比較吸引我的是他的「學習功能」。他具備了雲端備份使用者經驗與從使用者過往郵件、簡訊中學習使用者語言風格的功能,算是非常先進了。
  超自然輸入法中文版,暫時無法做到太複雜的學習功能。譬如她可能不會要求去讀使用者的郵件(但簡訊可考慮),因為郵件裡面可能充斥著很多非使用者撰寫的內容,那部分的風格也就不屬於使用者的經驗。簡訊則更多的是使用者自己輸入的內容,因此可以考慮。但第一版的超自然輸入法,將主要學習使用者在實際的輸入過程中所累積的經驗、風格。
  因此,今天我便放出超自然輸入法的學習影片。這影片主要在表現超自然輸入法所特別具有的「舉一反三」學習功能。由於今天看到Angelababy拍的婚紗照片挺漂亮的,就以她舉例。影片演示的句子如下:
1.你真的很美(學習前。11鍵,5中文,平均2.2鍵一個字)
2.楊穎真的很漂亮(學習前。17鍵,7中文,平均2.4鍵一個字。)
3.楊穎真的很漂亮(學習後。5鍵,7中文,平均0.71鍵一個字。)
4.你真的很漂亮(直接由第二句學習功能獲得了學習。學習後。4鍵,6中文,平均0.66鍵一個字。)
5.你真的很美(仍然是在第二句學習後自動獲得了學習。學習後。4鍵,5中文,平均0.8鍵一個字。
  以上就是超自然輸入法「舉一反三」或稱「關聯式」學習能力的實際展現。也就是說,超自然輸入法只要學習了一次使用者的句式,就能自動類推到相近的句式,不用再學習一次。影片採用手動學習,以方便演示,實際產品為自動學習。

2014年2月8日 星期六

搜狗輸入法的表現

中文魔方

搜狗輸入法的表現

朔雪寒


甲君測試乙君測試
今天就是我餘生開始的第一天1620
葉問要打十個1515
沒有遺憾的人生多無趣2021
所以我留下了一個空位1822
沒想到還能見到妳2321
要不要一起去看電影1518
我們不能再錯過1713
幸福是我對你的承諾1818
我們結婚吧99
我是東尼史塔克1717
168174
22.071428571

朔雪寒



資訊



文字:朔雪寒 校編
書庫:開放書雲
中文:中文魔方
策略:神機妙算

2014年2月4日 星期二

繁簡互轉問題之一


繁簡互轉問題


  隨著兩岸圖書版權交易日益興盛、兩岸網站交流頻繁,一個文書處理軟體或一個網路翻譯軟體的「繁簡轉換」功能,也逐漸重要起來!然而時至今日,我們所能使用到的繁簡轉換工具仍然停留在低質量的階段!
  繁簡轉換牽涉到幾個面向,第一個層面發生在字的轉換上。字的轉換之所以會產生問題,主要發生在兩件事上,一是簡體字有歸併字(如:丑醜、發髮、干乾。),這些歸併字一脫離上下文,便只能對應到一個繁體字(一般作法採用高頻優先!);二是根據 Unicode 收錄漢字規則,採用「字源分離原則」,因此不同地區(中日韓)對於某一個字的不同寫法,由於來源不同,都予以收錄。但事實上他們所代表的是同一個字。由於第二個原因(形近而誤)所導致的編碼轉換失誤,會造成轉換後的檔案存成 Ansi 編碼後(相當於將Unicode編碼的檔案存成Big5編碼的檔案的意思。),產生「?」(003F)的字元,這是 MS 系統在無法對應編碼的情況下統一的處理方式!因為兩個字雖然長得很像、意思也一樣(如:啟啓、產産、顏顔、艷艶、媯嬀。),編碼卻並不相同。也就是說,這是轉換表的製造者,因為「眼誤」所產生的失誤!但這種失誤,非常容易用程式檢查出來!(寫一個這樣的程式,不用三分鐘!)

  由於有歸併字的問題存在,因此在字的轉換上,不管演算法、轉換表怎麼設計,理論上「正確率」都不可能達到百分之百!不過這確實存在一個「準確率的極限值」!但每一家都未能達標!
  第二個層面是詞彙,很多詞彙必須依靠更高層次的知識(上下語境、常識推理)才能予以正確的轉換,譬如:「颱風、台風」。另一種類型是,兩岸對於同一個概念,使用了不同的詞彙,譬如「對象、物件」。(導致的錯誤可能是:她是我結婚的物件!)翻譯類的差異,自然就更不必說了!
  我在2008年曾經對「谷歌(Google)、微軟(MicroSoft)、昇陽(Sun)」三家公司的相關產品進行繁簡轉換正確率的調查,並公佈在博客上。時至今日,我再一次做了相同步驟的調查(先將繁體字表利用各軟體的相關功能轉簡,再將此表轉繁。步驟為:繁→簡→繁。),結果令人訝異!撇除昇陽的 OpenOffice 系列中的 Write 是開源的且昇陽也被甲骨文收購,因此毫無改進,勉強可以接受之外,其他兩家放著讓它爛的態度,令人不敢苟同!這其中又以 Google 翻譯的繁簡轉換問題最嚴重!
  以下分就幾家在第一層面上的轉換所產生的失誤,分別列表、略述如下:
  谷歌(google):
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23



  以下是2008與2011年兩次調查的比較表:
軟體
2008調查
2011調查
Word 2003
698
534
Word 2007
424
424
Sun OpenOffice Write
537
537
Google 翻譯
564
563
 
  由這個表可以看出,Word 2007與開放原碼的 Write 是其中完全沒動的二個兄弟!Google的表現則最讓人失望!
  你知道台灣出版社一年要為這樣的錯誤多付出多少成本、代價嗎?只能說,這樣的成本是無形的,因此沒有計算過的人,不會感到痛!但其實卻是非常可怕的!而對於這些大廠商的工程師來說,要修改這樣的錯誤,其實再簡單不過了!不過我們目前所見,只是在「字」這個層面,便已經錯成這樣!其他層面的錯誤一起考慮進來,那就更可觀了!
  如果這些大企業把這些對照失誤改進了,對於使用者尤其兩岸的出版業(尤其缺乏自動校勘系統的台灣),每年所能省下的成本將是非常可觀!甚至不誇張的說,用來給付數萬名小朋友的營養午餐錢恐怕都有了!
  我們回過頭來想一想,為什麼繁體世界的軟體發生了這麼多的失誤(包涵微軟錯誤的細明體字體「厲兵秣馬」的「」字),幾年來仍然無法得到改進呢?(尤其改進它,是如此簡單的一件事!)是因為繁體使用者的市場小嗎?還是因為繁體使用者都不太注重品質(所以不反應。你反應,大企業都不一定會理你!何況你不反應呢!)?或者是這些大企業根本不想理會繁體使用者呢(企業有擺爛文化?!)?或許答案是綜合性的,只是三種原因所佔比率有別罷了!否則,豐田汽車願意招修美國的汽車,為何這些大企業面對每天都有繁體使用者會使用的繁簡轉換功能(以及細明體),卻擺著讓它爛呢!
  不管各位的想法如何,至少我不能接受這樣的品質!所以一有機會,我就說你一遍!直到你改進為止!
  當然,與其等著你改進,不如我自己設計一套,還來得快一點,畢竟,2008至2011也已經過了快三年了!
  毫無疑問,「繁簡轉換功能」自然也是「赤兔自動校勘系統」中重要的一項功能!
朔雪寒 2011.4.9


資訊



文字:朔雪寒 著
書庫:開放書雲