Tuesday, September 13, 2011

「我,華生,會思考的電腦?」(Final Jeopardy Man vs. Machine and the Quest to know Everything)

作者: Stephen Baker; 譯者:黃芳田; 出版社:遠流出版事業(股)公司;正体中文首版:2011年8月。


Deep Blue and Kasparov
IBM-Watson
1997年5月,藍色巨人(Blue Giant)-----IBM的「深藍電腦」(Deep Blue)打敗了西洋世界冠軍 kasparov2011年2月,IBM超級電腦「華生」(Watson)經過三天激戰,於美國歷史最悠久的益智節目「危險境地!」(Jeopardy!;1964年開播)中擊敗節目史上最強的二位冠軍得主「Ken Jennings」「Brad Rutter」,抱走百萬美元獎金。

這個電腦系統的產生,表示著重組織知識並能產生語言及想法的電腦問世,再加上機械人硬体裝置,特別是服務型或家事型機械人,將大舉入侵你我的日常生活,成為居家、工作上的好幫手(而且不用怕罷工及落跑頂嘴,多美好!)。 根據市場推測,到了2025年,配有類似華生系統的機械人產值將達到一兆美元(30兆台幣)。

 哇噻!  我註:我的美夢將成,不用害怕老來沒有伴,找不到菲庸,真的太好了!

這種想法,將是美國的軟体加上日本的機械人硬体,創造21世紀新的科技產業?  但我心中有一個質疑,以美國債台高築的狀況,百業凋弊,市場大幅萎縮,有能量再創造一個市場給機械人嗎?  日本的情況也差不多,再加上日本陸沉的憂慮,你會把如此重要的產業設在日本嗎?

人在那裏,錢潮在那裏,創投全往那裏跑。所以我認為最終這個產業會落腳中國,因為那裏有全世界最多的老人,最需要家事服務型機械人。 那裏也有全世界最好最便宜的數理腦袋及軟硬体工程師。  市場、人才及資金全部集中,而且那裏也容的下全球的高科技人口移民,所以不管原生的技術來自那裏,如果你不到中國投資設廠,就沒有機會。

我想知道的是,台灣在這一場新科技創投中,我們站在什麼位置 ?

「危險境地!」(Jeopardy!;1964年開播)這個節目的權利屬於日本「Sony Pictures Entertainment」所有,它的製作團隊由「Harry Friedman」帶領。


david-ferruci
「華生」(Watson)的認知儀器由2880個電腦處理器(CPU)組成。而研發團隊由科學家「David Ferruchi」帶領主管。它誕生於紐約「IBM 研究中心總部」,以「IBM」創辦人「Thomas J. Watson姓命名。

1997年「深藍電腦」(Deep Blue)每秒鐘能翻查數百萬種棋局、計算機率,選擇最有勝算的一步棋來下。它精通應用數學,但卻完全跳過複雜許多的「語文領域」。 所以2006年開始,IBM研究部門的物理學家「Paul Horn」才會敦促公司中的團隊追求打造能參加「危險境地!」(Jeopardy!)的參賽電腦系統,他們經歷了了2008年雷曼兄弟倒閉後的世紀金融大海嘯,直到2010年仲冬才開始正式在研究室中搭建仿「危險境地!」(Jeopardy!)節目的錄影棚開始測試。

測試開始時,以答對優先,也就是著重在華生的「認知過程」上,直到它的正確率超過「詹寧斯曲線」為止,接下來是「速度」,必需讓華生按「蜂鳴器」的時間快過「Ken Jennings」「Brad Rutter」,而同一時間,華生還得利用棋賽理論,拚策略,計算出「雙賭法」「終極危險的賭注,以及估算出在尚未見到的那些題目中的勝算有多少? 更要預測對手(即真正的人類)的表現,特別是在「決勝題」時,那是一賭定江山的。

「深藍電腦」(Deep Blue)設計時,並未走向人工智慧的「思考」,而是發揮了電腦的特長「超級記憶」「無與倫比的計算速度」,所以嬴棋的方式靠的是處理數據的能力,玩統計上的戲法,測試成千上萬個棋局,用最笨的方法,計算可能性才嬴的。

IBM最大的部門是「全球服務」,其中包含了世界最大的「顧問諮詢服務」,它賣「技術」「策略諮詢」給全世界的公司企業。

人工智慧領域可以分成二派,一派是理想派,這一派人討論電腦智能的性質,希望打造出像人類一樣可以用「概念」思考的電腦。(我註:如果你了解神經元構造,了解人腦的生物結構,其實真的不難達成。科技始終來自人性這句話的真意是,人類其實一直用自己為藍本,打造更好的人類或者人類的部份。); 另一派是務實派,他們只創造出能處理事情的電腦,而迴避人腦中最複雜的「意像」結構,就是左右腦管的「空間」與「細節那一塊,走匯排流、記憶体、處理器、比對演算處理軟体到得出結論,送到「Outport」如銀幕等播放。

所以像IBM超級電腦「華生」(Watson),它能挑出統計上最有希望成為答案的文字詞語組合,利用資料檢索功能及編寫演算法,加強電腦判斷力,比較出較可靠的資料來源,引導系統找出答案。

這樣的電腦可以了解「一般語言」,可以在幾秒內檢索出答案,適用於「熱線服務中心」,例如回答稅務問題、提供「火車/公車/高鐵/飛機/船舶」等時刻表等,也可以用於需要繁雜法令文件諮詢的工作,例如上市公司必需符合的規定、法令及揭露,及法律事務所必需追蹤的個案、罪案、申訴等。 更好用的地方是,它可以作為醫生的最佳「診斷」助手,因為這種電腦可以讀進成仟上萬份醫學研究報告,也可以快速檢索目前所有的病歷表,針對每個病人的病情,提供一份可能的解答或診斷結果,讓醫生作最後判斷。(我註:這是我一直認為電腦資料庫的最佳用途,如果電腦可以取代人工來搜尋分類組織統計分析的話,光是病歷資料庫就能減少很多誤診,救回很多人命。 如果再加上分析的話,就能節省很多無謂的檢查及藥物使用,撙節醫療費用。)

IBM 於1952年推出第一部「商用電腦」-> 1964年藍色大型主機「System/360」面世,才算在「商業、工業及科學界」建立單一的電腦運算標準及作業準則 ->1972~1982年IBM 面臨美國司法部長達10年的控訴,說IBM意圖壟斷快速成長的商用電腦市場,違反「反托辣斯法」-> 1981年IBM 第一部個人電腦問世,定價「1500」美元,但IBM沒有像大型商用主機一樣,從處理器到軟体都垂直整合一龍式的方式由自己生產,反而採用了「英特爾」微處理器及「微軟」的「MS-DOS」作業系統來降低成本,以致於讓「英特爾」及「微軟」賺走巨額利潤,導致1992年,IBM虧損49億7仟萬美元,成為當時美國企業史上虧損最大金額,震驚業界 ->1993年,IBM 拋售及停掉一些老舊沒有競爭力的製造部門,引導公司往資訊為核心的服務業,讓公司重整及成長。 2004年,IBM 把旗下個人電腦部門賣給中國聯想集團(Lenovo Group),到了2009年,IBM服務營利成長到550億美元,佔了公司收入的60%弱,而該部門的顧問服務連帶也賣出了許多IBM 軟体,營業額達到21億美元。

Xerox_6085_System
1981年全錄(Xerox)打造出全新的電腦6085,有不少驚人的創新特色------滑鼠、乙太網路、電子郵件、開合自如的視窗,售價一萬六仟美元,沒有找到買家,但卻為未來的「PC」及「蘋果電腦」墊定商機。

「人工智慧」在早期就出現分岐,一派的人務實,打造一個「專家系統」,研發出為「特定行業」設計的聰明軟体,例如幫旅遊業設計的程式,可以解答有關迪士尼或巴黎的問題,找到便宜的機票及飯店房間,方式就是把這種「專家系統」管轄的範圍界定清楚,以「Room」這個字為例,對這類的「專家系統」而言,指的就是「房間」,不會是「空間」。 另一派的人則走「類神經網路」,以晶元組成「神經元」模式,再組成「神經網路」,就能分析複雜系統,例如金融市場或全球氣候,並運用統計分析去預測日後可能的表現。

華生在實驗室中的名字叫「Blue J. 」J. 是「Jeopardy!」之意,書中直譯為「藍險!」。領隊「David Ferruchi」最終必需把團員集中在一個辦公室中(名之為作戰室),才能加快溝通協商,這讓我想到很多軟体設計師希望在南港科學園區成立「軟体設計中心」,讓他們能離開家中到此集中上班,交換意見,可以加快軟体的開發速度,看來非無的放矢,有華生的前車之鑑在前。

我註:這本書看到這裏有些煩,不是書寫的不好,而是太記述性,所以比較專業的那部份沒有著墨,或者寫的很零亂,讓讀的人要反覆看才能猜出來它想說的意思,搞的我讀來意興闌珊,讀完一章就先停下來去看別的資料。

IBM 創造了很多讓全球琅琅上口的「產品」名稱,例如「PC」之於個人電腦;「ThinkPad」之於頂級商用NB;「Seletric」之於電動打字機。 但當IBM轉向以服務為重點時,強調可靠性、效率和安全性,對於品牌形像的打造,陷於死氣沉沉。

設計「華生」那個視覺上胖嘟嘟地球儀形像的人是「Joshua Davis」,他是設計「IE 4」瀏覽器視覺外貌的設計師。這個胖嘟嘟地球儀是抽像代表智慧,會表達電腦「認知過程」,以友善、平穩的男聲來回答問題,不會隨著比賽的起伏,而出現洩氣、懊悔的語氣,自然更不會顯現「幸災樂禍」的情緒。(哇噻! 簡直是星際爭霸戰中的瓦肯人)。 會如此設計的主因是,IBM公司市場部門擔心電腦如果行為表現或者看起來太像真人的話,會引發數百萬觀眾的不安。(我註:例如天網這樣的電腦系統是會讓人類不安的)。

IBM 設計華生這種電腦是有其目的,前面已說明清楚,IBM 時下最重要的業務是「服務諮詢」,所以搭配合用的軟体技術輸出是一個新的產業方向。IBM希望華生這種電腦能很快的配置在全球成為商業諮詢的主力,所以打敗「危險境地!」(Jeopardy!)參賽人類對手是很重要的一場「秀」。

「華生」研發團隊主管「David Ferruchi」構想上只希望這部電腦達到「Kim Peek」(1951~ 2009)這類人的問答本事就好。  「Kim Peek」可說是個會走路的「百科全書」,他擁有驚人的記憶力,能記的住每一個細節,但可惜腦袋中缺乏連結左右腦的「軸突纖維束」,也就是「胼胝体」(Corpus Callosum),無法將左右腦連結一起工作,(我註:左腦擅長語言、概念、數字、分析、邏輯推理, 右腦擅長音樂、繪畫、空間幾何。)導致「Kim Peek」除了父親外與他人少具有意義的互動,而且無法從他吸收到的知識中獲得成熟的推理及結論。

如果你讀完「Kim Peek」他的生平,大概就理解「David Ferruchi」對「華生」的期待了,他只要一台能記住所有事情,能比對細節,能理解人類語言,針對問題,將最可能的答案找出來的「電腦」。「David Ferruchi」沒有打算製造出真正的「人工智慧」,他只是很務實的想作出一部能記憶「專業」上該有的知識,作為人類的補助記憶体,同時回答問題的「專業搜尋引擎罷了。

真正的「電腦智慧」與電腦的容量、運算速度及電力無關,而是跟它的軟体程式有關,各種指令和架構組成的「演算法」才是電腦通往更高層次思想「概念、理念、理論」等的關鍵。  10年之內,電腦的速度會加快500倍,能以目前千倍以上的速度掃過整個資料庫,而同時,人類對於大腦的神經元運作功能會知道的愈來愈多,就更能寫出符合大腦運作方式的「演算法」給電腦來用,生化科技結合電腦科技,進行著達爾文式的「物種演化理論」,只是這次發生在電腦身上羆了,所以具有人類智慧的「電腦」出現只是遲早的事,不是夢想。

過去的10年中,因為「Web」發展超過想像,人們把工作、郵件、學業、電話內容及人際互動等等都搬到了數位網路中,全部以數據資料儲存下來,但他們都是語言文字或影音資料,不是標準的「結構性資料」。 所以類同「華生」的電腦軟体設計團隊,他們主要的工作是寫出像人類「大腦海馬」(Hippocampus)功能的程式,讓電腦能對源源不絕輸入或者已存在網路中的「文字、對話、聲音、影像」等資料過濾篩選,分門別類的儲放,讓電腦學習經歷「認知」過程,形成「知覺」及理解「象徵」性的東西,最終發展出「概念性」的認知及作出「推論或結論」。

一旦電腦能處理這種訊息,只要懂得打字或只會說話的人(我註:這是指電腦有能力解譯人類的語言,特別是口語化的語言),都成了潛在的「程式設計師、資料探戡家、分析師」,只要使用的人類有清楚的「邏輯概念」,你想從電腦身上獲得什麼樣的答案,剩下全部交由電腦來掃瞄、抓取、分析、整理,最終給予一份報告,再由詢問的人類作最後的審閱,確定其是否有用。

IBM公司現在面對的問題是:

1、華生系統要成為一個專業領域諮詢服務系統,例如客服熱線中心(Call Center),、製藥實驗室中的研究助理、律師助理等,它需要花多少時間來輸入資料及成本如何計算?

2、這種新的知識引擎會不會引發業界反彈?  畢竟它的出現就是想取代「人力」。

3、這種能理解自然語言、消化驚人資料量,又能提出合理假設的電腦,進入了辦公室及實驗室,它就不再是在「危險境地!」(Jeopardy!)中比賽的「華生」了,從谷哥歌到矽谷眾多的創投公司,肯定都會在這一市場競爭。


 IBM公司最想要把「華生」電腦用於他們全球服務事業群中的「醫療部門」,這個部門擁有超過40億美元的以上的營收,具有全球500強企業的規模。他的業務內容是為「醫院」「保險公司」運作大規模的「資料中心」,同時協助客戶分析「數據」,找出「症狀、療法、疾病」等模式,以降低成本。(我註:運作方式請參考2011年8月編號114科學人閱讀心得第二篇:越貴的藥越有效?)

主持 IBM這個醫療部門的說,最寶貴的資訊是醫生看診過程中所見所思的「臨床筆記」,這些文字或者語音影像敘述,都是非結構性資訊,很少被記錄下來存放在電腦中。 「Joseph Jasinski相信如果能記錄研究這些臨床筆記的話,就可以分析病情的相似處,比較出症狀及療法,研究醫療結果,可以縮短病人四處求醫的痛苦,找出最有效且成本最低的療法。 這對於一年二兆三仟萬美元產值,但卻支離破碎的美國醫療体系有著很大的幫助,因為它可以聯結醫生開處方,保險公司負責付款,原本無法反饋的迴圈,讓它們終於頭尾銜接的上。

根據本書的推測,醫學用的新一代電腦還有更大潛力,估計10年內,完成個人全基因定序的費用可能不到100美元(目前矽谷新創公司23andMe,為客戶作基因基本解碼費用僅為429美元);而英特爾正在替銀髮族家庭配備個人攜帶式感應器,測試各種動態,幾乎涵蓋所有的行為,從夜間如廁到輸入電腦裏的文字都包括在內,而每個人隨身攜帶的手機也不知不覺的透露了自己移動的範圍和路線,對醫療研究者來說,「行為數據」是無價之寶。

卡內基美隆大學教授「Luis Von Ahn] 想出了一個叫「EPS」(心有靈犀)的線上遊戲,方式為二個互不相識的網路使用候會看到同一張圖片,如果二個人都用輸入同樣的字眼去形容這圖片的話,就會出現另一張圖片,如此繼續比賽下去,要在2.5分鐘作完15張圖片的描述。就在這種遊戲過程中,參預遊戲的人已經為這些圖片加上資料標籤(Tags),這是電腦尚末能精通的差事。 因為圖片加了資料標籤(Tags),所以搜尋引擎就可以快速的找到他們。   「Luis Von Ahn] 在2006年將這個技術授權給「Google」。

「Luis Von Ahn] 的另一個發明是「ReCaptcha」,一般網友在登入網站或完成購物手續前,會看到一個「彎曲變形字体」的圖片,你必需輸入自己辨識出來的字母,來証明你是人類而非盜取資料軟体。這些「彎曲變形字体」的素材來自圖書館的老書,人類在輸入這些扭曲變形字体時,也順手協助了將這些老書數位化的艱巨工程,當然也進到了谷歌資料庫中,因為2009年,它買下了這項技術。

No comments: