人工智慧的限制反映了人類的限制
余創豪 chonghoyu@gmail.com
現在人工智慧已經是學術界和大眾文化
的熱門話題,到底什麼是人工智慧呢?簡單
地說,人工智慧就是以機器來模仿人類智
慧。那麼,什麼是人類智慧呢?智慧的定義
可說是人言人殊,要深入去探究,恐怕三日
三夜也說不完。有趣的是,一些電腦學家往
往只是採用表面的結果和狹窄的準則去衡量
智慧。
1950 年英國數學家艾倫‧圖靈(Alan
Turing)提出了著名的「圖靈測試」(Turing
test),為人工智能系統設定了成功的標準,
所謂「圖靈測試」 是指測試者與一個「神秘
客」在採用自然語言對話的時候,發現對方的說話頭頭是道,測試者無法判斷回答的一方
到底是人還是機器,或者認為對方大有可能是真人。然而,若果對方是機器,那麼這台機
器便算是通過了「圖靈測試」。
「圖靈測試」 的原則與心理學上的行為主義十分接近,行為主義萌芽於 1920 年代,
在二次大戰之後曾經成為美國心理學的主流,顧名思義,行為主義的焦點就是人類的外顯
行為, 行為主義者主張心理學家只需要採用獎賞和懲罰的方法,令人做出理想的結果,
你完全不需要考慮內在的心理過程,例如一個人做這件事的動機和思考方法。圖靈並不一
定參考了行為主義,但明顯地他的想法好像是行為主義者,他認為做出來的結果好像很有
智慧便算合格。
美國哲學家約翰‧塞爾 John Searle
對人工智慧持批判態度,1980 年他提出一
個著名的思想實驗來作為反駁的論據,這思
想實驗叫做「中文房間」(Chinese
Room):在一個房間裡,塞爾擁有漢語文
法的所有資料,當房間外的人用中文向他提
問時,他可以藉助這些資料而輸出中文的答
案,屋外的人便誤以為屋內真的有一個懂得
中文的人,其實,他只是以機械化的方式處
理中文句法,在這個過程中完全沒有理解和
真正的智慧。塞爾質問:這樣去通過圖靈測
試又有什麼意義呢?
1990 年,美國人休斯‧勒布納 Hugh Loebner )以他的名字設立了每年一度的人工
智能競賽,看看是否有任何電腦系統可以通過圖靈測試,他頒發的獎金由二千美元至二萬
五千元不等。但這個比賽受到不少批評,因為很多參賽者並不是真的去建立能夠明白內容
意義的電腦系統,而是採用蒙騙的手法令人覺得電腦具有智能。
其實,人工智能的問題反映了人類的問題,雖然塞爾的「中文房間」是一個假設性的
思想實驗, 但是,人類社會到處充斥着「中文房間」。在塞爾的「中文房間」裏面,你
只需要掌握了漢語的文法和詞彙,那麼即使在處理資料的過程中不求甚解,最後亦可以令
人產生以為你精通中文的錯覺。在現今的教育制度中,同樣的鬧劇每天都在上演!
讓我先以數學來作為例子,美國數學教育家保羅‧洛克哈特(Paul Lockhart 批評很
多老師都是採用機械式的方法教數學,學生只是牢記公式,然後依樣畫葫蘆地將數字代入
公式,答案當然是正確的,於是乎學生可以得到合格甚至是優異的成績,但他們根本不知
道自己做什麼,可以說,他們所處新的教室就是一種「中文房間」。洛克哈特的批評對象
主要是中小學,但這種現象也出現在大學本科和研究院裏面,不少研究生和教授採用統計
學的方法進行數據分析和撰寫論文,他們懂得遊戲的規則和行內人的術語,很多時候論文
都通過了審查,但這一切無非是行為主義式的「成功」。
1996 年,美國數學與物理學教授艾倫‧蘇加(Alan Sokal 曾經在一篇胡說八道的論
文中 堆砌了許多看上去很有深度的後現代主義哲學術語,然後投稿予一份在學術界相當
有地位的期刊,目的是看看審稿人是否可以分辨出這是一篇偽論文,在某個意義上這是另
類的「圖靈測試」, 結果這學術期刊接納並且刊登了這篇文章!後來蘇加自爆,這個試
驗令期刊的編輯尷尬不已。
這並不是美國人獨有的問題,筆者在香港時,大學入學試中國歷史科的考試範圍包括
了宋明理學,曾經有考生背熟了王陽明、陸九淵、朱熹……等思想家的用詞,跟着在試卷
中按照教科書標準答案的規格重新組織這些語句,結果取得了甲級成績! 這完全是「中
文房間」式的運作,他承認自己完全不明白那些深奧的哲學思想。改卷的老師無法分辨出
這學生是真的有學問還是蒙混過關,這學生也算是通過了另類的「圖靈測試」。
不少人工智能專家批評「圖靈測試」並沒有清楚地和有效地定義智能,這種測試側重
於表徵而忽視內涵。細心思想的話,其實這種限制正是反映了人類社會的限制。無論是古
今中外,任何教育制度、考核制度都出現了徒具形式甚至是魚目混珠的現象,也許 問題
的癥結是:直到目前為止我們仍然難以完整地和準確地為智慧的下定義,有些讀者可能會
追問:「IQ 測驗不是已經定義了什麼是智能嗎?」 其實標準的智商測驗是有許多爭議的
地方,限於篇幅,恕我不能在此討論。
2023 3 5
原載於澳洲《同路人》雜誌
更多資訊