行為主義心理學在人工智能中鹹魚翻生

余創豪 chonghoyu@gmail.com

不用我多介紹，大家都知道，現在人工智能與機械學習已經影響到人們生活的每一個

環節。但可能很少人知道，當今其中一種機械學習模型是基於一個所謂過時的心理學說：

行為主義（Behaviorism ）。

很多年前筆者修讀心理學時候，弗洛伊

德的精神分析與史金納（B F. Skinner ）的行

為主義心理學是兩個飽受批評和嘲諷的心理

學派，有些人高舉這兩個學派以外的第三勢

力：馬斯洛的人文主義心理學。後來出現的

認知心理學（Cognitive psychology ）更加成

為了心理學的主流，行為主義彷彿成為了心

理學歷史書的一個註腳。

為什麼曾經盛極一時的行為主義後來會

成為眾矢之的呢？讓我先簡單介紹行為主義

的要點，顧名思義，行為主義的重點是人類

的行為，史金納認為心理學應該將注意力放在怎樣解釋和改變行為，而不需要探究思想的

內部過程。人類行為是對外部刺激的反應（stimulus-response ），通過獎賞和懲罰，你就

可以改變一個人，例如強化（reinforce ）他的行為。史金納曾經跨下海口：「給我一個孩

子，我可以將他塑造成任何人。」史金納在其名著《超越自由與尊嚴》（Beyond Freedom

and Dignity）中，批判了傳統的自由和尊嚴觀念，他認為兩者都構成了對科學和社會進步

的障礙，因為自由意志和個人自主的概念是虛幻的，人類行為主要受環境偶然事件的影

響。

相信即使沒有受過心理學訓練的讀者也可以指出行為主義的問題。行為主義過度簡化

了心理學，將人類視為沒有個性的機器，其實，即使面對同樣的外部環境刺激，不同人會

有不同的反應，行為主義完全沒有考慮個體差異。行為主義的做法還牽涉到倫理問題，按

照行為主義的方法，你可以軟硬兼施地操控人。

鑒於以上的問題，很多心理學家將行為主

義束之高閣，令人意外的是，在人工智慧盛行

的這個年代，行為主義竟然鹹魚翻生！上世

紀 70 年代和 80 年代，電腦學家參考了行為主

義心理學怎樣強化人類行為的模式，將「強化

學習」（reinforcement learning）應用於簡單的

問題，例如控制機械人和讓電腦玩簡單的遊

戲。踏入 90 年代和兩個世紀之交替期間，

「強化學習」的電腦程式突飛猛進。強化學

習與其他人工智能的學習演算法有一個很大的

區別：強化學習願意承受短暫的損失，從而取

得長遠的利益，以下棋為例，玩這個遊戲的最終目的是全勝，強化學習的人工智能不會貪

吃眼前的兵卒，而是推算在幾十步之後怎樣把對方將軍。換句話說，強化學習情願輸掉

戰鬥，也要贏取整場戰爭（lose the battle but win the war ）， 2016 年谷歌的人工智能系統

AlphaGo 打敗了世界棋王，正是採用這種戰略。如今，強化學習已經被廣泛應用於解決各

種實際問題，例如自動駕駛、推薦系統、個性化醫療……。

為什麼行為主義在人工智能這領域中會取得如此巨大的成就呢？上面提過行為主義的

缺點在電腦裏面反轉過來，變成了優點！不錯，行為主義過度簡化了人類複雜的心理，

人類不是機器，人類有個性、情緒、偏見、自由意志。然而，電腦就是機器！電腦沒有

個性，同樣的輸入會得到同樣的結果；人類並不善於學習，有時候縱使受過無數的獎賞和

懲罰，人類仍然沒有因此而改變行為，我們有許多詞語和句子來描述這種現象：「江山

易改，品性難移」、「冥頑不靈」、「花崗石腦袋」、「屎坑石頭，又硬又臭」、「意

見接受，行動照舊」、「歷史給予人最大的教訓，就是人類從來沒有從歷史吸取教

訓」……。但機械學習卻完全是另一回事，在大多數情況下，演算法從過去案例的錯誤

中學習了教訓之後，便會不斷地完善自己，不會重複同樣的錯誤。還有，強化學習可以

高瞻遠矚，但人類往往貪圖眼前的利益，因小失大。

一位名叫基思賈爾斯（Keith Giles ）的美國牧師在一篇研討人工智能會否威脅宗教的

文章中指出：「我們不應該害怕人工智能比人類更加聰明……，應該令我們恐懼的是，

我們創造了知道如何克服人類弱點的機械學習。」賈爾斯在他的文章中只是討論一般的人

工智能，而不是強化學習，但這真知灼見更加適用於強化學習。

此外，行為主義的敗部復活實在令人鼓舞，誰會料到，在心理學裏面被認為是過度簡

化和過時的理論，竟然幾十年後在人工智能領域中大放異彩呢？套用在人生的際遇上，也

許換了環境，一個人的短處會突然之間變成了長處！我經常用這種想法來鼓勵自己。

2023 年 2 月 28 日

原載於香港《有情無國界》

更多資訊