是的,至少不是所有的心理學家都像一般人想像得那般文科。事實上,使用數學模型描述人類行為是心理學邁向科學很重要的一步。早在十九世紀末,就有心理物理學家想了解人們對外在物理訊號的心理感受,是否和物理訊號的強度之間存有著什麼樣的關係,並嘗試以數學函式將之定理化(例如,Fechner’s Law)。而在行為主義時代,數學模型也大量被使用,其中像是在描寫制約學習(conditioning)發生的模型,至今仍相當有用。隨著時代演進,簡單的數學公式不足以描述複雜的行為時,自然會有更複雜的數學公式被提出來做為模型,甚至是一整串的數學方程式構成的體系來說明這些複雜的行為。再加上,不同時代裏有不同的流行,所以心理學家們使用的數學模型種類,常常一陣子吹這個風,另一陣子又吹另一種,而類神經網路就是其中的一種。
類神經網路的特色
類神經網路模型也是心理學家嘗試使用的一種數學模型,只是相較於其它數學模型,類神經網路的開發更強調它的仿生性。早在50年代末期就有師法神經元運算方式的類神經網路-Perceptron被開發出來(Rosenblatt, 1958,1961)。神經科學的研究發現,當兩個神經元同步興奮(firing)或不興奮一段時間之後,兩者之間的連結強度(associative strength)就會增強,即,當其中某個神經元被激發了(activated),另一個的興奮程度也會上升;反之,若兩者的激發狀態並不同步,則它們之間的連結強度就會降低。 Perceptron就是一個試圖使用數學方程式描繪上述歷程的類神經網路模型,其中包括兩層神經元,依訊號傳遞方向分為輸入與輸出兩層,每一個輸入層的節點(即,神經元)皆與每一個輸出層節點相連,這相連的強度為一矩陣,記錄著兩層之間的連結強度。
類神經網路最迷人的特色在於,它可以自主學習。如果我們想讓Perceptron學習做AND的邏輯判斷(兩命題中只要有一者為假,則A&B判斷式的邏輯值為假),我們不需要真的寫一段程式碼,要它做A&B的判斷;相對地,我們只需要給Perceptron所有A和B的真假值組合,並且讓它知道各個組合各自應該回答的真假值為何,則透過回饋學習(error-driven learning),Perceptron自然便能學會AND法則。這就好像人類在教小孩子一樣,讓小孩子看一張貓的圖片,他回答狗時,我們糾正他那個應該是貓。久而久之,小孩子自然能學會把貓的圖片配對上貓這個答案,而不用我們去定義什麼叫作貓。
除了自主學習之外,類神經網路的另一好處是,我們並不需要在理論中先假設一個變數叫”心智”,便能得到與心智運算相當的行為結果。這大大解決了心理學家建構理論時遇到的腦中小人悖論。所謂的腦中小人是指,我們假設人類的腦中還有小人,那小人負責解釋我們看到的物體是什麼顏色、質地等等。倘若這個想法可以成立,那小人的腦中是否還會有小人?如果再有小人,那小人腦中的小人,他的腦中是否還會有更後面的小人呢?這樣的想法自然無助於建構理論,因此,類神經網路有機會協助心理學家擺脫這種推理上的無窮循環。
心理學家對類神經網路的懷疑與解脫
早期的兩層結構Perceptron很快就被發現解決不了XOR這類邏輯判斷式的學習問題(Minsky & Papert, 1967),宣告無解的情況下,使得類神經網路沈寂了好多年。直到80年代中葉,三層結構的類神經網路模型,以及backpropogation演算法提出後(見 Rumelhart & McClelland, 1986),才成功克服這個問題,於是類神經網路模型又熱門起來。然而,這中間加入的隱藏層卻又可能引發一些心理學家的懷疑。
心理學家對隱藏層的態度是很矛盾的。我們一方面可以將之視為內在表徵(mental representation)的具象代表。不過,很多時候,當增加了隱藏層節點個數(即,也增加了層與層之間的連結個數)後,類神經網路模型的表現就提升了。從這方面來看,我們也會懷疑,那隱藏層究竟代表什麼?資訊科學家不必在意這種事,就算一直增加隱藏層,只要機器的表現確實提升就可以,但心理學家就會問,這樣的作法究竟有沒有心理實質性(psychological reality)?舉個例子來說,假定在大腦解剖上我們已知處理視覺訊號的腦區有V1、V2、V3到V4區。如果一個用來模擬視覺運作的類神經網路使用了7個隱藏層,縱使它的表現一如人類,我們還會不會接受它可以作為我們視覺運作的模型呢?
一些和模擬有關的誤解與討論
過往在面對類神經網路,或者更廣義一點來說,當我們在心理學研究中面對模擬(modeling)這回事時,常會有一些態度上的誤解。第一,誤把模型當作人。任何一種模型都只代表了某個理論觀點,即,模型是理論的具體化。由於,理論就只是一種用來理解研究對象的看法,它不會是它的研究對象,自然用來描述人類行為的模型也不會等於人。
第二,誤把心理(認知)模型視同於統計模型。在統計上我們有許多模型,像是迴歸模型(regression model),用來描述變項之間的關係。雖然我們也可以說某個認知作業中的行為與某變項有關連,並建立迴歸模型;但我們實質上並沒有因為這個迴歸模型而多知道了些該變項”如何”發生影響,使得該行為生成。此外,統計模型往往不是針對某個特殊的心理運作發展,相對地,它是開發給所有研究者使用的資料分析工具;只要資料滿足該統計模型的假設就可以使用。這點也和心理學中的認知模型並不相同。
在台灣心理學環境中不容易培養作模擬的人才?
由上可知,模擬也是心理學研究的一種方法,但其實在台灣卻不太常見。何也?一個簡單的答案是:門檻太高。首先要能懂得心理學理論,而後又能了解模型的數學方程式乃至於自己發展新的方程式,最後,還得要寫成電腦程式,使得模型能實際運作。而且,當面臨到使用模型去適配資料(data fitting)時,參數調整的最佳化(optimization)該如何作?又如模型與模型之間的比較又該如何進行?這類看起來在傳統心理系裏不會有課可以教的東西,都將會是我們做模擬時需要用到的知識。的確不太容易吧。無怪乎,也有人認為,工科背景的學生來做心理學的模擬,要比心理系學生自學做模擬來得容易。不過,那也要該生補齊做模擬時需要的心理學相關知識才行。
結語
這篇文章的起因是為了要答覆一個學生的發問,不料愈寫愈多,乾脆就獨立成文了。類神經網路在心理學裏的應用除了文中所述之外,也有被應用於計算神經科學(computational neuroscience),即,使用類神經網路去模擬真實神經元之間神經傳導素(neurotransmitter)的作用,或者各腦區的神經運作等等。尤其近年來,腦造影研究的興起,如何發展具有腦實質性(brain reality)的模型,也促使類神經網路受到重視。雖然,文章結尾處讓人感覺有道技術力的高牆,不過,在現代電腦科技發達的幫助下,程式設計也不再那麼嚇人。加以,類神經網路用到的數學其實並沒有想像中複雜可怕。一般心理系學生花上一年的時間好好學習,而不是依賴軟體套件,相信都能有所成就。
- Marr, D. (1982). Vision. Cambridge, MA: MIT Press.
- Minsky, M., & Papert, S. (1967). Linearly unrecognizable patterns. AIM 140, MIT.
- Rosenblatt, F. (1958). The perceptron: A probabilistic model for information storage and
- organization in the brain. Psychological Review, 65, 386–408.
- Rosenblatt, F. (1961) Principles of neurodunamics. Washington, DC: Spartan Books.
- Rumelhart, D., & McClelland, ]. (1986) Parallel distributed processing: Explorations In the microstructure of cognition. Cambridge, MA: MIT Press.