是的,至少不是所有的心理學家都像一般人想像得那般文科。事實上,使用數學模型描述人類行為是心理學邁向科學很重要的一步。早在十九世紀末,就有心理物理學家想了解人們對外在物理訊號的心理感受,是否和物理訊號的強度之間存有著什麼樣的關係,並嘗試以數學函式將之定理化(例如,Fechner’s Law)。而在行為主義時代,數學模型也大量被使用,其中像是在描寫制約學習(conditioning)發生的模型,至今仍相當有用。隨著時代演進,簡單的數學公式不足以描述複雜的行為時,自然會有更複雜的數學公式被提出來做為模型,甚至是一整串的數學方程式構成的體系來說明這些複雜的行為。再加上,不同時代裏有不同的流行,所以心理學家們使用的數學模型種類,常常一陣子吹這個風,另一陣子又吹另一種,而類神經網路就是其中的一種。

類神經網路的特色

類神經網路模型也是心理學家嘗試使用的一種數學模型,只是相較於其它數學模型,類神經網路的開發更強調它的仿生性。早在50年代末期就有師法神經元運算方式的類神經網路-Perceptron被開發出來(Rosenblatt, 1958,1961)。神經科學的研究發現,當兩個神經元同步興奮(firing)或不興奮一段時間之後,兩者之間的連結強度(associative strength)就會增強,即,當其中某個神經元被激發了(activated),另一個的興奮程度也會上升;反之,若兩者的激發狀態並不同步,則它們之間的連結強度就會降低。 Perceptron就是一個試圖使用數學方程式描繪上述歷程的類神經網路模型,其中包括兩層神經元,依訊號傳遞方向分為輸入與輸出兩層,每一個輸入層的節點(即,神經元)皆與每一個輸出層節點相連,這相連的強度為一矩陣,記錄著兩層之間的連結強度。

類神經網路最迷人的特色在於,它可以自主學習。如果我們想讓Perceptron學習做AND的邏輯判斷(兩命題中只要有一者為假,則A&B判斷式的邏輯值為假),我們不需要真的寫一段程式碼,要它做A&B的判斷;相對地,我們只需要給Perceptron所有A和B的真假值組合,並且讓它知道各個組合各自應該回答的真假值為何,則透過回饋學習(error-driven learning),Perceptron自然便能學會AND法則。這就好像人類在教小孩子一樣,讓小孩子看一張貓的圖片,他回答狗時,我們糾正他那個應該是貓。久而久之,小孩子自然能學會把貓的圖片配對上貓這個答案,而不用我們去定義什麼叫作貓。

除了自主學習之外,類神經網路的另一好處是,我們並不需要在理論中先假設一個變數叫”心智”,便能得到與心智運算相當的行為結果。這大大解決了心理學家建構理論時遇到的腦中小人悖論。所謂的腦中小人是指,我們假設人類的腦中還有小人,那小人負責解釋我們看到的物體是什麼顏色、質地等等。倘若這個想法可以成立,那小人的腦中是否還會有小人?如果再有小人,那小人腦中的小人,他的腦中是否還會有更後面的小人呢?這樣的想法自然無助於建構理論,因此,類神經網路有機會協助心理學家擺脫這種推理上的無窮循環。

心理學家對類神經網路的懷疑與解脫

早期的兩層結構Perceptron很快就被發現解決不了XOR這類邏輯判斷式的學習問題(Minsky & Papert, 1967),宣告無解的情況下,使得類神經網路沈寂了好多年。直到80年代中葉,三層結構的類神經網路模型,以及backpropogation演算法提出後(見 Rumelhart & McClelland, 1986),才成功克服這個問題,於是類神經網路模型又熱門起來。然而,這中間加入的隱藏層卻又可能引發一些心理學家的懷疑。

心理學家對隱藏層的態度是很矛盾的。我們一方面可以將之視為內在表徵(mental representation)的具象代表。不過,很多時候,當增加了隱藏層節點個數(即,也增加了層與層之間的連結個數)後,類神經網路模型的表現就提升了。從這方面來看,我們也會懷疑,那隱藏層究竟代表什麼?資訊科學家不必在意這種事,就算一直增加隱藏層,只要機器的表現確實提升就可以,但心理學家就會問,這樣的作法究竟有沒有心理實質性(psychological reality)?舉個例子來說,假定在大腦解剖上我們已知處理視覺訊號的腦區有V1、V2、V3到V4區。如果一個用來模擬視覺運作的類神經網路使用了7個隱藏層,縱使它的表現一如人類,我們還會不會接受它可以作為我們視覺運作的模型呢?

像這樣的問題是心理學家審視自己的模型是否合宜時的呢喃低語。不過,Marr(1982)提出的理論三層次幫研究者們做了很好的釐清。根據Marr的看法,心理學理論可以有三個層次。最表層的是行為層次(computational level),最裏層的是生理層次(physical level),而中間則是演算法層次(algorithematic level)。用一個比喻來說,我們如何描述鳥是如何飛翔的?我們可以在表層行為上描述,鳥會先助跑,鼓動翅膀,彈跳⋯⋯然後飛行。然而,如果沒有相應的硬體,即羽毛、中空的骨胳、流線型的身體⋯⋯等的生理組合,也無法完成飛行。不過,如果僅有這兩個層次,我們仍然不知道究竟鳥如何能飛?這中間勢必要有一個層次連結著生理硬體,作出在外觀行為上看到的飛翔行為。這個中間的層次叫演算法層次,而類神經網路相較於其它數學模型,它更適合用於描述這個層次。即,當我們使用類神經網路作為人類某個行為的模型時,我們的重點會偏重於,該生成該行為的內在機制(mechanism)。所以啦,當我們在看待一個心理學的模型時,應該先去了解它究竟是在那個層次發言,而不需急著判定優劣好壞。

 一些和模擬有關的誤解與討論

過往在面對類神經網路,或者更廣義一點來說,當我們在心理學研究中面對模擬(modeling)這回事時,常會有一些態度上的誤解。第一,誤把模型當作人。任何一種模型都只代表了某個理論觀點,即,模型是理論的具體化。由於,理論就只是一種用來理解研究對象的看法,它不會是它的研究對象,自然用來描述人類行為的模型也不會等於人。

第二,誤把心理(認知)模型視同於統計模型。在統計上我們有許多模型,像是迴歸模型(regression model),用來描述變項之間的關係。雖然我們也可以說某個認知作業中的行為與某變項有關連,並建立迴歸模型;但我們實質上並沒有因為這個迴歸模型而多知道了些該變項”如何”發生影響,使得該行為生成。此外,統計模型往往不是針對某個特殊的心理運作發展,相對地,它是開發給所有研究者使用的資料分析工具;只要資料滿足該統計模型的假設就可以使用。這點也和心理學中的認知模型並不相同。

第三,誤以單一種模型作為全體模型之代名詞。有時候這也是莫可奈何的事,畢竟很多人不是先上過一門認知模擬的課,才接觸模擬,而是直接從某個模型入手了解模擬。不過,既然前面已經交代過各種背景了,相信現在再回頭來看,應該可以有更寬的視野來了解模型與模擬。
第四,雖然類神經網路看似和神經很像,但其實一點也不能將這二者混用。事實上,當初Rumelhart和McClelland一開始的確希望類神經網路如同真實神經網路,但來參加討論的克拉克(提出DNA雙股螺旋結構者之一)一直無法被說服(事實上,真的要模擬真實神經元的全貌,類神經網路還有一段不短的路程要努力);後來,他們也因此放棄使用neural network這個名詞而改成PDP(parallel distributed processing)。

在台灣心理學環境中不容易培養作模擬的人才?

由上可知,模擬也是心理學研究的一種方法,但其實在台灣卻不太常見。何也?一個簡單的答案是:門檻太高。首先要能懂得心理學理論,而後又能了解模型的數學方程式乃至於自己發展新的方程式,最後,還得要寫成電腦程式,使得模型能實際運作。而且,當面臨到使用模型去適配資料(data fitting)時,參數調整的最佳化(optimization)該如何作?又如模型與模型之間的比較又該如何進行?這類看起來在傳統心理系裏不會有課可以教的東西,都將會是我們做模擬時需要用到的知識。的確不太容易吧。無怪乎,也有人認為,工科背景的學生來做心理學的模擬,要比心理系學生自學做模擬來得容易。不過,那也要該生補齊做模擬時需要的心理學相關知識才行。

結語

這篇文章的起因是為了要答覆一個學生的發問,不料愈寫愈多,乾脆就獨立成文了。類神經網路在心理學裏的應用除了文中所述之外,也有被應用於計算神經科學(computational neuroscience),即,使用類神經網路去模擬真實神經元之間神經傳導素(neurotransmitter)的作用,或者各腦區的神經運作等等。尤其近年來,腦造影研究的興起,如何發展具有腦實質性(brain reality)的模型,也促使類神經網路受到重視。雖然,文章結尾處讓人感覺有道技術力的高牆,不過,在現代電腦科技發達的幫助下,程式設計也不再那麼嚇人。加以,類神經網路用到的數學其實並沒有想像中複雜可怕。一般心理系學生花上一年的時間好好學習,而不是依賴軟體套件,相信都能有所成就。

 

參考文獻
  1. Marr, D. (1982). Vision. Cambridge, MA: MIT Press.
  2. Minsky, M., & Papert, S. (1967). Linearly unrecognizable patterns. AIM 140, MIT.
  3. Rosenblatt, F. (1958). The perceptron: A probabilistic model for information storage and
  4. organization in the brain. Psychological Review, 65, 386–408.
  5. Rosenblatt, F. (1961) Principles of neurodunamics. Washington, DC: Spartan Books.
  6. Rumelhart, D., & McClelland, ]. (1986) Parallel distributed processing: Explorations In the microstructure of cognition. Cambridge, MA: MIT Press.

Comments are closed.