心理學家也搞數學模型？！《淺談心理學中的類神經網路》

是的，至少不是所有的心理學家都像一般人想像得那般文科。事實上，使用數學模型描述人類行為是心理學邁向科學很重要的一步。早在十九世紀末，就有心理物理學家想了解人們對外在物理訊號的心理感受，是否和物理訊號的強度之間存有著什麼樣的關係，並嘗試以數學函式將之定理化（例如，Fechner’s Law）。而在行為主義時代，數學模型也大量被使用，其中像是在描寫制約學習（conditioning）發生的模型，至今仍相當有用。隨著時代演進，簡單的數學公式不足以描述複雜的行為時，自然會有更複雜的數學公式被提出來做為模型，甚至是一整串的數學方程式構成的體系來說明這些複雜的行為。再加上，不同時代裏有不同的流行，所以心理學家們使用的數學模型種類，常常一陣子吹這個風，另一陣子又吹另一種，而類神經網路就是其中的一種。

類神經網路的特色

類神經網路模型也是心理學家嘗試使用的一種數學模型，只是相較於其它數學模型，類神經網路的開發更強調它的仿生性。早在50年代末期就有師法神經元運算方式的類神經網路－Perceptron被開發出來（Rosenblatt, 1958,1961）。神經科學的研究發現，當兩個神經元同步興奮（firing）或不興奮一段時間之後，兩者之間的連結強度（associative strength）就會增強，即，當其中某個神經元被激發了（activated），另一個的興奮程度也會上升；反之，若兩者的激發狀態並不同步，則它們之間的連結強度就會降低。 Perceptron就是一個試圖使用數學方程式描繪上述歷程的類神經網路模型，其中包括兩層神經元，依訊號傳遞方向分為輸入與輸出兩層，每一個輸入層的節點（即，神經元）皆與每一個輸出層節點相連，這相連的強度為一矩陣，記錄著兩層之間的連結強度。

類神經網路最迷人的特色在於，它可以自主學習。如果我們想讓Perceptron學習做AND的邏輯判斷（兩命題中只要有一者為假，則A&B判斷式的邏輯值為假），我們不需要真的寫一段程式碼，要它做A&B的判斷；相對地，我們只需要給Perceptron所有A和B的真假值組合，並且讓它知道各個組合各自應該回答的真假值為何，則透過回饋學習（error-driven learning），Perceptron自然便能學會AND法則。這就好像人類在教小孩子一樣，讓小孩子看一張貓的圖片，他回答狗時，我們糾正他那個應該是貓。久而久之，小孩子自然能學會把貓的圖片配對上貓這個答案，而不用我們去定義什麼叫作貓。

除了自主學習之外，類神經網路的另一好處是，我們並不需要在理論中先假設一個變數叫”心智”，便能得到與心智運算相當的行為結果。這大大解決了心理學家建構理論時遇到的腦中小人悖論。所謂的腦中小人是指，我們假設人類的腦中還有小人，那小人負責解釋我們看到的物體是什麼顏色、質地等等。倘若這個想法可以成立，那小人的腦中是否還會有小人？如果再有小人，那小人腦中的小人，他的腦中是否還會有更後面的小人呢？這樣的想法自然無助於建構理論，因此，類神經網路有機會協助心理學家擺脫這種推理上的無窮循環。

心理學家對類神經網路的懷疑與解脫

早期的兩層結構Perceptron很快就被發現解決不了XOR這類邏輯判斷式的學習問題（Minsky & Papert, 1967），宣告無解的情況下，使得類神經網路沈寂了好多年。直到80年代中葉，三層結構的類神經網路模型，以及backpropogation演算法提出後（見 Rumelhart & McClelland, 1986），才成功克服這個問題，於是類神經網路模型又熱門起來。然而，這中間加入的隱藏層卻又可能引發一些心理學家的懷疑。

心理學家對隱藏層的態度是很矛盾的。我們一方面可以將之視為內在表徵（mental representation）的具象代表。不過，很多時候，當增加了隱藏層節點個數（即，也增加了層與層之間的連結個數）後，類神經網路模型的表現就提升了。從這方面來看，我們也會懷疑，那隱藏層究竟代表什麼？資訊科學家不必在意這種事，就算一直增加隱藏層，只要機器的表現確實提升就可以，但心理學家就會問，這樣的作法究竟有沒有心理實質性（psychological reality）？舉個例子來說，假定在大腦解剖上我們已知處理視覺訊號的腦區有V1、V2、V3到V4區。如果一個用來模擬視覺運作的類神經網路使用了7個隱藏層，縱使它的表現一如人類，我們還會不會接受它可以作為我們視覺運作的模型呢？

像這樣的問題是心理學家審視自己的模型是否合宜時的呢喃低語。不過，Marr（1982）提出的理論三層次幫研究者們做了很好的釐清。根據Marr的看法，心理學理論可以有三個層次。最表層的是行為層次（computational level），最裏層的是生理層次（physical level），而中間則是演算法層次（algorithematic level）。用一個比喻來說，我們如何描述鳥是如何飛翔的？我們可以在表層行為上描述，鳥會先助跑，鼓動翅膀，彈跳⋯⋯然後飛行。然而，如果沒有相應的硬體，即羽毛、中空的骨胳、流線型的身體⋯⋯等的生理組合，也無法完成飛行。不過，如果僅有這兩個層次，我們仍然不知道究竟鳥如何能飛？這中間勢必要有一個層次連結著生理硬體，作出在外觀行為上看到的飛翔行為。這個中間的層次叫演算法層次，而類神經網路相較於其它數學模型，它更適合用於描述這個層次。即，當我們使用類神經網路作為人類某個行為的模型時，我們的重點會偏重於，該生成該行為的內在機制（mechanism）。所以啦，當我們在看待一個心理學的模型時，應該先去了解它究竟是在那個層次發言，而不需急著判定優劣好壞。

一些和模擬有關的誤解與討論

過往在面對類神經網路，或者更廣義一點來說，當我們在心理學研究中面對模擬（modeling）這回事時，常會有一些態度上的誤解。第一，誤把模型當作人。任何一種模型都只代表了某個理論觀點，即，模型是理論的具體化。由於，理論就只是一種用來理解研究對象的看法，它不會是它的研究對象，自然用來描述人類行為的模型也不會等於人。

第二，誤把心理（認知）模型視同於統計模型。在統計上我們有許多模型，像是迴歸模型（regression model），用來描述變項之間的關係。雖然我們也可以說某個認知作業中的行為與某變項有關連，並建立迴歸模型；但我們實質上並沒有因為這個迴歸模型而多知道了些該變項”如何”發生影響，使得該行為生成。此外，統計模型往往不是針對某個特殊的心理運作發展，相對地，它是開發給所有研究者使用的資料分析工具；只要資料滿足該統計模型的假設就可以使用。這點也和心理學中的認知模型並不相同。

第三，誤以單一種模型作為全體模型之代名詞。有時候這也是莫可奈何的事，畢竟很多人不是先上過一門認知模擬的課，才接觸模擬，而是直接從某個模型入手了解模擬。不過，既然前面已經交代過各種背景了，相信現在再回頭來看，應該可以有更寬的視野來了解模型與模擬。

第四，雖然類神經網路看似和神經很像，但其實一點也不能將這二者混用。事實上，當初Rumelhart和McClelland一開始的確希望類神經網路如同真實神經網路，但來參加討論的克拉克（提出DNA雙股螺旋結構者之一）一直無法被說服（事實上，真的要模擬真實神經元的全貌，類神經網路還有一段不短的路程要努力）；後來，他們也因此放棄使用neural network這個名詞而改成PDP（parallel distributed processing）。

在台灣心理學環境中不容易培養作模擬的人才？

由上可知，模擬也是心理學研究的一種方法，但其實在台灣卻不太常見。何也？一個簡單的答案是：門檻太高。首先要能懂得心理學理論，而後又能了解模型的數學方程式乃至於自己發展新的方程式，最後，還得要寫成電腦程式，使得模型能實際運作。而且，當面臨到使用模型去適配資料（data fitting）時，參數調整的最佳化（optimization）該如何作？又如模型與模型之間的比較又該如何進行？這類看起來在傳統心理系裏不會有課可以教的東西，都將會是我們做模擬時需要用到的知識。的確不太容易吧。無怪乎，也有人認為，工科背景的學生來做心理學的模擬，要比心理系學生自學做模擬來得容易。不過，那也要該生補齊做模擬時需要的心理學相關知識才行。

結語

這篇文章的起因是為了要答覆一個學生的發問，不料愈寫愈多，乾脆就獨立成文了。類神經網路在心理學裏的應用除了文中所述之外，也有被應用於計算神經科學（computational neuroscience），即，使用類神經網路去模擬真實神經元之間神經傳導素（neurotransmitter）的作用，或者各腦區的神經運作等等。尤其近年來，腦造影研究的興起，如何發展具有腦實質性（brain reality）的模型，也促使類神經網路受到重視。雖然，文章結尾處讓人感覺有道技術力的高牆，不過，在現代電腦科技發達的幫助下，程式設計也不再那麼嚇人。加以，類神經網路用到的數學其實並沒有想像中複雜可怕。一般心理系學生花上一年的時間好好學習，而不是依賴軟體套件，相信都能有所成就。

參考文獻

Marr, D. (1982). Vision. Cambridge, MA: MIT Press.
Minsky, M., & Papert, S. (1967). Linearly unrecognizable patterns. AIM 140, MIT.
Rosenblatt, F. (1958). The perceptron: A probabilistic model for information storage and
organization in the brain. Psychological Review, 65, 386–408.
Rosenblatt, F. (1961) Principles of neurodunamics. Washington, DC: Spartan Books.
Rumelhart, D., & McClelland, ]. (1986) Parallel distributed processing: Explorations In the microstructure of cognition. Cambridge, MA: MIT Press.

心理學家也搞數學模型？！《淺談心理學中的類神經網路》

類神經網路的特色

心理學家對類神經網路的懷疑與解脫

一些和模擬有關的誤解與討論

在台灣心理學環境中不容易培養作模擬的人才？

結語

過年長輩問候生存術，五招讓你化尷尬為歡樂～

AI可以陪你聊天，但它能當心理師嗎？

想增進記憶力，試試學習完去運動吧！

被貼標籤也可以有好處

掌握9大要素！不再害怕跟異性聊天

類神經網路的特色

心理學家對類神經網路的懷疑與解脫

一些和模擬有關的誤解與討論

在台灣心理學環境中不容易培養作模擬的人才？

結語

我想看更多…