2017-09-05

夏肇毅觀點:複製小抄大腦,讓金融科技搭起人工智慧塔

夏肇毅觀點:複製小抄大腦,讓金融科技搭起人工智慧塔



小抄英文叫cheat sheet,就是考試時作弊用的濃縮重點。所以演講時把重要數字寫成小抄,採買辦事前把所需明細記成小抄,拜訪客戶及接待來賓時也將對方姓名資料記在小抄裏。所以後來除了作弊用品的原意外,便成也是速查表與備忘單的意思。就是將最實用的步驟、方法及知識寫成一小張紙,以便往後碰到問題時能快速的提供錦囊妙計。

因為它只是一小張紙,所以只有這個主題下最常見的問題會寫在上面,不同主題就用不同小抄。好比說影印機有一張小抄,提供快速操作與問題排除方法,筆電也有一張小抄,不同產品都有自身的操作小抄。後來人們發現這太好用了,就加以發揚光大,演變成叫Post-it的小貼紙,可以隨手寫,到處貼。一旦人腦經過數十次反覆的訓練學習,就能把這些小抄內容複製貼入腦中。如果我們天天用它,這些小抄就能一直在腦中貼得牢牢地。可是沒複習的話,小抄很快就掉下來了。

從小到大,經過辛苦的學習,我們把各種知識都在腦中寫成小抄。怎麼說話,怎麼寫字,怎麼讀英文,怎麼算數學,上自天文下至地理,課文的內容,參考書的講義,老師的問題與答案,同學間的嘻笑怒罵,大大小小,全用小抄記著。日積月累後,腦中就有數不盡的小抄。每晚大腦都要將小抄瀏覽整理一遍,看看哪些常用的留著,哪些可以送入倉庫中堆著,這些都是最高階的腦部活動,有人說這就是做夢的過程。


小抄大腦模型

大腦皮質由大量的神經元所組成,彼此連接。今年年初一篇“A Giant Neuron Has Been Found Wrapped Around The Entire Circumference of The Brain”的報導中發現橫跨老鼠腦部的巨大神經元,這意味著信號可以有效率的傳遍整個大腦,而不必靠神經元一個接一個的慢慢傳遞。

我們可以假設當眼睛耳朵接收到信號時,它能夠快速的傳遍所有的神經元。想像有些最底層的神經元專職在處理母音、子音與文字部首的識別,當它偵測到認識的信號時,就會舉手,將這發現傳給下一層神經元。於是下一層神經元就處理單字發音與字型的識別,接著還有再下一層神經元能識別句子,一路下去,就形成我們這有意識的大腦。

筆者把每一組神經元想像成一張小抄,底層小抄紀錄著字音、字型、單詞或句子。一路向上,更上層的小抄就記著公式、原理、步驟、方法等所有人類的知識。每張小抄隨時都在平行運作著,當它接收到與小抄內容相同的輸入信號時,就會輸出信號讓後面連接的小抄接著做事,一層跟著一層執行。所以我們聽到講話的聲音後,就能接著轉成單字,再組成句子,等最後了解意義之後再做出反應。

每個小抄平時也會自己發出信號,想讓別人知道它的存在。當幾組小抄的信號湊在一起時,有時就會有新創意產生,就如同我們常說的「突然靈機一動」一樣。大腦每天會整理數不清的小抄,常看常聽的就留著,其他就慢慢往後堆。所以如果要持續留存知識,不斷的學習與複習是不二法門。

這就是筆者個人所想像的「小抄大腦模型」(Sticker Brain Model)。根據這「小抄大腦模型」假設的原理,我們就可以開發出「人工智慧小抄電腦」(AI Post Computer)。簡單的說,就是根據人類大腦記憶思考的原理,來讓人工智慧運作。這比較偏向傳統以知識為基礎的專家系統路線,與現在當紅靠大量機器數學模式計算的機器學習方向不同。

傳統機器學習演算法

雖然「大演算(The Master Algorithm)」一書排斥傳統以知識工程為基礎的程式系統,認為以機器學習為基礎的系統已經開始席捲各個領域。它指出現在機器學習有五大學派,包括符號理論,類神經網路,演化論,貝氏定理與類比推理。它認為結合這五大學派而發展出的終極演算法,將可靠機器學習大數據中獲得世界上所有的知識。

其中符號理論學派利用建立決策樹的方式來執行歸納,類神經網路學派模擬人類的神經元運作來做識別與預測功能(如最近最流行的CNN),演化論學派模仿大自然交配與演化來設計程式,貝氏定理學派利用機率來推論各種狀況發生的可能性,而類比推理學派使用支援向量機SVM等方法來將資料分群找出相似度高的群體。

但這五大學派的機器學習方法,都是以數學運算模式來訓練機器做判斷,比較像是人類的快速辨識與直覺反應。和思考不同,直覺反應速度快,但它卻不知道為什麼。像運動、操作、語言等需要快速反應的事情,就要靠不斷的重複練習,來讓身體肌肉能應付外界變化。

但思考卻是知識性的,需要將存在腦內的小抄一一檢視,看看哪一種方法可以應付當前的狀況,它需要比較長的時間。這就像拳擊與國術的對比一般,前者靠不斷練習對打以訓練臨場反應,一直到最後幾乎練成了反射動作,就和機器學習一樣。而後者是把所有招式,像一本書般從頭到尾不斷演練。臨上場時,還要一頁一頁來檢視應該要使用哪一招來應付比較好,速度自然比較慢。語言學習也是一樣,如果是對話式的整句練習,使用時自然比還需要從文法開始想造句要來得快。

金融科技小抄電腦

但以知識為基礎的「人工智慧小抄電腦」,卻是用前人的智慧來運作,同時還能告訴你為什麼,因為它是靠大腦裡小抄記著的方法來做事。筆者個人喜好收集知識與方法,所以自然就偏好知識思考這條路,希望能慢慢將知識方法製成小抄,塞入機器人的人工智慧腦中,堆出小抄知識塔。然後再模仿人類大腦的方式運作,讓這小抄電腦知識塔動起來。

如果我們要將「人工智慧小抄電腦」運用在金融科技的理財機器人上的話,首先就要先把理財知識的小抄灌入理財機器人中。
比如說:
-若利率上漲,則債券下跌。
-若中東發生戰爭,則黃金石油大漲。

然後我可以問我的理財機器人:
-若美國FED升息,那會有什麼影響?
-如果戰爭開打,那麼金價如何變動?

這些問題它一定答不出來,因為機器人還不懂「美國、FED、升息、影響、開打、金價、如何、變動」的意義。所以要能讓機器人回答問題,先要把基本的語文能力一併建立才行。人類從小學到高中花了十二年,才將基礎知識存到腦中。前六年上小學,勉強把基礎字詞認完。後六年,再把世界基本常識學會,達到看得懂報紙的地步。如果有唸大學,才再鑽入某一學門中,學習專業知識。

想讓機器人理解問題,也必須讓它像人類一樣從頭學起才行。要經過NLP自然語言處理後,讓文字產生如同大腦認知般的意識。這一點,需要長時間的投入才有可能見效。畢竟自然語言處理和類神經網路一樣,都已經是有悠久歷史的學派。這麼多年,經過多少人腦精英,跟著開山祖師爺的腳步,被吸入這些腦力黑洞中,也不過發展到目前的境界而已。因此在實務應用上,使用簡單的問答系統,像是人工智慧客服系統,電話秘書等就比較普遍。只要蒐集某一業務上客服人員常用的問題,列出詳細問答範本後再加以處理,應該就能夠回答大部份的問題了。

相形之下機器學習反而是比較容易處理的方法。讓理財機器人利用機器學習的五大學派理論,針對歷史金融大數據做分析,找出每一商品的買賣點,尋求最佳的投資組合。然後針對每個策略在歷史數據中回測,以找出性能最佳的運算法。之後就能對世事變化,隨時提出買賣投資建議。

最後,我們還要把這些變化,一一套入小抄的知識規則中來檢視,驗證看看到底這些知識正不正確。不正確的話就要重新產生小抄,以便將最新的研究結論記下。這樣知識與直覺的結合才能讓金融科技不斷地自我增強學習,慢慢衍生出人工智慧塔來。

機器學習的直覺辨識與小抄電腦的知識思考,兩者各擅勝場缺一不可。最終還是要結合起來一前一後的運作,才能相輔相成發揮人工智慧小抄電腦的最大效用。

作者簡介:夏肇毅,提供雲端理財機與教學服務之CubicPower.idv.tw創辦人。曾服務於緯創軟體、英商路透社等金融與科技單位從事金融軟體開發專案工作。


沒有留言:

張貼留言