作者:夏肇毅 2019-07-29 初版
人工智慧簡介
現在人工智慧已經可以開始做很多有用的事情。最大的貢獻是在影像識別方面,現在的精確度已經比以前好很多。很多像文字的識別已經可以到95%以上的正確率。在多國語言的翻譯上面,已經進行相當不錯的進展。經過多國語言的訓練,人工智慧可以做多國語言間的互譯。人工智慧主要運作方式,就是把你所需要的資料和想要的結果,一起丟給電腦來學習。看它出來結果跟你有想要的結果中間的誤差來調整裡面的參數。經過不斷的修正之後最後,可以把人工智慧的參數訓練成能產生跟你想要差不多的結果。
類神經網路裡面有相當龐大的節點或是神經元能夠記憶參數。在訓練的過程中,就好像會把訓練的資料轉換再記憶到神經元裡面,以做為識別樣本。所以類似的資料再次出現時,它就可以很會連結到相似樣本的神經元上面去,並以此來做分類的判斷。另一方面,它也可以跟據儲存的樣本,再重新產生出相似的資料輸出。所以類神經網路本身就是一個龐大的記憶庫,把所有的樣本轉化後再儲存起來。類神經網路是模擬人類的神經細胞結構。一個神經細胞,輸入到細胞體的就像一棵樹一樣的叫樹突。從細胞體輸出一根細細長長到下一個細胞的叫做軸突。樹突接受所有的訊號進入細胞體,然後累積起來。一旦這個些訊號的累積量超過一個觸發的水準,它就會送出一個輸出訊號經軸突給下一個細胞。所以類神經網路的神經元,可以接收輸入信號,再將每一個輸入訊號乘上一個權重,然後加總起來。再跟裡面儲存的偏移數相加,以後看看有沒有超過觸發的水準再輸出。
一個類神經網路就是由多個神經元組成一層。同一層的各個神經元都接到相同的輸入端。下一層的神經元,就會將上一層的各個輸出端當成自己的輸入。所以同一層的神經元大家都有一樣的輸入。然後經過自己的權重處理,所以會產生不同的輸出。類神經網路是依照輸出層的錯誤來調整各個層級的權重。我們將輸出層的錯誤的梯度,依照微分的連鎖律推導,由輸出端算出應分配到個輸入端的大小,然後將這個梯度向前面各層一步一步地傳遞過去。每一層的神經元收到這個倒遞傳回來的梯度大小之後,就根據它來調整本身的權重。這種反向傳播演算法(Rumelhart, Hinton,Williams, 1986)的發明,是類神經網路近年來大幅進步的主要原因。
學習過程中使用梯度下降法,就是根據誤差的梯度(類似斜率)來找出誤差的下降方向,並一直往最小值的方向來修正參數。好比在自動駕駛上面的路況識別,把實際路況一直餵給人工智慧。其中並標示每一個畫面哪邊是車子,哪邊是道路,哪邊是行人。經過重複訓練之後,人工智慧就就可以了解每一個畫面中,每個路況裡面可能什麼地方有行人,什麼地方是道路,什麼地方有障礙物等等。
檢測信號有沒有超過觸發水準的函數叫做活化函數。在訊號沒有超過度發水準的時候,活化函數的輸出值是0。一旦輸入超過了觸發水準,活化函數的輸出值就會變成1。一般常用觸發信號的活化函數有幾種。最簡單的,是一個階梯函數。這個階梯函數在輸入小於0的時候,輸出為0。而輸入大於0的時候,輸出為1。所以它的觸發點就是零。如果我們希望它的觸發點不是零的話,例如,我們希望它的出發點是2。那麼我們就可以把輸入先減2,然後再送進這活化函數去。這一個減2的動作,就是讓偏移數為-2一樣。
比較複雜的活化函數像sigmoid,它就不是像階梯函數一樣不連續變化,而是慢慢的變。sigmoid的問題是計算很慢,而且在輸出遠離出發點為最大值或最小值的時候,它的梯度都會趨近於零,也就是梯度會消失。另一種函數relu,它在輸入小於0的時候,輸出就等於零。而當輸入大於0的時候,輸出就等於輸入。這是常用的活化函數,它的好處是不會造成梯度消失。
沒有留言:
張貼留言