夏肇毅觀點:國防工業亟待人工智慧與雲端運算技術助力
2397
人氣
日前AlphaGo Master人工智慧又打敗了世界第一的大陸棋王柯潔,自此擺脫人類知識,走向左右手對戰的自我學習之路。
為什麼AlphaGo那麼利害?因為它將下一步棋可走的最終成功率,建成了一個「蒙地卡羅決策樹」。然而棋盤中可以走的路實在太多了,所以第一步就是要向人類老師學習。將過去各高手所下的棋都學一遍,然後將勝負記進這蒙地卡羅決策樹中。這就是所謂的「監督學習」,有老師在旁邊看著。再來就是自已左右手對戰,把過程和勝負同樣輸入決策樹中,變成了「增強學習」。如今再沒有人類老師可以學習了,所以AlphaGo就剩下增強學習一途。
AlphaGo Master同時並應用了目前人工智慧中最流行的CNN。噢,不是我們想的那個,而是「Convolution Neural Network」。一種當今最熱門,模仿人類大腦結構的人工智慧類神經網路,照片識別、語音秘書、自動駕駛都靠它。數十年來沒什麼進展的類神經網路,拜雲端運算所提供的大量運算能量之賜,這幾年突然又掀起了一股熱潮。
這個類神經網路提供了「全局觀」,並經由「策略網路」與「價值網路」來決定下一步棋的落子位置。前一版的AlphaGo可以考慮未來50步棋的優劣,這真的不是人腦所能能負荷。到此,人類也要繼象棋和西洋棋之後,在圍棋這一塊再舉起白旗了。
現在人工智慧可以運用的地方越來越多,去年美國辛辛那堤大學開發的空戰人工智慧無人機ALPHA,就擊敗了資深的飛行教官。它運用了遺傳模糊樹(genetic fuzzy tree)的決策系統,將高階戰術、射擊、逃脫、防禦等各式戰鬥方法建入這個人工智慧系統中。你一有動作,它馬上會有應變措施,反應比人類快了兩百五十倍,弄得教官精疲力竭。整個空戰是在一個由波音公司開發像電動玩具般的AFSIM系統中進行。它真實得複製了現代空戰環境中的戰機、偵測器和武器的行為模式,在加入雜訊與失敗率後,將偵測器資料送給無人機ALPHA,讓ALPHA根據指派任務與決策系統邏輯來操縱飛機與武器系統。這些設計細節都在2016年6月的「Journal of Defense Management」中揭露。
現在這類的無人戰鬥系統有兩條發展路線,一條路線是製造全新的無人機,另一條路線則是將現有設備改裝成為無人操控機。最近美國洛克希德馬丁公司就展示了由F-16改裝的無人機跟隨有人機飛行,讓無人自動駕駛機與有人機隊結合成一個團隊一起行動。這裝有自動防撞系統的無人機,能跟著有人機組編隊飛行,待接近目的地時就離隊去執行對地攻擊任務,同時也應付各種突發威脅,待任務完成之後再重新加入團隊編隊飛行。
發展這些人工智慧系統時背後需要有龐大的運算能力,否則機器少N倍,就要多花N倍的時間來運算。在上月大陸神威超級電腦躍居全球速度最快的超級電腦後,美國國家安全局發表報告,認為失去超級運算的領先地位,將嚴重威脅美國的國家安全。它認為現代武器系統的設計、發展和分析中,超級電腦都扮演了關鍵角色,包括核子武器、網絡戰能力、戰艦、飛機等等。雖然我們沒有核子武器要靠超級電腦試爆,但現在開始的人工智慧機制卻是要靠龐大電腦來讓訓練機械學習。加上機密性考量,這時就要考慮建立自己的國防高速分散式雲端運算機房。然而不同於傳統武器一用數十年,現在的電腦投資,大概兩三年就落伍了。所以電腦的折舊期就是四五年,時間到就可汰換,因此規劃上可能要像每年都要消耗的作業費用一樣對待。
如今人工智慧已開始踏入國防軍事領域,日後想光憑人腦來想策略與操作系統,根本毫無勝算。電腦兵棋推演,就像AFSIM一樣也到了該連上人工智慧系統的時候了。事先訓練好攻守方,讓電腦戰電腦,應該可以發展出令人驚訝的方法。除了武器軟硬體研發投資外,在雲端運算機房與各式國防人工智慧研發也應加緊腳步才是。以免十數年後,到了無人武器系統時代時,才發現也許傳統武器都已變無用武之地了。
作者簡介:夏肇毅,提供雲端理財機與教學服務之CubicPower.idv.tw創辦人。曾服務於緯創軟體、英商路透社等金融與科技單位從事金融軟體開發專案工作。
沒有留言:
張貼留言