面對繁重的識記任務(wù)時(shí),你是否有想象過(guò)擁有一個(gè)能干的AI幫手替你學(xué)習?心想:若是能像AI一樣,就要沖這鋪天蓋地的學(xué)習任務(wù)輕輕一笑,然后瞬間掌握、過(guò)目不忘?墒菍(shí)際上,人工智能也正面對著(zhù) “這邊學(xué),那邊忘”噩夢(mèng),這一現象還有個(gè)聽(tīng)起來(lái)就透著(zhù)幾分窒息的名字——“災難性遺忘”。
近日,來(lái)自谷歌大腦的新研究發(fā)現,在街機學(xué)習環(huán)境的由多個(gè)子任務(wù)組成的單任務(wù)場(chǎng)景中也存在著(zhù)“災難性遺忘”。特別像在蒙特祖瑪的復仇這種探索型游戲里,場(chǎng)景變化較大,也會(huì )出現學(xué)習完當前游戲場(chǎng)景后,忘記上一個(gè)游戲場(chǎng)景知識的情況。
人工智能為什么會(huì )產(chǎn)生“災難性遺忘”?目前,解決災難性遺忘的方案有哪些?難點(diǎn)在哪?來(lái)看看專(zhuān)家怎么說(shuō)!
學(xué)一個(gè)忘一個(gè),深度學(xué)習效率低下
自從阿爾法狗相繼戰勝多名圍棋G軍后,深度強化學(xué)習成為人工智能L域耀眼的“明星”,也是各大研發(fā)機構角逐的主戰場(chǎng)。而谷歌大腦團隊這次面臨的“災難性遺忘”,正是人工智能深度學(xué)習中一個(gè)普遍且嚴重的問(wèn)題。
“‘災難性遺忘’指的是人工智能系統,如深度學(xué)習模型,在學(xué)習新任務(wù)或適應新環(huán)境時(shí),忘記或喪失了以前習得的一些能力!彬v訊人工智能實(shí)驗室副主任俞棟博士在接受記者采訪(fǎng)時(shí)說(shuō),“災難性遺忘”會(huì )造成人工智能系統在原有任務(wù)或環(huán)境性能大幅下降。
因此,“災難性遺忘”的存在,一定程度上限制了人工智能在一些場(chǎng)景中的應用。
福州大學(xué)數學(xué)與計算機科學(xué)學(xué)院、福建省新媒體行業(yè)技術(shù)開(kāi)發(fā)基地副主任柯逍博士舉例說(shuō),如一個(gè)AI圖像識別系統,當需要添加一個(gè)新的類(lèi)別的物體時(shí),就不得不把原先的所有物體都再學(xué)習一次;或在文物鑒定系統中,當有一天發(fā)現原始數據中有一個(gè)文物朝代錯了,同樣沒(méi)辦法單d對這一個(gè)錯誤的文物進(jìn)行修改學(xué)習;再如,讓AI系統學(xué)習英語(yǔ)之后,再讓它學(xué)習德語(yǔ),它可能會(huì )把原來(lái)學(xué)習的英語(yǔ)語(yǔ)法全部忘光。
而在谷歌大腦的新研究的游戲場(chǎng)景中,“災難性遺忘”又造成了哪些影響?有何新穎的發(fā)現?
“除了傳統新知識學(xué)習會(huì )覆蓋舊知識之外,谷歌大腦還發(fā)現,在如超J瑪麗等探索型游戲里,‘災難性遺忘’會(huì )阻礙模型對新知識的學(xué)習!睆B門(mén)大學(xué)人工智能系、科技處副處長(cháng)紀榮嶸教授說(shuō)。
紀榮嶸進(jìn)一步解釋說(shuō),面向街機游戲學(xué)習的強化學(xué)習方法都會(huì )采用“經(jīng)驗回放”的訓練方式,就是將模型在游戲探索時(shí)候的片段進(jìn)行保存,然后給模型進(jìn)行“回放”訓練。而像蒙特祖瑪復仇這種游戲,游戲場(chǎng)景變化比較大,模型需要不間斷探索游戲場(chǎng)景,因此,在訓練時(shí)候就需要不斷回放早期場(chǎng)景的游戲經(jīng)驗,不然會(huì )因為“災難性遺忘”而忘記了早期的游戲知識。
“這也導致了,新的游戲經(jīng)驗雖然能夠被采樣到“經(jīng)驗回放”庫里,但因為學(xué)習方式的設定,導致學(xué)習效率低,同時(shí)由于不同階段的學(xué)習會(huì )互相干擾,使得AI無(wú)法一次通過(guò)該游戲的全部關(guān)卡!奔o榮嶸說(shuō)。
AI“腦容量”存上限,新舊知識難共存
AI為什么會(huì )產(chǎn)生“災難性遺忘”?
“深度學(xué)習的結構一旦確定,在訓練過(guò)程中很難調整。神經(jīng)網(wǎng)絡(luò )的結構直接決定學(xué)習模型的容量!笨洛姓f(shuō),AI“腦容量”存在上限,也就導致了人工智能只能有限地處理特定任務(wù)。就像水桶一半G的地方有個(gè)洞,以至于無(wú)論怎么增加水桶的G度,這個(gè)水桶只能裝一半G的水。
中科院自動(dòng)化所腦網(wǎng)絡(luò )組研究中心研究員、模式識別重點(diǎn)實(shí)驗室副主任余山指出,這還涉及到神經(jīng)網(wǎng)絡(luò )學(xué)習知識的機制。在單個(gè)任務(wù)的訓練過(guò)程中,網(wǎng)絡(luò )中各個(gè)神經(jīng)元之間的連接權重進(jìn)行了專(zhuān)門(mén)的調整,以勝任當前的任務(wù)。而在新任務(wù)的訓練中,連接權重要針對新任務(wù)進(jìn)行調整,這將“抹去”適應舊任務(wù)的原有結構,導致在舊任務(wù)上的性能大大下降。
人類(lèi)的記憶能力其實(shí)是有限的,但為何出現“災難性遺忘”情況卻比較?“主要是人類(lèi)在學(xué)習過(guò)程當中,大腦能夠主動(dòng)保留些有用的知識和技巧,同時(shí)不影響新的信息獲取! 紀榮嶸說(shuō),但現在的人工智能模型大部分是基于隨機梯度下降來(lái)更新模型參數,這個(gè)過(guò)程主要服務(wù)于當前任務(wù)的優(yōu)化,并不會(huì )去評估哪些參數權重對舊的知識是有用的,所以就很容易出現知識被覆蓋的情況。
紀榮嶸也表示,當前像Siri或小愛(ài)這樣的人工智能助手產(chǎn)品,還不能算真正意義上的通用人工智能,一方面,這些人工智能助手只能在預設的知識范圍內和人類(lèi)互動(dòng),完成指令;另一方面,人類(lèi)沒(méi)辦法像養寵物或養小孩一樣,通過(guò)互動(dòng)去教導這些人工智能助手學(xué)習新的知識或新的指令。
解決之策有哪些?
據了解,“破解災難性遺忘”是實(shí)現通用人工智能的一個(gè)關(guān)鍵。解決了“災難性遺忘”問(wèn)題后,模型就能具備持續學(xué)習的能力, 可以像人類(lèi)一樣不斷獲取新的知識、新的技能,同時(shí)能夠大化地保持舊的經(jīng)驗知識和技巧。
那么,目前解決“災難性遺忘”的方案有哪些?
“常見(jiàn)的方式是多任務(wù)學(xué)習, 就是把所有任務(wù)的訓練數據同時(shí)放到一起,模型就可以針對多種任務(wù)進(jìn)行聯(lián)合優(yōu)化!奔o榮嶸舉例說(shuō),如讓模型同時(shí)學(xué)習坦克大戰和超J瑪麗兩個(gè)任務(wù),等兩個(gè)任務(wù)同時(shí)學(xué)的差不多的時(shí)候,模型才停止訓練。
但柯逍也指出,這種方式隨著(zhù)任務(wù)增多,新任務(wù)樣本數量被稀釋?zhuān)柧殨?huì )拖慢學(xué)習新知識的效率,并且,不是任何情況都能獲得先前任務(wù)的數據來(lái)復習的。
還有的解決方案是根據新的任務(wù)知識來(lái)擴充模型結構,保證舊的知識經(jīng)驗不被損害。此次,谷歌大腦所提出的“記憶碎片觀(guān)察”方法正是對不同任務(wù)(場(chǎng)景)構建多個(gè)人工智能模型來(lái)進(jìn)行學(xué)習!澳P蛿U充的方式從本質(zhì)上并沒(méi)有解決災難性遺忘的問(wèn)題,只是用多個(gè)模型來(lái)替代單個(gè)模型去學(xué)習多種任務(wù),避免舊參數被覆蓋!奔o榮嶸說(shuō)。
當前,解決災難性遺忘還存在著(zhù)一對矛盾:在學(xué)習新任務(wù)的過(guò)程中,需要給予網(wǎng)絡(luò )足夠多的自由度進(jìn)行連接權重調整,但是又要避免這樣的調整“抹去”原有的記憶。
“因此,科學(xué)家們開(kāi)始設計新的學(xué)習算法解決上述矛盾,使得網(wǎng)絡(luò )在進(jìn)行權重調整的時(shí)候,對已有知識的影響小化!庇嗌奖硎,其團隊近期提出的正交權重修改算法,就屬于這類(lèi),主要通過(guò)限制權重修改只能在舊任務(wù)的解空間中進(jìn)行,這一算法較好的克服了災難性遺忘,使得同一個(gè)分類(lèi)器網(wǎng)絡(luò )可以連續的學(xué)習多達數千個(gè)類(lèi)別的識別。
![]() |
商用機器人 Disinfection Robot 展廳機器人 智能垃圾站 輪式機器人底盤(pán) 迎賓機器人 移動(dòng)機器人底盤(pán) 講解機器人 紫外線(xiàn)消毒機器人 大屏機器人 霧化消毒機器人 服務(wù)機器人底盤(pán) 智能送餐機器人 霧化消毒機 機器人OEM代工廠(chǎng) 消毒機器人排名 智能配送機器人 圖書(shū)館機器人 導引機器人 移動(dòng)消毒機器人 導診機器人 迎賓接待機器人 前臺機器人 導覽機器人 酒店送物機器人 云跡科技潤機器人 云跡酒店機器人 智能導診機器人 |