為您提供各行業(yè)互聯(lián)網(wǎng)私人定制開發(fā)解決方案
人工智能越來越聰明,但它"體能"能跟上"腦力"嗎?
原標(biāo)題:人工智能越來越聰明,但它的“體能”能跟上“腦力”嗎?
隨著深度神經(jīng)網(wǎng)絡(luò)的持續(xù)改進(jìn)和成長(zhǎng),面對(duì)日益增長(zhǎng)的計(jì)算需求,相應(yīng)的硬件創(chuàng)新也迫在眉睫。
深度學(xué)習(xí)是人工智能(AI)近期發(fā)展的前沿陣地。它涉及到靈感來源于生物神經(jīng)網(wǎng)絡(luò)的一系列機(jī)器學(xué)習(xí)算法,可用于在巨量數(shù)據(jù)中尋找某些模式。通過這些深度神經(jīng)網(wǎng)絡(luò),諸如語音和視覺識(shí)別等領(lǐng)域得到了大幅發(fā)展;以它們?yōu)榛A(chǔ)的計(jì)算機(jī)程序在一些特定任務(wù)中展示了超越人類的能力。
這一點(diǎn)在AlphaGo身上得到了淋漓盡致的展示。這個(gè)由倫敦DeepMind團(tuán)隊(duì)開發(fā)的程序,2016年3月在一場(chǎng)5回合的比賽中擊敗了圍棋世界冠軍李世乭,比分為4比1。現(xiàn)在,AlphaGo唯一的對(duì)手只剩下自身的改進(jìn)版。2017年10月,DeepMind團(tuán)隊(duì)發(fā)布了一款升級(jí)版本——AlphaGo Zero——它應(yīng)用了強(qiáng)化學(xué)習(xí),并且只通過自己和自己對(duì)弈進(jìn)行訓(xùn)練。而AlphaGo的能力則建立在對(duì)人類專業(yè)棋手?jǐn)?shù)百萬步走法的非監(jiān)督式學(xué)習(xí)。結(jié)果,AlphaGo Zero以100回合全勝的戰(zhàn)績(jī)戰(zhàn)勝了擊敗過李世乭的AlphaGo。
深度神經(jīng)網(wǎng)絡(luò)涉及多層由數(shù)字化的‘神經(jīng)突觸’連接的‘神經(jīng)元’。利用大量數(shù)據(jù)以及目標(biāo)任務(wù)的正確答案進(jìn)行訓(xùn)練后,神經(jīng)元之間連接的強(qiáng)度或者說權(quán)重得到不斷調(diào)整,直到最上層網(wǎng)絡(luò)給出正確的結(jié)果。完成訓(xùn)練的網(wǎng)絡(luò)配以訓(xùn)練中得到的連接權(quán)重再被應(yīng)用到全新數(shù)據(jù)中——這一步被稱為推斷。
深度神經(jīng)網(wǎng)絡(luò)近期的成功既得益于算法和網(wǎng)絡(luò)架構(gòu)的進(jìn)步,也得益于獲取巨量數(shù)據(jù)變得日趨容易,以及高性能計(jì)算機(jī)持續(xù)發(fā)展。當(dāng)前,具備一流運(yùn)算精度的深度神經(jīng)網(wǎng)絡(luò)的運(yùn)算量相當(dāng)大。史弋宇及其同事在《自然-電子學(xué)》上發(fā)表了一篇Perspective文章(https://go.nature.com/2lWHPww),他們?cè)谖闹兄赋觯@代表了深度神經(jīng)網(wǎng)絡(luò)面臨的新挑戰(zhàn),特別是當(dāng)它們被應(yīng)用于空間和電池容量有限的手機(jī)以及諸如智能傳感器、穿戴設(shè)備等嵌入式產(chǎn)品時(shí)。
來自美國圣母大學(xué)、加州大學(xué)洛杉磯分校和中國華中科技大學(xué)的研究團(tuán)隊(duì)考察了深度神經(jīng)網(wǎng)絡(luò)的精度和規(guī)模方面的數(shù)據(jù),以及不同硬件平臺(tái)的運(yùn)算性能。他們指出,深度神經(jīng)網(wǎng)絡(luò)應(yīng)用于設(shè)備端推斷(在嵌入式平臺(tái)端執(zhí)行的推斷)的迭代速度和CMOS技術(shù)的迭代速度存在差距——而且這個(gè)差距在增大。當(dāng)深度神經(jīng)網(wǎng)絡(luò)變得更加精確,它們的尺度(層數(shù)、參數(shù)量、運(yùn)算量)顯著擴(kuò)大。
但是,正如史弋宇及其同事所述,典型的硬件平臺(tái)——圖形處理單元(GPU)、現(xiàn)場(chǎng)可編程門陣列(FPGA)以及專用集成電路(ASIC)——其計(jì)算性能的提升跟不上前沿深度神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)需求。類似的,承載這些網(wǎng)絡(luò)的硬件平臺(tái)的存儲(chǔ)器功耗也跟不上網(wǎng)絡(luò)尺度的增長(zhǎng)。
史弋宇及其同事指出,“CMOS技術(shù)的迭代對(duì)于日益增長(zhǎng)的計(jì)算強(qiáng)度和功耗方面的需求并沒有提供足夠的支撐,因此需要在架構(gòu)、電路和器件上加以創(chuàng)新。”基于此,他們繼續(xù)檢驗(yàn)了結(jié)合不同架構(gòu)和算法創(chuàng)新來彌補(bǔ)上述差距的可行性。
一種方式是放棄傳統(tǒng)的,即存儲(chǔ)單元和計(jì)算單元物理上分離的馮·諾依曼計(jì)算架構(gòu),比如納米級(jí)電阻式存儲(chǔ)器(憶阻器件)能夠即用于計(jì)算又用于存儲(chǔ)。但器件的應(yīng)變能力仍然是個(gè)問題,限制了運(yùn)算所需精度。
在本期《自然-電子學(xué)》的另一篇文章中(https://go.nature.com/2IZ9VAq),來自蘇黎世IBM研究院和蘇黎世聯(lián)邦理工學(xué)院的Manuel Le Gallo及其同事表明,綜合利用電阻式存儲(chǔ)器的內(nèi)存內(nèi)運(yùn)算以及傳統(tǒng)數(shù)字運(yùn)算,或許能解決這個(gè)問題。這里的內(nèi)存內(nèi)運(yùn)算單元,具體來說是一組相變存儲(chǔ)器的二維陣列,它們承載主要的計(jì)算任務(wù),而傳統(tǒng)計(jì)算單元?jiǎng)t迭代提升解算精度。
Le Gallo及其同事通過解算線性方程組,展示了上述被他們稱為“混合精度內(nèi)存內(nèi)運(yùn)算”方案的性能。這種方案之前也被用于訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)。
為AI應(yīng)用開發(fā)專用器件和芯片的發(fā)展前景也已引起芯片初創(chuàng)公司的興趣。今年早些時(shí)候,據(jù)《紐約時(shí)報(bào)》報(bào)道,目前至少有45家初創(chuàng)公司在開發(fā)此類芯片,而風(fēng)險(xiǎn)投資者去年在芯片初創(chuàng)公司中的投資超過15億美元,幾乎是兩年前投資數(shù)額的兩倍。
這種技術(shù)的潛力不可小覷,學(xué)術(shù)界和產(chǎn)業(yè)界的研究人員正在響應(yīng)機(jī)器學(xué)習(xí)和AI對(duì)硬件提出的挑戰(zhàn)——以及隨之而來的機(jī)遇。