類腦(受腦啟發(fā)的)計算的問題與視覺認(rèn)知
發(fā)布時間:2017-07-05 08:45:48
問題,在學(xué)科進展中的意義是不可否認(rèn)的。一門學(xué)科充滿問題,它就充滿生命力,如果缺乏問題,則預(yù)示著該學(xué)科的衰落。正是通過解決問題,人們才能夠發(fā)現(xiàn)學(xué)科的新方法、新觀點和新方向。
引言:“有問題的學(xué)科才有生命力”—戴維 希爾伯特
問題,在學(xué)科進展中的意義是不可否認(rèn)的。一門學(xué)科充滿問題,它就充滿生命力,如果缺乏問題,則預(yù)示著該學(xué)科的衰落。正是通過解決問題,人們才能夠發(fā)現(xiàn)學(xué)科的新方法、新觀點和新方向。
近年來,世界一些發(fā)達(dá)國家對腦科學(xué)研究投入了前所未有的熱情,越來越多的科研經(jīng)費涌入這一領(lǐng)域,也催生了信息領(lǐng)域?qū)θ斯ぶ悄芎皖惸X(受腦啟發(fā)的)計算研究的新一輪高潮。人類的大腦具有感知、記憶、學(xué)習(xí)、推理和創(chuàng)造性思維,塑造了人的個性。類腦計算是以腦認(rèn)知科學(xué)和神經(jīng)科學(xué)研究成果為基礎(chǔ),借鑒人類感知、認(rèn)知機理,建立受腦啟發(fā)的、不同于現(xiàn)有馮 諾依曼計算結(jié)構(gòu)的信息組織、存儲和處理的計算模式。這種計算模式對發(fā)展異構(gòu)動態(tài)大數(shù)據(jù)處理、非結(jié)構(gòu)化復(fù)雜模式信息分析與視覺場景理解計算的新理論及關(guān)鍵技術(shù)具有極其重要的意義。
本文圍繞類腦(受腦啟發(fā)的)計算的研究前沿及其存在的基本問題,強調(diào)類腦計算的研究必須面向具體問題,試圖從腦網(wǎng)絡(luò)連接機制及視覺認(rèn)知的角度探討類腦計算可能的實現(xiàn)途徑和方法,介紹了選擇性注意機制在視覺信息處理中的重要作用和實現(xiàn)方法,討論了如何利用可塑的、時空動態(tài)演化的非線性關(guān)系網(wǎng)絡(luò)來代替?zhèn)鹘y(tǒng)的基于定量數(shù)值的計算方法。本文還介紹了作者研究團隊正在開展的可用于大規(guī)模神經(jīng)網(wǎng)絡(luò)計算的片上眾核通信互連架構(gòu)與軟件支持環(huán)境的研究。
前言
大數(shù)據(jù)、遠(yuǎn)程自主系統(tǒng)和半自主系統(tǒng)的發(fā)展對計算能力和能效提出了更高要求。2016年3月對全球半導(dǎo)體產(chǎn)業(yè)發(fā)展具有重要指導(dǎo)和參考意義的國際半導(dǎo)體科技藍(lán)圖(International Technology Roadmap for Semiconductors,ITRS)更名為國際器件及系統(tǒng)技術(shù)藍(lán)圖(International Roadmap for Devices and Systems,IRDS),將不再圍繞摩爾定律強調(diào)如何提高芯片的運算速度和能效,進而轉(zhuǎn)向關(guān)注如何讓芯片發(fā)展能夠符合移動計算、數(shù)據(jù)中心以及人工智能的需求。這標(biāo)志著摩爾定律即將退位,以應(yīng)用為主的集成電路發(fā)展方向逐漸成形[1]。另外,隨著計算機性能的大幅提升、獲取互聯(lián)網(wǎng)數(shù)據(jù)的高效便捷,特別是深度學(xué)習(xí)方法在大規(guī)模圖像分類、語音識別、人臉識別等領(lǐng)域取得驚人的進步,人工智能又出現(xiàn)新一輪的熱潮[2]。但目前的深度神經(jīng)網(wǎng)絡(luò)模型對訓(xùn)練數(shù)據(jù)過度依賴,大多采用前饋連接,缺乏邏輯推理和對因果關(guān)系的表達(dá)能力、缺乏短時記憶和高效的無監(jiān)督學(xué)習(xí)能力,很難處理具有復(fù)雜時空關(guān)聯(lián)性的任務(wù)。這些問題促使我們?nèi)で笮碌挠嬎隳J健?
尋求類腦計算的物理實現(xiàn)形式,我們需要在物理的、符號的、語義的三個層面上弄清楚如下兩者之間的關(guān)系,即:計算裝置與計算過程之間的關(guān)系,大腦與認(rèn)知之間的關(guān)系。圖靈機模型表明,存在一種普適的計算機制,它可以完成任何可用形式化方式描述的計算任務(wù),而且圖靈測試的可能性是建立在符號系統(tǒng)所具有的可塑性的基礎(chǔ)之上。計算形式的普適性使得馮 諾依曼結(jié)構(gòu)的現(xiàn)代計算機可以完成圖靈機表征的任何過程,但前提是能將人類或其他生物的認(rèn)知行為抽象出諸如:規(guī)則、推理、推論、歸納等這樣的語義規(guī)律性,并把它們看作是關(guān)于符號的計算。然而,人類的大腦具有感知、識別、學(xué)習(xí)、聯(lián)想、記憶和推理等功能,并不能全部用符號計算的形式來實現(xiàn)。這些功能與大腦的結(jié)構(gòu)存在著對應(yīng)關(guān)系,并且大腦的神經(jīng)網(wǎng)絡(luò)系統(tǒng)具有多層的反饋機制,如來自于高級“控制”腦區(qū)到初級視覺腦區(qū)的反饋信號,形成了基于內(nèi)容和語義的視覺“選擇性注意”機制。類腦計算就是受上述腦功能和腦神經(jīng)網(wǎng)絡(luò)連接機制啟發(fā)的一種計算架構(gòu)(圖1),它以神經(jīng)形態(tài)計算的模式來部分模擬大腦功能與其結(jié)構(gòu)的對應(yīng)關(guān)系和反饋連接,增強人工智能及其計算效率,不完全依賴現(xiàn)有馮 諾依曼計算結(jié)構(gòu),也不是復(fù)制人類的大腦或簡單地建造一種模擬神經(jīng)元功能的芯片,更不是去完全替代馮 諾依曼計算結(jié)構(gòu)。
圖1 類腦計算的一種基本架構(gòu)
然而,至今我們對人類認(rèn)知功能如何從復(fù)雜動態(tài)(時空演變)的大腦神經(jīng)結(jié)構(gòu)中產(chǎn)生,沒有形成較為完整的認(rèn)識。因此,目前探討如何實現(xiàn)類腦計算就成為了一個充滿爭議和挑戰(zhàn)的命題[3-4]。本文圍繞類腦計算存在的基本問題,試圖從腦網(wǎng)絡(luò)連接機制、聯(lián)想記憶及視覺認(rèn)知的角度探討類腦計算可能的實現(xiàn)途徑和方法,并指出借鑒人類視覺感知與認(rèn)知機理,尋求新的視覺表征與場景理解的計算模型是實現(xiàn)類腦計算的重要突破點之一。
1 為什么當(dāng)前再次聚焦類腦(受腦啟發(fā)的)計算
類腦計算不是一個新命題。早在1982年,日本為了在計算機領(lǐng)域趕上和超過美國,制定了一項雄心勃勃的第五代計算機計劃,其目標(biāo)是突破馮 諾依曼計算架構(gòu)的局限性,發(fā)展出能夠與人對話,翻譯語言,解釋圖像,并且像人一樣推理的機器。然而,該計劃的命運是悲壯的,由于未能實現(xiàn)預(yù)期的目標(biāo),1992年日本政府不得不終止該計劃。
近20年來,腦科學(xué)、計算機科學(xué)、人工神經(jīng)網(wǎng)絡(luò)理論、集成電路技術(shù)的長足進步,以及大數(shù)據(jù)時代的到來、非完整信息處理與知識推理、自然的人機交互、各類自主系統(tǒng)對智能感知與計算技術(shù)的需求,以及傳統(tǒng)人工智能的局限,使得科學(xué)家們再次聚焦“類腦計算”[5]。
1.1 大腦認(rèn)知的層次和傳統(tǒng)人工智能的局限性
人類大腦認(rèn)知活動分為三個不同層次:直覺、形象思維和邏輯思維、靈感與頓悟[6],其中形象思維和邏輯思維是在人的意識控制之下進行的,而直覺、靈感與頓悟則是一種潛意識活動,是大腦的自主信息處理功能的具體表現(xiàn)。直覺、靈感與頓悟是人類在發(fā)明創(chuàng)造的過程中經(jīng)常表現(xiàn)出來的認(rèn)知活動。直覺是以知識經(jīng)驗為基礎(chǔ),跳躍地、直接抽象地識別事物的本質(zhì),直覺判斷往往是為了迅速解決當(dāng)前的問題,而靈感則是在某種偶然因素的啟發(fā)下使問題得以頓悟。然而,人工智能的很多研究工作主要集中在完整信息(結(jié)構(gòu)化或半結(jié)構(gòu)化)的處理,用特征學(xué)習(xí)和定量計算的模式來實現(xiàn)大腦認(rèn)知的“形象思維和邏輯思維”,將深度學(xué)習(xí)與概率網(wǎng)絡(luò)結(jié)合,也可在一定程度上對完整信息進行直覺判斷,而對于實現(xiàn)非完整信息的直覺判斷還無能為力。特別是,目前的人工智能計算模型存在著以下局限:
(1)需要對問題給出形式化描述(即抽象出一個可解析的數(shù)學(xué)模型,如果抽象不出,即歸納為不可解問題);
(2)需要對形式化描述設(shè)計確定的算法(容易產(chǎn)生NPC類問題);
(3)處理的結(jié)果無法表示現(xiàn)實世界問題所存在的測不準(zhǔn)性和不完備性;
(4)圖靈意義下的可計算問題都是可遞歸的(“可遞歸的”都是有序的);
(5)用“度量”來區(qū)分模式、只能處理可向量化的數(shù)據(jù)。
傳統(tǒng)人工智能的基本理論框架建立在“思維即計算”的理論基點上,以“演繹邏輯和語義描述”和“形式化方法”實現(xiàn)計算。將“思維”抽象為“符號計算”對人工智能的發(fā)展產(chǎn)生了重大的推動作用,但為所有的對象建立模型是不可能的,也未必是完備的。這里存在條件問題(Qualification Problem)和分支問題(Ramification Problem),即不可能枚舉出一個行為的所有先決條件,也不可能枚舉出一個行為的所有分支。而大腦的認(rèn)知具有多種方式,如對環(huán)境的理解、非完整信息的處理、復(fù)雜時空關(guān)聯(lián)的任務(wù),還有最基本的形象思維,特別是人腦在非認(rèn)知因素和認(rèn)知功能之間的相互作用,它們是形式系統(tǒng)難以,甚至不能描述的。
人類能夠為未來做出計劃、可以靈活處理問題并且向他人學(xué)習(xí),這些是人類智能的基本屬性。而傳統(tǒng)人工智能方法,無法實現(xiàn)類似人一樣思考推理的機器,去深度解決自然場景描述和環(huán)境理解等知識推理問題,也難以完成許多對于人類大腦來講輕而易舉的一些任務(wù)。因此,人們期望借鑒大腦的工作原理發(fā)展出一種新的智能機器的架構(gòu)或稱之為強人工智能的計算理論和方法。
1.2 馮 諾依曼計算架構(gòu)的不可替代性與所面臨的困境
馮˙諾依曼計算結(jié)構(gòu)示意圖,見圖2(引自維基百科)
圖2 馮 諾依曼計算結(jié)構(gòu)示意圖
前面指出,馮˙諾依曼架構(gòu)的計算機可以實現(xiàn)任何可用形式化方法描述的計算任務(wù)。未來,這種架構(gòu)的計算機依然會在人類社會中發(fā)揮不可替代的作用,并為我們解決更多、更復(fù)雜的計算任務(wù)提供強大的工具。如四色定理構(gòu)造性證明,沒有馮˙諾依曼計算架構(gòu)無論如何都是不可能的。發(fā)展具有更高計算能力的馮˙諾依曼架構(gòu)的計算機,并在這種架構(gòu)下應(yīng)用形式化理論,實現(xiàn)大數(shù)據(jù)處理和跨領(lǐng)域的知識學(xué)習(xí),依然是計算機科學(xué)與人工智能領(lǐng)域重要的科學(xué)目標(biāo)。但我們面臨的計算任務(wù)并不都是可用形式化方法來描述的。從人類認(rèn)知信息加工機制的角度看,圖靈計算及簡單的并行分布處理架構(gòu),沒有緊密的結(jié)合生物學(xué)實際,雖然目前的計算機可以高效的執(zhí)行預(yù)定指令、完成精確的數(shù)值計算,然而其分離的運算和存儲結(jié)構(gòu)、以及有限的并行度(指令級、數(shù)據(jù)級、線程和任務(wù)級)、有限的容錯和魯棒性,特別是功耗問題制約了馮˙諾依曼計算架構(gòu)的進一步發(fā)展。表1給出了基于馮˙諾依曼結(jié)構(gòu)的計算與類腦(受腦啟發(fā)的)計算的主要區(qū)別。
表1 馮 諾依曼計算結(jié)構(gòu)與類腦(受腦啟發(fā)的)計算的主要區(qū)別
2 腦科學(xué)研究進展、大腦網(wǎng)絡(luò)連接和聯(lián)想記憶
近二十年來,由于腦科學(xué)、神經(jīng)科學(xué)、信息科學(xué)等學(xué)科的進步,科學(xué)家們能在微觀尺度上觀測基因和蛋白質(zhì)結(jié)構(gòu)、在介觀尺度上研究細(xì)胞、神經(jīng)環(huán)路和網(wǎng)絡(luò)結(jié)構(gòu)、在宏觀尺度上研究腦區(qū)結(jié)構(gòu)以及認(rèn)知行為。在這樣的背景下,歐盟、美國和日本等科技大國先后發(fā)起各類“大腦研究計劃”[3-4],引起學(xué)術(shù)界和產(chǎn)業(yè)界的廣泛關(guān)注和研究的熱情,似乎將要迎來類腦計算的繁榮景象。面對如此宏偉的目標(biāo),我們需要保持冷靜、樂觀謹(jǐn)慎的態(tài)度,在了解目前腦科學(xué)研究在理論和技術(shù)方面取得進步的同時,更需要知道類腦(受腦啟發(fā)的)計算存在的挑戰(zhàn)和問題。
2.1 腦科學(xué)研究在理論和技術(shù)方面的進展
(1)理論準(zhǔn)備:研究發(fā)現(xiàn),描述復(fù)雜網(wǎng)絡(luò)的動態(tài)演化和調(diào)控的大尺度時空因果關(guān)系的網(wǎng)絡(luò)結(jié)構(gòu)曲線圖,是一個具有顯著聚類特征的冪函數(shù)曲線,與許多復(fù)雜網(wǎng)絡(luò)如互聯(lián)網(wǎng)、社交網(wǎng)、腦神經(jīng)網(wǎng)絡(luò)等有高度的相似性[7]。該研究對于構(gòu)建人工網(wǎng)絡(luò)來模擬大腦的設(shè)想提供了理論支持。
(2)觀測技術(shù):技術(shù)的進步往往是探索新發(fā)現(xiàn)的鑰匙。新的測序、成像技術(shù)和顯微技術(shù)已經(jīng)徹底改變了我們觀察大腦的能力(采用不同的觀測技術(shù)可以在不同的空間和時間尺度記錄大腦活動信號,如圖3所示)。隨著腦科學(xué)與認(rèn)知科學(xué)的研究發(fā)展,人們已經(jīng)可以在微觀水平觀測到腦神經(jīng)元的結(jié)構(gòu)、不同腦區(qū)的形態(tài),以及神經(jīng)元放電、不同神經(jīng)元如何構(gòu)成神經(jīng)網(wǎng)絡(luò)等信息處理過程。結(jié)合這些實驗觀察,可以在計算機上部分模擬腦信息處理過程[3]。
圖3 不同時空尺度的腦活動觀測技術(shù)
(3)精確的神經(jīng)元調(diào)控與觀測技術(shù):該方向代表性的技術(shù)有光基因技術(shù)(Optogenetics)[8],其基本原理是用光選擇神經(jīng)元的開和斷。通過把能夠感受光刺激的離子通道蛋白的基因轉(zhuǎn)入神經(jīng)細(xì)胞,使神經(jīng)細(xì)胞在它的細(xì)胞膜上表達(dá)這種蛋白,然后用光來控制這種蛋白的開放或關(guān)閉,從而控制神經(jīng)細(xì)胞的興奮或者抑制。通過該方法來操作神經(jīng)回路,探查或順序激活位于大腦不同區(qū)域的神經(jīng)元的活動,觀察對大腦的意識、感覺和行為的影響。另一項代表性技術(shù)是可植入的導(dǎo)電聚合物網(wǎng)(軟性的大腦電子探針):哈佛大學(xué)的科學(xué)家使用該技術(shù),在老鼠的顱骨部鉆孔,用針頭將該網(wǎng)注射進老鼠大腦,這個網(wǎng)格很快地展開填充到大腦組織的縫隙部分并與大腦組織交融。此時與外部電腦連接的納米導(dǎo)線可以用來記錄或者刺激單個神經(jīng)元的活動。該研究小組計劃將該技術(shù)使用到新生小鼠上,長時間的觀察和記錄大腦的生長發(fā)展過程及其與環(huán)境的交互,研究動物大腦知識和記憶的機理[9]。
(4)神經(jīng)形態(tài)計算:2014年8月IBM在《科學(xué)》雜志上發(fā)表了神經(jīng)形態(tài)計算的最新成果——TrueNorth芯片[10]。該芯片集成了54億個晶體管,模擬實現(xiàn)了1百萬個神經(jīng)元和2.56億個神經(jīng)突觸,而功耗只有65毫瓦。IBM還展示了基于TrueNorth架構(gòu)的視覺分類、運動識別等簡單應(yīng)用。論文所介紹的工作令人印象深刻,但其技術(shù)路線過分強調(diào)生物學(xué)的模擬,使用“spiking-integrate-and-fire”神經(jīng)元模型,從計算的復(fù)雜性和實現(xiàn)更大規(guī)模的網(wǎng)絡(luò)計算架構(gòu)來看,該技術(shù)路線無法實現(xiàn)更有價值的應(yīng)用和構(gòu)建實際的計算設(shè)備。歐盟HBP項目研究內(nèi)容的一部分與IBM研究TrueNorth芯片的技術(shù)路線類似:設(shè)計一種模擬神經(jīng)元功能的芯片,然后將其用于建造超級計算機,進而實現(xiàn)類似人腦的智能。2015年10月,歐盟HBP項目在《Cell》雜志發(fā)表了關(guān)于幼鼠軀體感覺皮層的微型電路的數(shù)字化重構(gòu)的研究結(jié)果,成功模擬了3萬個神經(jīng)元和3700萬個神經(jīng)突觸,該模擬再現(xiàn)了腦科學(xué)研究中已有的一些生理實驗觀測結(jié)果[11]。一些學(xué)者認(rèn)為該成果是集20年的神經(jīng)生物學(xué)實驗和10年的神經(jīng)計算科學(xué)的大成之作,是迄今在“模擬腦”領(lǐng)域最全面的工作。但科學(xué)界對于該工作的評價依然褒貶不一。大腦是一個異常復(fù)雜的動力學(xué)系統(tǒng),具有多種在不同時空層次上的反饋機制,在定量分析和計算模型上的深入解析是至關(guān)重要的。而且,生物學(xué)上可識別的大腦狀態(tài)并不等同于功能上可識別的大腦。因此,通過有限的神經(jīng)生物學(xué)實驗,無法完整地描述大腦認(rèn)知過程的功能性概括。歐盟HBP項目過分樂觀,并且對大腦記憶及其神經(jīng)網(wǎng)絡(luò)的聚合與分離的機制實現(xiàn)沒有給出令人信服的結(jié)果,容易導(dǎo)致研究的偏差和誤解。
2.2 大腦網(wǎng)絡(luò)連接與認(rèn)知的關(guān)系
類腦計算的最根本的挑戰(zhàn)是人類大腦信息處理和認(rèn)知功能的復(fù)雜性。從分子層面來看,大腦的神經(jīng)細(xì)胞連接是驚人的復(fù)雜。大腦神經(jīng)網(wǎng)絡(luò)及其連接中可能有某種復(fù)雜化原則在發(fā)揮作用,促使人腦的學(xué)習(xí)思維以及與生存環(huán)境的交互。大腦復(fù)雜的網(wǎng)絡(luò)連接、信息傳輸和組織方式在實現(xiàn)人類的認(rèn)知過程中起著關(guān)鍵的作用。科學(xué)界已經(jīng)對大腦是由多個不同區(qū)域的腦組織連接而成的網(wǎng)絡(luò)達(dá)成共識,其中各個腦組織區(qū)域負(fù)責(zé)不同的認(rèn)知任務(wù)。層次化、多尺度、高度連通、多中央樞紐的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),決定著大腦任務(wù)相關(guān)以及自發(fā)的活動。通過發(fā)掘大腦結(jié)構(gòu)連接(structural connectivity)、功能連接(functional connectivity)和有效連接(effective connectivity)的聚合和分離(斂散性)來洞察大腦的認(rèn)知機理(圖4)。其中,大腦的結(jié)構(gòu)連接是相對靜態(tài)的,而功能連接和有效連接具有時、空動態(tài)演化的特性,具體表現(xiàn)在連接強度變化以及神經(jīng)脈沖信號的時序關(guān)系變化上。
2.2.1 大腦的結(jié)構(gòu)連接
大腦皮層的結(jié)構(gòu)連接(連接圖譜)是研究大腦工作機理的出發(fā)點。不同皮層之間的解剖學(xué)連接結(jié)構(gòu),可以通過磁共振彌散張量成像獲得,并使用圖理論(如連接矩陣和連線圖)進行有效性等分析。
a)大腦結(jié)構(gòu)連接 b)功能連接 c)有效連接
圖4 大腦三種連接的示意圖
通過對貓科動物和獼猴的大腦皮層解剖發(fā)現(xiàn),大腦的結(jié)構(gòu)網(wǎng)絡(luò)具有“Small world”的特性。大腦連接的形成方式和連接長度受限于生物材料和能量代謝的約束,形成了占大量比重的短距離連接(低成本)以及豐富的中央樞紐結(jié)構(gòu)(適應(yīng)性)。大腦的結(jié)構(gòu)連接是大腦容錯特性的生理基礎(chǔ),短距離的連接網(wǎng)絡(luò)中部分細(xì)胞的消亡并不會影響大腦的功能,然而,中央樞紐單元的破壞,往往會對大腦的功能形成嚴(yán)重的、廣泛的、甚至不可修復(fù)的損傷[12]。
2.2.2 大腦的功能連接
大腦皮層的功能連接常用來分析識別大腦特定的任務(wù)和功能(Task-Specific),功能連接可以通過靜息態(tài)下的fMRI觀測獲得,表示一種基于神經(jīng)生理現(xiàn)象的統(tǒng)計相關(guān)性(Statistical Correlations)。功能連接受損之后會影響特定的大腦功能。功能連接是和特定的任務(wù)相關(guān)聯(lián)的,例如:通過對臉盲癥患者的實驗發(fā)現(xiàn),人眼看到運動的人物時,大腦是通過兩條不同的神經(jīng)傳輸路徑分別來提取人物身份和判斷運動位姿(功能連接)[13]。初級視覺中功能連接顯示了較大的分離度和較小的模塊間互連,而在高級的認(rèn)知任務(wù)中則表現(xiàn)出了較多的模塊間的互連度,揭示了生物視覺具有小范圍競爭、大范圍協(xié)作的特點。大腦任務(wù)切換時,功能網(wǎng)絡(luò)的重構(gòu)度可以預(yù)測人的認(rèn)知彈性[14]。在大腦處理新任務(wù)時,位于額頂葉中的中央樞紐靈活地在各個專門任務(wù)處理區(qū)域間進行多項快速的連接切換,中央樞紐網(wǎng)絡(luò)的存在使得人可以處理新的認(rèn)知任務(wù),并增強人的學(xué)習(xí)能力和適應(yīng)性(如:使用新的工具、學(xué)習(xí)新的語言)。通過對中央樞紐活動模式的觀察和分析,可以確定大腦是否在執(zhí)行特定的任務(wù)[15]。因此通過對大腦功能連接的深入分析,有助于研究大腦的神經(jīng)編碼模式,發(fā)展相應(yīng)的腦機交互技術(shù)。
2.2.3 大腦的有效連接
有效連接用來描述神經(jīng)元之間的因果互動和相互影響,它并不是直接通過大腦皮層成像獲得,而是通過統(tǒng)計分析的方法獲得的。功能網(wǎng)絡(luò)的重構(gòu)度可以預(yù)測人的認(rèn)知彈性,但在功能連接重構(gòu)過程中,有效連接決定了認(rèn)知彈性的效率和能力[14]。
大腦的功能與其結(jié)構(gòu)存在著對應(yīng)關(guān)系。這種關(guān)系有別于基于符號和概率的知識表達(dá),大腦通過復(fù)雜的時、空動態(tài)演化的網(wǎng)絡(luò)系統(tǒng)來完成信息的判斷和推理。對于這樣一種可塑的、動態(tài)的非線性關(guān)系網(wǎng)絡(luò),目前,我們無法使用形式化的方法進行完整描述,更無法簡單地利用傳統(tǒng)的基于數(shù)值的計算模型來實現(xiàn)。
2.3 大腦的記憶
記憶是生物神經(jīng)系統(tǒng)的一個重要功能。對于大腦記憶機制和模型的研究,既可以增進人們對于大腦工作機理的理解,具有重要的科學(xué)意義,又能推進類腦(受腦啟發(fā)的)計算的發(fā)展,具有重要的工程應(yīng)用價值。
大腦首先從感知覺系統(tǒng)的外部或者內(nèi)部感受器中收集內(nèi)外部的信息,然后利用神經(jīng)系統(tǒng)中記憶的知識對收集的信息進行解釋和判斷。由于信號不可避免的帶有噪聲,而且通常觀察也是不完全的,因此,在神經(jīng)系統(tǒng)的各個水平上都必須借助記憶完成對接受的信號的修正和完整化。同樣的,為了形成適應(yīng)性的行為決策,神經(jīng)系統(tǒng)必須能夠?qū)Νh(huán)境變化的“歷史”形成內(nèi)部模型,這個作為決策依據(jù)的模型也是由記憶提供的。
機械記憶和生物記憶是兩類主要的記憶形式,分別以計算機中對于數(shù)據(jù)的存儲和高等動物腦中的記憶為代表,不同于機械記憶,生物記憶有如下幾個特點:
首先,生物記憶的介質(zhì)是生物神經(jīng)系統(tǒng),神經(jīng)元是神經(jīng)系統(tǒng)的基本組成單位。神經(jīng)生物學(xué)實驗表明,神經(jīng)系統(tǒng)主要通過改變多個神經(jīng)元之間的突觸聯(lián)接強度而記憶信息,并通過多個相關(guān)神經(jīng)元狀態(tài)的集體變化表示不同的信息。因此,生物記憶的第一個特點是分布式記憶,這與現(xiàn)代計算機利用一個或幾個相鄰字節(jié)表示一個單位信息的所謂局部性方式有很大不同。
其次,在生物記憶的回憶過程中,輸入的信息與回憶出來的信息必定有某種關(guān)聯(lián),或者前者是后者的一部分,或者兩者在內(nèi)容上相似或有聯(lián)系(如正好相反),或者兩者在環(huán)境中同時出現(xiàn)(即空間相關(guān))或相繼出現(xiàn)(即時間相關(guān))。早在兩千多年前,亞里士多德就提出記憶的輸入信息和回憶出的信息之間具有關(guān)聯(lián)性,他把這種現(xiàn)象總結(jié)為聯(lián)想律(Principle of Association)。因此,人們通常把人類或高等動物的記憶稱為聯(lián)想記憶。輸入信息與讀取信息的關(guān)聯(lián)性是生物記憶的重要特點,而在計算機中,信息在介質(zhì)中存儲具有確定的地址。
生物記憶的第三個特點是動態(tài)性,在人類的聯(lián)想記憶中,不只是由一個輸入項聯(lián)想出一個相關(guān)聯(lián)的記憶項,人們能夠記憶和回憶一個結(jié)構(gòu)化的序列,人的回憶是一個具有豐富動態(tài)特點的過程。形成鮮明對比是,計算機利用一個地址讀取一個信息,是一種機械單調(diào)的過程。
另外,在生物神經(jīng)系統(tǒng)中,記憶與信息的處理過程是纏繞在一起的,不像計算機系統(tǒng)那樣,信息存取的過程與計算過程是相對分離的。
因此,神經(jīng)記憶的特征主要表現(xiàn)在四個方面:分布式表達(dá)和存儲、輸入信息與檢索記憶在內(nèi)容上具有關(guān)聯(lián)性、存儲和記憶檢索具有動態(tài)性、記憶與信息處理過程緊密結(jié)合[16]。記憶在生物神經(jīng)系統(tǒng)中扮演著十分重要的作用,大腦記憶機制的研究,對于類腦(受腦啟發(fā)的)計算具有重要的指導(dǎo)意義。
3 類腦(受腦啟發(fā)的)計算面臨的問題
問題1:我們尚未搞清楚大腦的工作機理
目前,腦科學(xué)、神經(jīng)科學(xué)的基礎(chǔ)研究并未向我們完整揭示大腦的工作機理,這個領(lǐng)域還存在很多的問題有待進一步研究,比如:認(rèn)知功能與大腦網(wǎng)絡(luò)中不同分布區(qū)域的動態(tài)交互機理?大腦功能網(wǎng)絡(luò)的形成和解散與大腦結(jié)構(gòu)網(wǎng)絡(luò)的銜接和分離的內(nèi)在機制?在復(fù)雜的認(rèn)知行為中,大腦功能網(wǎng)絡(luò)如何有效的合作、競爭以及協(xié)調(diào)工作?不同腦組織的功能角色、以及角色間的基本數(shù)學(xué)原理,包括知識的獲取、表示和存儲?大量實驗證明,在睡眠狀態(tài)下,大腦的記憶得到了強化,它的內(nèi)在機理是什么?大腦用來處理外界激勵的能量消耗只占很小比例,那些與刺激無關(guān)的能量消耗到底做了什么?
問題2:腦科學(xué)是一個“大數(shù)據(jù)”命題
神經(jīng)系統(tǒng)的表征分布廣泛,神經(jīng)系統(tǒng)的處理過程中大腦活躍區(qū)域的變化以及區(qū)域間的相互作用,和不同認(rèn)知狀態(tài)下交互空間的變化的狀態(tài)空間是動態(tài)的、巨大的。一個科學(xué)家或者一次實驗根本不足以揭示大腦復(fù)雜的網(wǎng)絡(luò)連接,只有依靠全球的學(xué)者共享實驗數(shù)據(jù),建立一個開放的腦網(wǎng)絡(luò)連接數(shù)據(jù)庫,通過不斷的數(shù)據(jù)積累,才有可能達(dá)到認(rèn)識腦網(wǎng)絡(luò)的目的。如美國的學(xué)者于上世紀(jì)80年代提出和建立的Brainmap開放數(shù)據(jù)庫就是一個很好的例子[17]。盡管有這些嘗試,目前的技術(shù)還是遠(yuǎn)未達(dá)到對如此海量的數(shù)據(jù)進行有效記錄和解讀,使得我們難以從中提取有關(guān)腦的工作原理和規(guī)律的完整信息。腦科學(xué)不僅是一個數(shù)據(jù)發(fā)現(xiàn)的工程,更是一個數(shù)據(jù)整合、知識發(fā)現(xiàn)的“大數(shù)據(jù)”工程。
問題3:大腦的通訊編碼形式?
生物神經(jīng)網(wǎng)絡(luò)是一種脈沖神經(jīng)網(wǎng)絡(luò)(Spiking Neural Network),神經(jīng)元接收到的輸入脈沖引起細(xì)胞體膜電位的升高,當(dāng)其超過一定閾值時,將會發(fā)出一個神經(jīng)脈沖到軸突,并通過突觸與后續(xù)的神經(jīng)元樹突進行神經(jīng)遞質(zhì)的傳輸,影響其膜電位。鋒電位作為神經(jīng)元之間的傳輸信號,研究和理解其信息編碼的方式(Spike signal coding)將有助于我們更好的理解大腦的工作方式以及發(fā)展人機交互技術(shù)。目前,對于大腦神經(jīng)脈沖的編碼形式,我們依然處于摸索階段。
問題4:如何構(gòu)建大尺度的神經(jīng)形態(tài)計算系統(tǒng)?
神經(jīng)形態(tài)工程學(xué)的關(guān)鍵問題是如何理解單個神經(jīng)元的形態(tài)、神經(jīng)元環(huán)路以及整體架構(gòu),如何創(chuàng)建和獲得滿足不同任務(wù)需求所要的計算能力,如何完成信息的表達(dá)形式、如何獲得魯棒性、學(xué)習(xí)以及發(fā)展、適應(yīng)性的塑性變化以及有利于進化的改變。
問題5:計算能力的匹配
類腦計算需要完成高性能計算到高智能計算的進階,計算能力的度量由每秒完成的浮點數(shù)操作(Floating-point Operations Per Second,F(xiàn)LOPS)變化為每秒完成的突觸操作(Synaptic Operations Per Second,SOPS)。人類大腦約有10^11的神經(jīng)元,其中每個神經(jīng)元有約10^4的突觸連接,如果以10Hz的速度釋放神經(jīng)脈沖,其計算量約為10^16次突觸操作(SOPS),假設(shè)每次神經(jīng)脈沖操作需要10^2次數(shù)值計算,則共需要具有10^18次運算能力的高性能計算機(High Performance Computer,HPC)才能匹配整個大腦突觸操作的次數(shù)。目前最快的高性能計算機天河-2的計算能力為33.86~54.90 PFLOPS。而具有10^18浮點計算能力的機器預(yù)期在2019-2023年才能出現(xiàn)。
4 三種類腦認(rèn)知計算模型與技術(shù)實現(xiàn)途徑
雖然我們能夠在微觀尺度上觀測基因和蛋白質(zhì)結(jié)構(gòu)、在介觀尺度上研究細(xì)胞和神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)、在宏觀尺度上研究腦區(qū)結(jié)構(gòu)以及認(rèn)知行為,但至今我們對于大腦的結(jié)構(gòu)和功能的關(guān)系以及認(rèn)知功能的機理,并未形成一個完整而全面的認(rèn)識。即使如此,借鑒神經(jīng)科學(xué)的一些發(fā)現(xiàn)和認(rèn)知科學(xué)的一些理論,將會極大的地推進人工智能研究領(lǐng)域的極大發(fā)展,如:LeCun等學(xué)者受神經(jīng)科學(xué)中局部感受野的啟發(fā)設(shè)計了卷積神經(jīng)網(wǎng)絡(luò)[18]。Bengio等學(xué)者借鑒大腦基底神經(jīng)節(jié)與前額葉的信息處理機制,提出了人工神經(jīng)網(wǎng)絡(luò)中的強化學(xué)習(xí)的方法[19]。Poggio模擬靈長類動物在識別物體時視皮層神經(jīng)活動過程構(gòu)建的HMAX模型[20]。2016年,Google的Deepmind公司設(shè)計的AlphaGo針對圍棋這一特定問題采用受生物神經(jīng)網(wǎng)絡(luò)層次化組織結(jié)構(gòu)啟發(fā)的深度學(xué)習(xí)方法構(gòu)建了價值與策略網(wǎng)絡(luò)模型[2],在圍棋比賽中獲得了足以抗衡(甚至優(yōu)于)人腦的優(yōu)異表現(xiàn)。由此可見,借鑒神經(jīng)科學(xué)的知識來豐富和啟發(fā)人工智能的研究已成為一個重要的研究方向。
4.1 三種類腦(受腦啟發(fā)的)認(rèn)知計算模型
目前,國內(nèi)外學(xué)者主要圍繞三種類腦認(rèn)知模型開展研究:
(1)基于生物學(xué)的腦認(rèn)知網(wǎng)絡(luò)計算模型(圖5a),代表性的工作有瑞士聯(lián)邦理工的馬克哈姆教授發(fā)起的歐盟HBP項目;
(2)基于數(shù)據(jù)驅(qū)動的腦認(rèn)知計算模型(圖5b),設(shè)計各種巧妙的激勵測試實驗,通過如核磁共振、腦電圖等神經(jīng)成像技術(shù)獲得有限的實驗數(shù)據(jù),并對測量數(shù)據(jù)加以分析歸納;
(3)基于數(shù)學(xué)和人工神經(jīng)網(wǎng)絡(luò)的腦認(rèn)知計算模型(5c),使用數(shù)學(xué)分析和計算機模擬的方法對生物實驗觀察數(shù)據(jù)和測試結(jié)果進行研究,提出大腦信息加工的生物學(xué)假設(shè)、提煉出相應(yīng)的數(shù)學(xué)和計算模型,發(fā)展出了相應(yīng)的計算神經(jīng)理論和計算方法。
(a)基于生物學(xué)的腦認(rèn)知計算模型
(b)基于數(shù)據(jù)驅(qū)動的腦認(rèn)知計算模型
(c)基于數(shù)學(xué)的腦認(rèn)知計算模型
圖5 三種類腦認(rèn)知計算模型
4.2 類腦計算的技術(shù)實現(xiàn)途徑
從計算科學(xué)和工程學(xué)的觀點來看,類腦計算是一門以仿生學(xué)為基礎(chǔ)的、但又超越仿生學(xué)的工程研究,其研究基礎(chǔ)離不開仿生學(xué)提供的大量神經(jīng)學(xué)分析數(shù)據(jù),而其具體實現(xiàn)又依賴于物理可實現(xiàn)的小型化、可控的功能載體。目前來看,實現(xiàn)類腦計算可能的技術(shù)途徑主要有:
(1)基于亞閾值電路和基于憶阻器的數(shù)模混合電路的實現(xiàn)方法;
(2)基于數(shù)字電路的設(shè)計實現(xiàn);
(3)基于超級計算機的軟件仿真。
混合信號芯片可以做到超低功耗和較高的人工神經(jīng)元密度,但是基于模擬混合信號的應(yīng)用開發(fā)十分困難,高密度的模擬元器件的性能受制程工藝以及溫度、濕度的影響很大,難以進行有效的神經(jīng)編程(Neural Programming)、移植和狀態(tài)監(jiān)測等;基于數(shù)字電路的設(shè)計,易于編程和采用不同的芯片制程設(shè)計實現(xiàn),但缺點是受限于海量的數(shù)值運算單元,難以實現(xiàn)高密度的神經(jīng)元系統(tǒng);相較于前兩種方式,基于超級計算機的方案可以比較方便的構(gòu)建不同尺度的類腦仿真系統(tǒng),但缺點是運行速度較慢,設(shè)備昂貴且功耗巨大。作者認(rèn)為,目前已有的類腦計算的研究工作存在著以下幾方面的問題:
1.熱衷于追求更大規(guī)模的神經(jīng)網(wǎng)絡(luò)實現(xiàn),而忽略了神經(jīng)系統(tǒng)信息處理中最重要也是最基本的單元——神經(jīng)環(huán)路的研究。
2.大多工作集中在神經(jīng)活動模型和學(xué)習(xí)計算理論兩方面,忽略了神經(jīng)網(wǎng)絡(luò)的動力學(xué)特性。比如:采用離線學(xué)習(xí)的TrueNorth芯片,需要通過靜態(tài)配置的方式將離線訓(xùn)練完成的神經(jīng)網(wǎng)絡(luò)參數(shù)進行部署,才能實現(xiàn)特定的應(yīng)用。
3.已有類腦計算架構(gòu)設(shè)計者大多是來自計算機相關(guān)專業(yè)的專家和學(xué)者,往往受人工智能神經(jīng)網(wǎng)絡(luò)設(shè)計思路的影響,集中在尋找合適的特征來描述外部世界的復(fù)雜性和不變性,而忽略了從神經(jīng)網(wǎng)絡(luò)內(nèi)部信息表達(dá)模態(tài)不變性的角度分析和設(shè)計類腦計算系統(tǒng)的研究方法。
5 視覺認(rèn)知的神經(jīng)形態(tài)計算
正如前言中所指出的,類腦計算是受腦功能和腦神經(jīng)網(wǎng)絡(luò)連接機制啟發(fā)的一種計算架構(gòu),它以神經(jīng)形態(tài)計算的模式來部分模擬大腦功能與其結(jié)構(gòu)的對應(yīng)關(guān)系和反饋連接,增強人工智能及其計算效率,而不是簡單的復(fù)制人類的大腦。這就意味著類腦計算研究的發(fā)展必須面向具體問題。
5.1 視覺計算
人腦感知的外界信息大約80%來自視覺通道。而在這些視覺信息中存在著大量的無關(guān)甚至使人誤解的偏差,并且視覺信息數(shù)據(jù)本身不會顯現(xiàn)出相應(yīng)的相關(guān)性和不變性。但人類的視覺系統(tǒng),從視網(wǎng)膜的輸入到高級皮層形成認(rèn)知的各個階段,卻能以某種方式理解或整理這些雜亂無章的視覺輸入數(shù)據(jù)。因此,用機器來求解視覺場景理解的問題時,需要回答:在物理學(xué)和光學(xué)的基礎(chǔ)上,對感知的景物圖像必須完成哪些處理?如何表示和利用客觀世界模型、知識以及選擇性注意機制?后一個問題自然地要求機器具有類腦計算的功能。因此,選擇人類視覺處理機制的典型應(yīng)用為出發(fā)點和突破口,嘗試構(gòu)建類似大腦的視覺信息處理模型及架構(gòu),對促進類腦計算的深入研究具有重要的指導(dǎo)意義。
作者在從事計算機視覺的研究工作中,始終思考著這樣一個問題:怎樣利用知識,將大腦的某些視覺感知功能賦予機器,即:
(1)如何實現(xiàn)初級視覺中不同層次和水平的自然銜接,使視覺系統(tǒng)自動將信息組織成具有連續(xù)性的結(jié)構(gòu)?
(2)認(rèn)知的基本單元是什么?是否存在統(tǒng)一的方式處理不同視覺模塊灰度、紋理、形狀、顏色、表面深度和運動的組織信息?
(3)選擇性注意力機制是怎樣在大腦的初級視覺信息處理中產(chǎn)生作用的?
(4)如何將這個組織原則映射到物理可實現(xiàn)的高度并行的“類腦”計算結(jié)構(gòu)中?作者在《計算機視覺與模式識別》一書中指出:“計算機視覺系統(tǒng)和模式識別機器,尤其是在信息的高度并行分布式處理方面的進展,將更加依賴于對于人腦功能正確的模擬,而且這可能為下一代計算機及機器智能的研究開辟出一條新的途徑”[21]。視覺認(rèn)知計算可以作為類腦計算的一個突破點,它有助于構(gòu)建結(jié)構(gòu)緊湊、高能效的智能自主系統(tǒng),并為智能機器人和大規(guī)模非結(jié)構(gòu)化數(shù)據(jù)知識處理、遠(yuǎn)程自主系統(tǒng)等新興學(xué)科提供新的計算架構(gòu)參考,使類腦計算在更廣泛的領(lǐng)域得到應(yīng)用。
人眼所能看到的光譜波長范圍從380納米到780納米,這段波長稱為可見光譜,在可見光范圍內(nèi),不同波長的光給人以不同的色彩感覺,不同強度的光及不同強度分布的光刺激人眼,在人腦中將產(chǎn)生不同的光強,顏色,形狀等視覺信息。
人類具有完善的視覺系統(tǒng)可以在瞬息感知外部世界,視覺系統(tǒng)中不同的神經(jīng)元,它們分別對由簡單到愈來愈復(fù)雜的視覺圖像(如運動、邊緣、形狀、顏色和紋理等)產(chǎn)生刺激和反應(yīng)。神經(jīng)科學(xué)家對視覺信息的并行處理進行了深入的研究。所謂的并行分塊處理是指不同視覺性質(zhì)的信息成分按不同的神經(jīng)通道進行預(yù)處理并輸入視皮層,由不同性質(zhì)的皮層細(xì)胞分別進行分析處理。以英國科學(xué)家Zeki為代表的神經(jīng)科學(xué)家認(rèn)為,人類視覺系統(tǒng)使用更加精巧的策略或辦法來統(tǒng)一不同性質(zhì)的信息,即在幾個不同水平上相互作用來多級地處理復(fù)雜的視覺信息,并在大腦皮層由這些反應(yīng)得出對外部世界的描述。解決復(fù)雜的視覺任務(wù)需要多種信息的融合以及利用多種約束條件和知識。
圖6給出了人類視覺信息通道的示意圖。光線從眼球前方的角膜穿過,經(jīng)過前房、晶狀體、玻璃體、聚焦于視網(wǎng)膜上,被感光細(xì)胞接收,使得光信號轉(zhuǎn)換為電信號。具體的,信號經(jīng)由感受器(視桿和視錐細(xì)胞)->雙極細(xì)胞(第一級神經(jīng)元)->節(jié)細(xì)胞(第二級神經(jīng)元)->視神經(jīng)->視交叉->視束->外側(cè)膝狀體(第三級神經(jīng)元)->視輻射->內(nèi)囊枕部->枕葉視區(qū)的傳導(dǎo)途徑到達(dá)大腦皮層,形成視覺[22]。視覺信息系統(tǒng)包含不同的通路對視覺信息的不同屬性進行傳遞和處理,多條通路之間還存在交叉連接。不同細(xì)胞群的響應(yīng)表示被感知物的不同特征,多種特征的關(guān)系構(gòu)成整體的感知。
圖6 人類視覺信息通道示意圖
5.2 研究計算視覺的基本觀點
研究計算視覺,我們必須知曉:視覺不是孤立地起作用,而是復(fù)雜的行為系統(tǒng)的一部分;其次,視覺計算是動態(tài)的,通常并不需要一次將所有的問題都計算清楚,而是對所需要的信息加以計算;第三,視覺計算應(yīng)該是自適應(yīng)的,視覺系統(tǒng)的特性應(yīng)該隨著與外界的交互而變化。同時,初級視覺中的全局和局部感知同樣存在著交互行為,小尺度和大尺度感知是并行的、相互作用的。生物視覺具有小范圍競爭、大范圍協(xié)作的特點,該特點與2.2.1小節(jié)中提到的大腦結(jié)構(gòu)網(wǎng)絡(luò)具有“Small world”的特性,表現(xiàn)出結(jié)構(gòu)和功能的一致性。下面簡單討論視覺認(rèn)知的基本性質(zhì)。
5.2.1 視覺交互行為與注意力集中
視覺認(rèn)知過程不只是被動地對環(huán)境的響應(yīng),同時也是一種主動行為:人們在環(huán)境信息的刺激下,通過眼動、走動,改變觀察點,從動態(tài)的信息流中抽取不變性,在交互作用下產(chǎn)生知覺(主動視覺系統(tǒng))。人腦在視覺認(rèn)知過程中存在自下而上和自上而下的雙向信息處理通道。生物視覺通道使用自下而上的傳遞過程(200ms-300ms)對視覺對象形成初步認(rèn)知結(jié)果(100步法則)。通過自上而下的反向傳遞控制眼球的注意力,完成預(yù)測-驗證的認(rèn)知過程。人具有從復(fù)雜環(huán)境中搜索特定目標(biāo),并對目標(biāo)信息進行選擇處理的能力[23-24]。這種搜索與選擇的過程被稱為注意力集中(Focus attention)。比如,大腦通過控制眼球的肌肉,完成注意區(qū)域的聚焦,在眼動過程中的信息則是被忽略的。人們對于注視點周圍的物體可以精確地反應(yīng)出其顏色、形狀、深度信息,而對于處于視野邊緣的物體,則很難分辨清楚它的顏色、形狀和距離。這就是信息表達(dá)的不完整性。選擇注意機制可分為獨立于內(nèi)容和語義的初級(Low-level)注意系統(tǒng)和基于內(nèi)容和語義的高級(High-level)注意系統(tǒng)兩個層次。
5.2.2 選擇性注意與群體編碼(綁定問題)
研究表明,單細(xì)胞并不能揭示視覺皮層神經(jīng)編碼原理,沒有任何一個神經(jīng)元可以獨立地表達(dá)知識或聯(lián)想記憶。而是,由“一群”神經(jīng)元參與對不同模式的表達(dá),而且其中任一個給定的神經(jīng)元,在不同時刻發(fā)生不同的作用。這種性質(zhì)大大減少了神經(jīng)網(wǎng)絡(luò)的規(guī)模,同時也提高了產(chǎn)生新的神經(jīng)表達(dá)的靈活性。這里就產(chǎn)生了群體編碼(Population or assembly coding)。應(yīng)用局部并行的方式來實現(xiàn)復(fù)雜的全局計算。視知覺組織協(xié)調(diào)這些局部過程,并與數(shù)據(jù)導(dǎo)向相結(jié)合。動態(tài)群體編碼表現(xiàn)出一種選擇性綁定(Selective binding)問題。
5.2.3 反饋
反饋在人類視覺信息獲取和認(rèn)知過程中起著極其重要的作用。反饋環(huán)節(jié)的引入,使得人類具有主動的、有目的的對外界的感知。神經(jīng)反饋分為下意識和有意識的反饋控制,例如最簡單的膝跳反應(yīng)就是一個下意識的行為。而在眾多人群中,排選熟悉的面孔,則是深思熟慮的結(jié)果。
5.3 視覺認(rèn)知與深度學(xué)習(xí)
5.3.1 深度學(xué)習(xí)的進步與問題
借鑒大腦的視覺處理機制,人工神經(jīng)網(wǎng)絡(luò)表現(xiàn)出類似人腦的學(xué)習(xí)、歸納分類的能力。目前深度學(xué)習(xí)(Deep Learning)方法依賴大規(guī)模訓(xùn)練數(shù)據(jù),在圖像分類、語音識別、人臉識別等領(lǐng)域已接近甚至超過了人的能力。2015年12月舉行的ImageNet和MS COCO計算機視覺挑戰(zhàn)賽上,來自微軟亞洲研究院孫劍團隊采用152層神經(jīng)網(wǎng)絡(luò)獲得了超過人眼辨識的正確率[25]。但目前深度網(wǎng)絡(luò)模型與人類大腦相類比,我們無法給出深度網(wǎng)絡(luò)對應(yīng)學(xué)習(xí)或分類任務(wù)的功能連接與有效連接的定義和描述,并且存在以下問題:
(1)缺乏理論支持(如:面向不同復(fù)雜度的任務(wù)需要設(shè)計多少隱層?如何消除海量存在的冗余參數(shù)?何種網(wǎng)絡(luò)連接為最優(yōu)結(jié)構(gòu)?)。因此其很難對效果超群的深度學(xué)習(xí)算法在具體問題上給出恰當(dāng)?shù)睦碚摻忉尅?
(2)大規(guī)模神經(jīng)網(wǎng)絡(luò)容易過擬合數(shù)據(jù),只有采集到充分大的標(biāo)注且數(shù)據(jù)維度足夠高時,有了大數(shù)據(jù)樣本才能緩解復(fù)雜模型的過度學(xué)習(xí)。因此深度學(xué)習(xí)性能依賴于海量的學(xué)習(xí)樣本以及樣本的質(zhì)量,在小樣本數(shù)據(jù)下無法獲得有效的知識(概念)。
(3)目前的深度學(xué)習(xí)方法,還是停留在統(tǒng)計學(xué)習(xí)和復(fù)雜模式識別與分類層面上,比起人的學(xué)習(xí)能力還有很多局限。比如,人的舉一反三、觸類旁通、無師自通所展現(xiàn)出的知識遷移的學(xué)習(xí)能力是現(xiàn)有統(tǒng)計學(xué)習(xí)所遠(yuǎn)遠(yuǎn)不能達(dá)到的。2015年12月《科學(xué)》雜志封面文章《通過概率規(guī)劃歸納的人類層次概念學(xué)習(xí)》[26],介紹了通過概率推理的“單樣本學(xué)習(xí)”方法,實現(xiàn)了“只看一眼就會寫字”的人工智能系統(tǒng)。由于先驗知識的存在,貝葉斯方法適合小樣本的學(xué)習(xí)。這篇文章表明將計算模型和人類認(rèn)知過程的觀測模式與認(rèn)知科學(xué)的理論相結(jié)合,互為建立線索和印證,可以從極小的樣本里進行學(xué)習(xí),并能自動歸納、抽象訓(xùn)練數(shù)據(jù)里的高層次信息。計算機理解概念,學(xué)會如何學(xué)習(xí)這種方法對于人類字符書寫一般規(guī)律的推理和概念形成是有效的。但是對一個復(fù)雜場景理解等任務(wù)建立類似的generative model還有很長的路要走。深度模型與知識的融合,外部記憶的增強,深度學(xué)習(xí)與貝葉斯學(xué)習(xí)推理的結(jié)合應(yīng)該是其未來的研究方向。
5.3.2 視覺認(rèn)知中的深度學(xué)習(xí)層次結(jié)構(gòu)
在視覺認(rèn)知計算中,對深度學(xué)習(xí)層級結(jié)構(gòu)的理解要避免走入一個誤區(qū):層級結(jié)構(gòu)最頂層的輸出是認(rèn)知編碼的目的。實際上人對視覺刺激的認(rèn)知編碼的結(jié)果是整個層級結(jié)構(gòu),而不只是層級結(jié)構(gòu)最頂層的輸出。目前的深度學(xué)習(xí)和計算機視覺只需要識別出圖像中的對象,這種認(rèn)知是面向?qū)ο蟮摹H四X不僅能識別出輸入圖像中的對象,還能在一定程度上識別出構(gòu)成這些場景和對象的細(xì)節(jié)(雖然不是像素級的細(xì)節(jié))。也就是說,在大腦層級編碼模型中,底層的作用不僅是為了最終得到最頂層,而每一層本身就是對圖像的部分編碼。
另外,一種觀點認(rèn)為高級視覺認(rèn)知就是對象認(rèn)知,這種理解容易對視覺認(rèn)知機制產(chǎn)生混淆和誤導(dǎo)。比如嚙齒動物,它們并不需要識別出什么是建筑、什么是草坪、什么是公路,它們的高級視覺認(rèn)知主要在于復(fù)雜環(huán)境中的導(dǎo)航,比如快速識別出哪里可以逃跑,哪里存在障礙等[27]。人腦認(rèn)為草坪和道路作為兩個對象,其界線非常明顯,而嚙齒動物的高級視覺認(rèn)知可能并不會對視覺場景做這樣的劃分。因此,構(gòu)造一個能很好的識別“對象”的算法只是解決“眼前”的問題。但是,對象識別只是人腦適應(yīng)環(huán)境的結(jié)果,仍然不是最根本的視覺認(rèn)知機制。
5.3.3 現(xiàn)有視覺計算架構(gòu)的局限
傳統(tǒng)的圖像傳感器不具備或者僅有簡單的計算能力。視覺信息的處理受限于視頻幀格式的傳感器輸入(如30/60Hz的時間分辨率)。固定時間間隔的空間采樣有可能損失重要的時域信息。同時,在初級特征獲取之前,大量未加工的、冗余的數(shù)據(jù)需要進行傳輸或者計算,從而消耗了大量的通訊帶寬和計算資源。
在信息處理過程中,空域和時域運算執(zhí)行效率受限于計算和存儲相分離的架構(gòu),即使采用并行度很高的GPU,并通過精巧的存儲設(shè)計和編譯器的優(yōu)化支持,依然只能獲得有限的能效提升。在當(dāng)前主流的處理器架構(gòu)中,雖然采用更高級別的并發(fā)多線程技術(shù),可以在一定程度彌補存儲單元與計算單元之間的通訊延遲,但依然無法避免參與計算的數(shù)據(jù)在層次化存儲單元中頻繁的搬移所帶來的能耗問題。
5.4 腦啟發(fā)的視覺處理計算架構(gòu)
視覺通道特別是視網(wǎng)膜的信息處理能力、大腦神經(jīng)連接的網(wǎng)絡(luò)化結(jié)構(gòu)以及聯(lián)想記憶啟發(fā)我們設(shè)計和研究新型的視覺計算模型和處理架構(gòu)。這種架構(gòu)的組成單元有:從幀驅(qū)動到事件驅(qū)動的信息獲取單元(智能計算前移)、注意力選擇/事件驅(qū)動的信息獲取方式、時空動態(tài)的信息編碼、網(wǎng)絡(luò)化分布式的動態(tài)信息處理、結(jié)合長時和短時記憶功能的網(wǎng)絡(luò)結(jié)構(gòu),以及條件要素的約束和引導(dǎo)的有效控制。實現(xiàn)大腦結(jié)構(gòu)網(wǎng)絡(luò)、功能網(wǎng)絡(luò)和有效網(wǎng)絡(luò)在視覺處理架構(gòu)不同層次的映射。
5.4.1 概念形成與流形解離
Hebb學(xué)習(xí)理論[28]認(rèn)為神經(jīng)系統(tǒng)中的概念是由一組聯(lián)合激勵的神經(jīng)元集群共同表達(dá)的,這一理論也描述了突觸可塑性的基本原理:突觸前神經(jīng)元A向突觸后神經(jīng)元B的重復(fù)持續(xù)刺激,可以導(dǎo)致突觸傳遞效能的增加。如果用于表達(dá)一個特定概念的細(xì)胞集群中的某個神經(jīng)元(簇)并未接收可以讓它產(chǎn)生神經(jīng)脈沖的激勵(沒有激勵,或者激勵不足),它依然可以通過屬于同一個細(xì)胞集群組中其它神經(jīng)元(簇)的興奮刺激,促使其達(dá)到激活的狀態(tài)。
人類識別圖像通常對圖像信息進行編碼,通過大腦視覺腹側(cè)通路將編碼信息傳導(dǎo)至下顳葉皮層。下顳葉皮層神經(jīng)可以被復(fù)雜的圖形(人臉)所激活,并對圖形的位置、大小、姿勢和光照等變化信息具有魯棒性。因此根據(jù)下顳葉皮層的神經(jīng)反應(yīng)特性,視覺圖像信息形成概念的過程可以看做是將相互纏繞的高維流形(圖像)逐漸解離至具有不變特征的相互獨立的空間中(圖7)[29]。利用這一特性將有助于啟發(fā)我們尋求新的視覺認(rèn)知計算模型和架構(gòu)。
(a)人臉概念在圖像空間形成高維流形
(b)人臉概念在好的神經(jīng)特征空間中的表達(dá)
(c)人臉概念在差的神經(jīng)特征空間中的表達(dá)
(d)兩個人臉在像素空間中相互纏繞
圖7 人臉識別的流形解離與概念形成示例
5.4.2 時空信息編碼方式
視皮層神經(jīng)元活動存在同步震蕩現(xiàn)象,人們進一步通過對視皮層神經(jīng)元脈沖精細(xì)時間結(jié)構(gòu)的分析發(fā)現(xiàn),脈沖的間隔似乎也被用來進行信息編碼,并提出了神經(jīng)元是基于脈沖時間一致性檢測機理的方式發(fā)放神經(jīng)脈沖的假設(shè)。有別于傳統(tǒng)的“整合-放電”的工作原理,該假設(shè)認(rèn)為信息的傳遞不是由單位時間的發(fā)放率,而是由脈沖的發(fā)放時間間隔決定的。細(xì)胞群通過空域快速的功能連接重組完成上下文(任務(wù))的相關(guān)表達(dá),通過時域傳遞時間的間隔(或頻率)調(diào)制完成信息的組織。
“整合-放電”的方式只與信號的積分有關(guān),忽略了信號的順序和時間尺度關(guān)系。而基于時間間隔的震蕩方式具備信號的時序相關(guān)分析,可以較好的鑒別信號與噪聲、捕獲異常。前者在當(dāng)前的人工神經(jīng)網(wǎng)絡(luò)研究中早已得到了廣泛的應(yīng)用,但后者的研究還未引起足夠的重視。雖然后一種編碼方式還未獲得生物學(xué)和神經(jīng)科學(xué)的嚴(yán)格證實,但筆者推測,或許時空信息的編碼方式可以獲得更接近于生物神經(jīng)系統(tǒng)處理的效率和能力,應(yīng)該加強這方面的研究探索。
基于數(shù)據(jù)驅(qū)動的視覺神經(jīng)信息編解碼模型為視覺信息時空編碼方式提供了另一種探索途徑。視覺神經(jīng)編解碼是以視覺認(rèn)知理論為基礎(chǔ),即人在看到不同的圖像時,大腦會產(chǎn)生不同的時空動態(tài)響應(yīng)。如圖8所示,通過采集人眼接受不同圖像刺激時,大腦響應(yīng)時空數(shù)據(jù)來建立并訓(xùn)練數(shù)學(xué)模型,可以預(yù)測人眼看到新的圖像時的大腦響應(yīng)(視覺神經(jīng)編碼),或者根據(jù)采集到的大腦響應(yīng)來識別、重構(gòu)人眼所看到的圖像(視覺神經(jīng)解碼)[30]。例如,美國科學(xué)家Gallant及其團隊利用fMRI信號成功識別出被試者所看到的自然圖像,識別準(zhǔn)確率最高達(dá)到92%[31]。日本科學(xué)家Miyawaki及其團隊采用MVPA方法直接從fMRI信號重構(gòu)出被試者看到的二值圖像[32]。視覺神經(jīng)編解碼是面向工程應(yīng)用的,比如未來有可能將攝像機看到的信息編碼為大腦可識別的信號并傳遞到盲人的相關(guān)腦區(qū),幫助盲人恢復(fù)視覺能力。從理論研究的角度,對視覺神經(jīng)信息編解碼模型的研究可以為我們研究真實大腦的視覺編碼機制提供思路。
圖8 數(shù)據(jù)驅(qū)動的視覺神經(jīng)信息編解碼
5.4.3 從幀驅(qū)動到事件驅(qū)動的信息獲取
這里討論智能計算前移的觀點。在焦平面進行簡單信號處理,從而提高計算效能。人類的視網(wǎng)膜具備初步的信息處理能力,啟發(fā)我們采用地址事件表征的視覺傳感器(Address Event Representation,AER)來完成計算前移和信息篩選。計算視覺的知識告訴我們,圖像強度突變處的檢測(物理邊緣)和運動估計是初級視覺中兩個重要的問題。采用AER結(jié)構(gòu)的圖像傳感器,當(dāng)感光像素的光流變化超過一定閾值時,輸出一個含有時間和像素地址信息的脈沖編碼,否則沒有輸出。采用事件驅(qū)動的傳感器可以大大提高視覺處理的時間分辨率(可以獲得接近1K的時間采樣分辨率)、同時減少數(shù)據(jù)的傳輸帶寬以及后續(xù)的計算資源需求,從而提高信息處理的效率[33]。
5.4.4 從事件驅(qū)動到注意力驅(qū)動的信息獲取
借鑒生物視網(wǎng)膜圖像采集和處理的功能,將傳感器光探測單元與可配置的圖像處理電路緊耦合,完成被動(自下而上的由事件驅(qū)動的信息獲取,如運動導(dǎo)致的光流變化)和主動(自上而下的注意力選擇,如基于概念或經(jīng)驗知識的目標(biāo)定位)的圖像采集。視網(wǎng)膜存在兩種感光細(xì)胞:視桿細(xì)胞和視錐細(xì)胞。視桿細(xì)胞對暗光敏感,在中央凹處無分布;視錐細(xì)胞有色覺,光敏感性差,但視敏度高,在中央凹分布密集,而在視網(wǎng)膜周邊相對較少。因此視覺注視點(投射到中央凹)處的圖像分辨率遠(yuǎn)高于非注視區(qū)域,這是一種非均勻采樣。從生物學(xué)能量效率的角度講,注意力將信息處理聚焦在最有意義的視覺目標(biāo)或特性上,而不必其他目標(biāo)或者其它特性。引入注意力驅(qū)動的傳感器不僅能夠?qū)崿F(xiàn)近似人類視覺處理的雙向通道,還可以完成注視區(qū)域信息的精細(xì)化獲取。但這一方案可能帶來的問題是,前置圖像處理組件會導(dǎo)致傳感器中每個像素單元的面積增加,降低像素單位密度,從而減低空間采樣分辨率。未來可以采用2.5D或者3D電路結(jié)構(gòu)來彌補這一問題。
5.4.5 網(wǎng)絡(luò)化結(jié)構(gòu)的信息處理
視覺處理系統(tǒng)包含不同的通路對視覺信息的不同屬性進行傳遞和處理(形狀、顏色、運動、立體等),多條通路之間還存在交叉性連接。不同細(xì)胞群的響應(yīng)表示被感知物的不同特征,多種特征的關(guān)系構(gòu)成整體的感知。在計算機視覺的研究初期,網(wǎng)絡(luò)化的信息處理方式就引起了國內(nèi)外學(xué)者的關(guān)注,特別是受之啟發(fā)的人工神經(jīng)網(wǎng)絡(luò)在面向特定的應(yīng)用領(lǐng)域獲得了極大的成功。然而,從大腦的結(jié)構(gòu)連接、功能連接以及有效連接的角度開展視覺認(rèn)知處理架構(gòu)的研究才剛剛開始。大腦的三種連接(圖4)啟發(fā)我們發(fā)展設(shè)計具有層次化、結(jié)構(gòu)化、可擴展的網(wǎng)絡(luò)拓?fù)浣M織結(jié)構(gòu)的計算架構(gòu)(緊耦合的計算和存儲、以及高效的片內(nèi)/間互連),并按照相應(yīng)的學(xué)習(xí)規(guī)則動態(tài)地完成計算資源分配(模擬神經(jīng)突觸的強度變化),同時兼顧魯棒的信息交互結(jié)構(gòu)(對于異常、噪聲和故障的容忍)。
5.4.6 長/短時記憶相結(jié)合的智能存儲
學(xué)習(xí)是人和動物對環(huán)境條件所產(chǎn)生的適應(yīng)性行為。記憶是獲得的信息或經(jīng)驗在腦內(nèi)存儲和再現(xiàn)的神經(jīng)活動過程。瞬時記憶是感覺器官對刺激信息的暫時存儲,短時記憶用于信息的保持和精細(xì)加工,長時記憶是個體經(jīng)驗積累和認(rèn)知能力發(fā)展的前提。瞬時記憶、短時記憶和長時記憶之間有首因/近因效應(yīng),三者之間在一定的條件下可以發(fā)生轉(zhuǎn)換。學(xué)習(xí)和記憶的基本過程是:信息獲取、選擇、鞏固和再現(xiàn)。信息獲取是感知器官向大腦輸入信號的階段,注意力在信息的獲取階段影響很大。選擇和鞏固是信息在腦內(nèi)進行簡單處理、決定是否需要保持和進一步強化形成長時記憶的階段,其鞏固程度和信息對于個體的意義以及是否重復(fù)出現(xiàn)有關(guān)(增加曝光度會增加熟悉度和確定性,但不清楚是否影響記憶)。再現(xiàn)也即回憶,是將腦中存儲的長時記憶信息提取再現(xiàn)于意識,從而利用經(jīng)驗知識信息完成高層次的信息加工處理的過程。
記憶的容量和區(qū)分度(容錯)也是一個重要的研究內(nèi)容,對于一個確定規(guī)模的神經(jīng)系統(tǒng)而言,具有良好的區(qū)分度的記憶表達(dá)和支持更大數(shù)目的記憶是一對相互矛盾的目標(biāo)。由于每個神經(jīng)元(簇)可以參與不同的細(xì)胞集結(jié)(概念)的表達(dá),神經(jīng)擬態(tài)計算中一個整體概念的表達(dá)廣泛的分布在不同位置的神經(jīng)元(簇),因此,神經(jīng)系統(tǒng)的記憶容量具有較大的彈性。特別是,當(dāng)有新的模式需要學(xué)習(xí)時,如何利用已有的“記憶”完成不同程度的知識遷移,而不是從頭開始學(xué)習(xí)。有關(guān)生物記憶的研究還處在不斷的研究和發(fā)展過程中。在類腦計算(受腦啟發(fā)的計算)研究過程中,借鑒具有生物學(xué)可信度的有關(guān)記憶的工作機制,將有助于啟發(fā)我們尋求新的長/短時記憶相結(jié)合的智能存儲結(jié)構(gòu),實現(xiàn)基于分布式聯(lián)想記憶(知識和經(jīng)驗)的智能信息處理與加工。
5.4.7 條件要素的約束和引導(dǎo)(控制單元)
在視覺感知過程中,三維世界在感光器上的二維投影會導(dǎo)致深度等結(jié)構(gòu)信息的損失,因此為了得到合理的視覺認(rèn)知輸出,需要在認(rèn)知處理過程中增加自然的約束(關(guān)于客觀世界的假設(shè)和知識)。并且,在不同層次和模塊間完成信息融合時,需要設(shè)計支持約束條件要素的控制單元來減少或利用信息的不確定性。在瞬時、短時和長時記憶相互轉(zhuǎn)化的過程中和長時記憶的再現(xiàn)調(diào)度中,也需要設(shè)計支持引導(dǎo)的控制單元來完成有關(guān)知識和經(jīng)驗的智能存儲和再現(xiàn)。
心理學(xué)和神經(jīng)生物學(xué)的實驗證明,大腦的視覺處理使用了不同的暗示并將它們組合起來完成信息的理解。在面向視覺認(rèn)知的類腦計算架構(gòu)中還應(yīng)當(dāng)設(shè)計包含提供特定暗示的控制模塊,并根據(jù)視覺環(huán)境采用不同的加權(quán)或引導(dǎo)來解決復(fù)雜的視覺認(rèn)知問題。神經(jīng)生理學(xué)的大量實驗告訴我們,大腦皮層各功能區(qū)域之間的關(guān)系是極為復(fù)雜的,并且,腦功能具有一種“突現(xiàn)”性質(zhì)。因此,在設(shè)計類腦計算的架構(gòu)時,解決各層次和各處理模塊之間的關(guān)聯(lián)控制是一個巨大的挑戰(zhàn)。
5.4.8 面向大規(guī)模神經(jīng)網(wǎng)絡(luò)計算的互連架構(gòu)
2009年開始,作者的研究團隊圍繞大規(guī)模并行分布式計算系統(tǒng)與美國麻省理工學(xué)院開展合作研究,實現(xiàn)了一種面向千核處理器的可重構(gòu)并提供時鐘級精度的并行仿真器[34-36]。在此基礎(chǔ)上,作者的研究團隊進一步研制出具有分布式、高通量、高靈活性以及高魯棒性的網(wǎng)絡(luò)式大規(guī)模并行處理仿真系統(tǒng)(Simulator for Multi-core Architecture Reconfigurable Technology,SMART),并在FPGA芯片上搭建了相應(yīng)的開發(fā)和驗證系統(tǒng)。并針對未來采用深亞微米制程的計算芯片所面臨的“暗硅”[37]、細(xì)粒度的動態(tài)電源門控、異構(gòu)多核、以及加工、老化引起的故障、性能波動對網(wǎng)絡(luò)計算結(jié)構(gòu)和性能的影響等問題,設(shè)計了避免死鎖、保障高連通率以及負(fù)載均衡的片上通訊系統(tǒng)和資源管理策略[38-39]。
未來,我們將進一步深入研究面向視覺認(rèn)知任務(wù)處理的新型計算架構(gòu)(如圖9所示),以大腦連接網(wǎng)絡(luò)、功能網(wǎng)絡(luò)和有效網(wǎng)絡(luò)的計算映射為出發(fā)點,從小規(guī)模的視覺神經(jīng)網(wǎng)絡(luò)原型設(shè)計開始,通過芯片內(nèi)互連、芯片間互連的網(wǎng)絡(luò)結(jié)構(gòu),以視覺認(rèn)知任務(wù)為導(dǎo)向,從組件到系統(tǒng)探索構(gòu)建受腦啟發(fā)的視覺計算系統(tǒng)。
圖9 受大腦結(jié)構(gòu)網(wǎng)絡(luò)、功能網(wǎng)絡(luò)和有效網(wǎng)絡(luò)啟發(fā)的類腦計算網(wǎng)絡(luò)架構(gòu)
6 結(jié)束語
類腦計算是一個令人興奮又感到望而生畏的艱難挑戰(zhàn)。類腦計算的基礎(chǔ)理論尚在探索和形成中,我們應(yīng)加強類腦計算的基礎(chǔ)理論研究,以形成可“計算”的框架。僅僅研究人的思維活動或記錄腦中所有神經(jīng)元的發(fā)放是不可能研制出真正的智能機器。例如,對鳥的詳細(xì)研究不可能對如何制造飛機提供更多的啟示。機器的智能屬性只是在功能上和人的大腦等價,如飛機和鳥之間只是在功能上接近一樣。從這個意義來說,研究類腦計算并非去完整復(fù)制人的大腦,而是對人腦功能特性的模擬。
至今,關(guān)于大腦還有許多未解之謎,腦科學(xué)研究的每一項真正的突破都伴隨著艱難的歷程。當(dāng)前,我們需要更多時間來發(fā)現(xiàn)類腦計算真正的問題所在。要弄清楚類腦計算用來解決什么具體問題,把研究建立在嚴(yán)謹(jǐn)?shù)睦碚摗⒛P徒ㄔ臁嶒烌炞C和統(tǒng)計分析的基礎(chǔ)上,使我們對于復(fù)雜的、非線性的大腦功能有更深入的了解。
類腦計算的發(fā)展離不開腦科學(xué)、神經(jīng)科學(xué)、信息科學(xué)等學(xué)科的共同進步,我們必須加強來自多學(xué)科的實驗科學(xué)家和理論科學(xué)家的合作,類腦計算才有可能走上正確的方向。現(xiàn)代科學(xué)的進步往往是在新的思想和已有的成見之間精致平衡中實現(xiàn)的。對當(dāng)前類腦計算的熱潮,我們需要保持冷靜思考和踏實工作。期望值過高,又沒有達(dá)到預(yù)期的目標(biāo),有可能會給學(xué)科發(fā)展帶來的低潮甚至災(zāi)難性的后果,使最初的期望目標(biāo)成為“皇帝的新衣”。
參考文獻
[1] Waldrop M M. The chips are down for Moore's law [J]. Nature, 2016, 530(7589).
[2] Silver D, Huang A, Maddison C J, et al. Mastering the game of Go with deep neural networks and tree search [J]. Nature, 2016, 529(7587): 484-489.
[3] The Human Brain Project: A Report to the European Commission, 2013.
[4] BRAIN 2025 A Scientific Vision, 2014.
[5] Huang Z J, Luo L. NEUROSCIENCE. It takes the world to understand the brain.[J]. Science, 2015, 350.
[6] Thagard, Paul, Cognitive Science, The Stanford Encyclopedia of Philosophy.
[7] Krioukov D, Kitsak M, Sinkovits R S, et al. Network cosmology.[J]. Scientific Reports, 2012, 2(20):10272-10284.
[8] Liu X, Ramirez S, Pang P T, et al. Optogenetic stimulation of a hippocampal engram activates fear memory recall [J]. Nature, 2012, 484(7394):381-385.
[9] http://www.scientificamerican.com/report/world-changing-ideas-20151/
[10] Merolla P A, Arthur J V, Alvarez-Icaza R, et al. A million spiking-neuron integrated circuit with a scalable communication network and interface [J]. Science, 2014, 345(6197): 668-673.
[11] Markram H, Muller E, Ramaswamy S, et al. Reconstruction and Simulation of Neocortical Microcircuitry [J]. Cell, 2015, 163.
[12] Warren D E, Power J D, Joel B, et al. Network measures predict neuropsychological outcome after brain injury [J]. Proceedings of the National Academy of Sciences of the United States of America, 2014, 111(39): 14247-14252.
[13] Gilaie-Dotan S, Saygin A P, Lorenzi L J, et al. Ventral aspect of the visual form pathway is not critical for the perception of biological motion [J]. Proceedings of the National Academy of Sciences, 2015, 112(4): E361-E370.
[14] Braun U, Sch?fer A, Walter H, et al. Dynamic reconfiguration of frontal brain networks during executive cognition in humans [J]. Proceedings of the National Academy of Sciences, 2015, 112.
[15] Cole M W, Reynolds J R, Power J D, et al. Multi-task connectivity reveals flexible hubs for adaptive task control [J]. Nature Neuroscience, 2013, 16(9): 1348-1355.
[16] 李耀勇. 聯(lián)想記憶模型: Hopfield神經(jīng)網(wǎng)絡(luò)與動態(tài)神經(jīng)網(wǎng)絡(luò) [D]. 西安交通大學(xué), 1998.
[17] Peter T. Fox, Jack L. Lancaster. “Mapping context and content: The BrainMap model”, Nature Rev Neurosci, 2002, 3: 319-321.
[18] Lecun Y, Bengio Y. Convolutional networks for images, speech, and time series [J]. The Handbook of Brain Theory & Neural, 1997.
[19] YOSHUA BENGIO. A CONNECTIONIST APPROACH TO SPEECH RECOGNITION[J]. International Journal of Pattern Recognition & Artificial Intelligence, 2011, 07(04):647-667.
[20] Koch C, Poggio T,. Predicting the visual world: silence is golden [J]. Nature Neuroscience, 1999, 2(1): 9-10.
[21] 鄭南寧. 計算機視覺與模式識別[M]. 國防工業(yè)出版社, 1998.
[22] Wald G. HUMAN VISION AND THE SPECTRUM [J]. Science, 1945, 101(2635): 653-658.
[23] Liu T, Sun J, Zheng N N, et al. Learning to Detect a Salient Object [J]. Pattern Analysis & Machine Intelligence IEEE Transactions on, 2007, 33(2): 353 - 367.
[24] Sun J, Zheng N N, Shum H Y. Stereo matching using belief propagation [J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2003, 25(7): 787-800.
[25] http://www.msra.cn/zh-cn/news/features/imagenet-20151211.aspx
[26] Brenden M. Lake, Ruslan Salakhutdinov, Joshua B,Tnenbaum“Human-level concept learning through probabilistic program induction”, 4 December 2015, Science 350, 1332 (2015)
[27] David Daniel Cox.“Do we understand high-level vision?”, Current Opinion in Neurobiology, 2014, 25: 187-193.
[28] Hebb D O. The organization of behavior [J]. Journal of Applied Behavior Analysis, 1949, 25(3): 575-577.
[29] DiCarlo, James J., and David D. Cox. “Untangling invariant object recognition.” Trends in cognitive sciences 11.8 (2007): 333-341
[30] Thomas Naselaris, Kendrick N. Kay, Shinji Nishimoto. “Encoding and decoding in fMRI”, NeuroImage, 2011, 56(2): 400-410.
[31] Kendrick N. Kay, Thomas Naselaris, Ryan J. Prenger, Jack L. Gallant. “Identifying natural images from human brain activity”, Nature, 2008, 452 (7185): 352-355.
[32] Yoichi Miyawaki, Hajime Uchida, Okito Yamashita, Masa-aki Sato, Yusuke Morito, Hiroki C. Tanabe, Norihiro Sadato, and Yukiyasu Kamitani. “Visual Image Reconstruction from Human Brain Activity using a Combination of Multiscale Local Image Decoders”, Neuron, 2008, 60 (5): 915-929.
[33] Perez-Carrasco J A, Zhao B, Serrano C, et al. Mapping from Frame-Driven to Frame-Free Event-Driven Vision Systems by Low-Rate Rate Coding and Coincidence Processing-Application to Feedforward ConvNets [J]. Pattern Analysis & Machine Intelligence IEEE Transactions on, 2013, 35(11): 2706-2719.
[34] Ren P, Lis M, Cho M H, et al. HORNET: A Cycle-Level Multicore Simulator [J]. Computer-Aided Design of Integrated Circuits and Systems, IEEE Transactions on, 2012, 31(6): 890 - 903.
[35] http://news.mit.edu/2012/testing-future-chips-multicore-0309
[36] http://www.eetimes.com/document.asp?doc_id=1266538
[37] Esmaeilzadeh H, Blem E, St. Amant R, et al. Dark Silicon and the End of Multicore Scaling [J]. Micro, 2012, 39(3): 122-134.
[38] Pengju Ren, Michel A.Kinsy and Nanning Zheng “Fault-Aware Load-Balancing Routing for 2D-Mesh and Torus On-Chip Network Topologies” IEEE Transactions on Computers, 2016, 65(3): 873-887.
[39] Pengju Ren, Xiaowei Ren, Sudhanshu Sane, Michel A. Kinsy and Nanning Zheng “A Deadlock-Free and Connectivity-Guaranteed Methodology for Achieving Fault-tolerance in On-chip Networks” IEEE transactions on Computers, 2016, 65(2): 353-366.
作者簡介
鄭南寧 西安交通大學(xué)人工智能與機器人研究所教授、工程院院士、IEEE fellow。研究興趣有計算機視覺與模式識別、認(rèn)知計算與機器智能等。
任鵬舉 西安交通大學(xué)人工智能與機器人研究所副教授,主要研究方向為機器學(xué)習(xí)的新型計算架構(gòu)和神經(jīng)形態(tài)計算等。
陳霸東 西安交通大學(xué)人工智能與機器人研究所教授,IEEE Senior Member。研究興趣有信號處理、信息論、機器學(xué)習(xí),及其在認(rèn)知科學(xué)與工程領(lǐng)域的應(yīng)用。
吳昊 西安交通大學(xué)人工智能與機器人研究所在讀博士。研究方向為視覺認(rèn)知中的神經(jīng)編解碼、信號處理等。