鄭南寧:面對人工智能挑戰,人才培養的下一步該如何走
發布時間:2020-06-22 13:01:09
新一代人工智能的發展需要腦科學、神經科學、認知心理學、信息科學等相關學科的實驗科學家和理論科學家的共同努力,尋找人工智能的突破點,同時必須要以嚴謹的態度進行科學研究,讓人工智能學科走在正確、健康的發展道路上。
01 人工智能是一門什么樣的學科
在我們的星球上,生命誕生至今已有40 億年,所有的生命是按照有機化學的規則改變或者進化,但是今天,由于人工智能出現,改變了這一規則。也就是說,我們今后有可能出現有機生命(就是我們人類)和人工智能共同構造的無機智慧型的生命形式并存,生命可以根據計算機智能設計,超越原先有機化合物的限制。這就給人類社會帶來了巨大變革。
人工智能作為一門學科獨立存在,到今天已經歷經60 余年了。我們從學術發展基本規律來看,已經經歷了三個階段,我們現在正在走向第四個階段。從這四個階段來看,最開始是20 世紀 60 年代到 80 年代,人工智能的一些主要研究是如何構建面向應用領域的專家系統,讓機器掌握人類的一些知識、規則,在一定程度上替代人類思維或者完成任務。
20 世紀 80 年代到 2000 年左右,由于神經網絡的出現以及計算能力的提升,我們開始想到讓機器幫助我們提取特征,或者說我們將特征、答案交給機器,讓機器學習。進入2000 年以后,由于互聯網的出現與普及,大數據的獲取變得很容易,我們將原始數據和答案交給機器進行深度學習,在語音、圖像等分類任務方面,機器的能力已經超過了人類。那么人工智能發展的下一個階段是什么?我想應該是人類將目標交給機器,讓機器去完成。
也就是說它不是簡單的一種感知或數據的計算,我們給它一個模型,它只是按照模型做;而是我們把任務的目標交給機器,機器去完成,并讓機器具有“學習的學習”能力,像人一樣去思考和學習。這是我們人工智能研究領域追求的一個理想目標。
在60 余年人工智能發展過程中,學術上形成了各種技術流派。這里簡單提一下較為主要的五個流派。符號主義不用多說,是形式化的,使用符號、規則和邏輯來表征知識和進行邏輯推理,其基本觀點是認知即計算。之后又出現仿生學派(又稱為連接主義),20 世紀 40 年代提出的單層感知模型,就是基于這樣的思想技術, 這個流派的基本觀點是認知就是網絡。還有行為主義學派,主要基于“感知—行動”的行為智能模擬方法,或者說在行為中反饋,我們知道作為能夠適應環境的系統而言,是需要有反饋的,反饋控制、遺傳算法、蟻群算法、強化學習等屬于這一類學派。還有貝葉斯方法,這也屬于人工智能方法中的一大類,通過獲取發生的可能性來進行概率推理,形成對不確定事件的描述。最后一類稱之為類推學派,這類方法是采用SVM,支持向量機,根據約束條件來優化函數。以上五大流派能解決我們所有的問題嗎?顯然有其局限性。先看符號化人工智能的局限性,符號化人工智能首先要對問題本身抽象出一個數學精確意義上的模型,給出這個模型以后,我們還要給出一個確定的算法。顯而易見,算法確定后,我們就沒有辦法去應對在我們建模的時候沒有考慮到的問題,也沒有辦法去描述現實世界問題所固有的不完備性或測不準性。還有一點,圖靈意義下的可計算問題都是可遞歸的,可遞歸意味著問題的描述是有序的。以上是我們稱之為傳統的人工智能或者說符號化人工智能時代的局限性,因為按照計算就是認知,它實際上把所有問題歸結為一種形式化描述,或者我們換一種說法來講,只要能夠進行形式化描述,這個問題就可以得到解決。我們再來看深度神經網絡的局限性,深度神經網絡需要通過大量的標注數據來訓練,過度依賴訓練數據在一定程度上約束了網絡的泛化能力。還有一點,當我們要構建一個擁有非常強大算力的深度神經網絡,能夠達到我們人類能力幾乎不可能的分類,但是它缺乏人類認知的核心——推理——對事實的因果關聯的表達能力,因此最近幾年里,很多研究者致力于把符號規則引入深度神經網絡,使其能夠根據知識來建立對數據的因果關聯。以上是從模型的意義上談的,但是實際上從計算角度來看,我們還無法在這種架構下實現有效的注意力機制,進行高效的圖像檢索?,F實世界中我們有很多問題需要基于一種事件的描述或者是通過事件的驅動來求解。因此,在處理的算法層面上我們希望有一種新的模型。例如,在計算過程中,如何把任務分成子任務或者在計算的過程當中使用一個注意力機制來表征數據或分配計算負載。注意力不僅僅是“看”,同時在導引計算的過程,它的路徑就是通過引入注意力的機制來提高計算的效能。
在現實生活中,我們所面對的許多問題具有不確定性、脆弱性、開放性,比如無人駕駛,就是這樣一種非常典型的任務。今天的人工智能是建立在形式化和演繹邏輯基礎上的,而我們為所有對象建立模型顯然是不可能的。這個不可能來源于我們不可能枚舉出一個行為所有的先決條件,也就是說我們不可能對一個問題具體描述出所有的邊界條件。另外,也不可能枚舉出一個行為的所有隱性結果,或者說我們要進行預測時,不可能在一個沒有辦法完全建模的情況下,讓系統給出正確的解。
因此,我們要研究或者發展一種受腦認知和神經科學啟發的人工智能,這是非常有意義的研究方向,也是我們未來人工智能的發展方向。受腦認知和神經科學啟發的人工智能,目標是實現具有泛化能力的人類認知信息加工機制。從2016年開始,中國工程院對新一代人工智能做了非常深入的戰略研究和討論,明確了人機混合智能是人工智能未來的發展方向。我們按照這樣一個思路,在AI2.0 中把人機協同混合增強智能作為AI2.0 中非常重要的方向,而且它的重要性不僅僅是概念上的,它能夠將多個學科交叉匯聚在一起,形成中國對人工智能未來發展作出重要貢獻的一個方向。
02 未來人工智能的形態是什么
前面說得很清楚,無論機器的智能發展到什么程度,它總是需要人類來使用。人是智能機器的服務對象和最終“價值判斷”的仲裁者,因此,人類對機器的干預是貫穿始終的。所以人機協同的這樣一種混合智能必然會出現,它是人工智能或機器智能今后發展一種可行的、重要的成長模式。
2018 年年初在美國新奧爾良召開了美國人工智能協會(AAAI)會議,大會主席做了一個大會報告,題為“Challenge of human aware AIsystems”,這個報告指出面對擁有人類意識的人工智能系統發展,我們人類面臨著什么樣的挑戰。他提出,長期以來很多學者一直在研究人工智能是替代人類勞動還是增強人類勞動,這個問題現在基本明確是在增強人類勞動,因此現在人工智能系統需要與人類更好地協同工作,要設計出具有人類意識的AI系統,要構建人在回路中“心智”狀態模型。這一觀點與我們在 2016 年提出的觀點可以說是不謀而合。
人機協同發展這樣一種新一代人工智能要回答兩大基本問題:第一,什么是人類智力所獨有的特征;第二,要做到像人類一樣擁有智能,計算機需要什么能力。當然我們也經常講,人類經常只用較少的數據,就能夠在廣泛問題上表現出智能的行為,其實我們的大腦在進化過程中已經經過了大數據的訓練,只是這個訓練時間比深度網絡大得多,周期非常長。但是,通過計算可以把人類在某個領域長周期的訓練在短短幾個小時內完成,這就是機器的威力。機器具有可重復性,可以完成規范性的任務,同時因為現在的機器是以形式化語言來描述的,所以具有邏輯性;而人,具有想象和創造的能力,這是人類作為高級生物所獨有的特征,正是由于想象和創造,使得大腦處于動態,想象與創造再加上動態就構造了一個非常復雜的系統。現在的問題是,我們應該用何種方式來描述大腦跟外界的交互。因為從計算的角度而言,首先我們要定義這個問題是可計算的,然后在可計算的基礎上給出計算的復雜度,如果計算復雜度是機器難以承受的,那么這個問題實際上是得不到求解或者得不到應用的。因此我們探討人機協同的混合系統,首先要看看模型怎么構造,然后在這個基礎上,用什么樣的物理形式來實現這個模型的計算。
談到可計算,我們還需要弄清楚大腦的工作機理。大腦是一種具有涌現性的復雜自組織巨系統,它擁有約860億個神經元,每個神經元有數千個突觸,神經元之間通過突觸連接,構成了自然界一個極為復雜的網絡。大腦的工作依賴于突觸之間信息的傳遞,神經遞質擔當了突觸傳遞中的“信使”。
實際上人的學習發生在突觸的間隙之中。我們知道有抑制性的神經遞質也有興奮性的,多巴胺是興奮性的,而 γ- 氨基丁酸、去甲腎上腺素是抑制性的。我們現在把神經元看成一個物理計算過程,實際上人的大腦中突觸之間的變化是一個極其復雜的電化學過程,因此在計算模型的構建上,我們不僅需要模型具有認知計算的機理,也需要模型滿足神經生物學的保真度?,F在的深度網絡能夠給出一個函數的優化擬合,大腦實際上不是通過統一的、沒有分化的神經網絡來實現單一的全局優化,而是通過各個獨特且相互作用的子系統來實現認知。
從研究角度來看,從以上的討論我們能夠提出什么樣的科學問題?其實進行大的研究項目,首先是要凝練科學問題。這里所討論的科學問題我們可以這樣看:第一,大腦是如何實現優化的?在計算的層面如何實現這樣的優化?第二,腦網絡監督訓練信號從哪里來?它們體現不同任務的成本函數?另外,在不同神經功能連接區域中,存在什么樣的有效連接來約束和優化與任務相關的成本函數,以有效尋找特定問題的解決方法。(大腦存在三種連接:結構連接、功能連接、有效連接。所謂“有效連接”,是指在執行任務中,在功能連接區神經元的連接是抑制還是興奮的變化。)
前面我們談到了神經生物學,從腦的神經網絡結構來看,腦網絡連接的變化表現為人的認知行為。人類理解或描述物理世界時,大腦總會形成一種對時間的“可視化”圖像,能夠抽象出概念,形成常識。常識往往是我們日常生活當中判斷事物的一種出發點或者衡量標準。因此現在我們需要思考怎么能夠在一個人工智能系統中引入常識,把符號規則引入一個神經計算之中。我們在日常生活當中大量使用常識,但我們現在還沒有邁進怎么使機器具有常識這樣一個門檻里面。近年來直覺推理的研究已經開始有一些算法出現了,包括AlphaGo實際上就是一種直覺推理。使用代價空間、決策樹、認知地圖、模型匹配迭代,我們就可以給出一種直覺推理的簡單的機器實現。直覺推理從數學解析空間來看,是人能夠在復雜問題的解空間當中尋找全局的最優解,我們稱之為最好的“猜”。
前面談到了直覺推理,下面簡單說一下認知推理。認知推理可分為物理層面的認知推理和心理層面的認知推理。物理層面的認知推理可以使我們能夠跨越時間與空間追蹤事物的發展軌跡;心理層面的認知推理是學習方向受到心理狀態的引導。認識推理對事物或者數據的因果關聯分析,這是人工智能研究面臨的一大挑戰。因果模型既要滿足認知任務中的物理因果關系產生的物理約束,又要滿足以機器為“本我”,理解在當前認知任務下設計的因果關聯。
直覺推理、認知推理乃至因果關聯分析,這三者怎么構建一個可計算的智能機器?使機器像人一樣對物理世界直觀理解。實現物理層面的推理主要有三個基本要素,首先對物體或對象的特征進行識別,并形成記憶,然后給出物體之間相互關系與作用的直觀理解,就是建立相關和因果關聯。這兩者完成以后,我們需要預測怎么能在一個不完整模型下,給出一個適合當前約束和先決條件的合理行為,這就要構造一個基于想象力的行為模型。這樣一種計算框架可以應用于無人駕駛和自主停車等多種場景。
當前我們正在研究怎樣把視覺深層神經網絡模型和語義學的吸引子網絡模型相結合,使得網絡能夠同時實現物理外觀的識別和物體屬性的語義理解。這個研究方向很有意義,包括自然語言理解,可以使視覺屬性與更抽象的語義信息相互作用。前面已談到,我們構造模型既要有生物的保真性,同時也要有認知的保真性。歐洲的藍腦計劃在生物保真性方面做得很好,但是缺乏在認知層面上的可解釋性。我們需要把對認知計算的研究以及以數據驅動的生物計算模型結合起來,這是人工智能未來的新方法。
人工智能未來面臨著諸多問題與挑戰,這也是與我們后面課程的設計密切關聯的。特別是讓機器在沒有人類教師的幫助下學習,讓機器像人類一樣感知和理解世界,使機器具有自我意識、情感以及反思自身處境的能力;還有今后服務機器人進入家庭并具有一定的情感,等等。我們要應對人工智能帶來的深刻的社會問題。
03 人工智能給教育和學習帶來什么樣的變化
人工智能可以使教育成為一個可追溯、可視化和可計算的過程,這是混合智能的一個重要應用。教育要追求個性化,這是大勢所趨。人工智能技術會滲透到高等教育的各個層面,根據學生的知識結構、智力、知識掌握程度,對學生進行個性化的教學和輔導,這不是學生也不是教育工作者可以阻擋的一個趨勢。學生與在線學習系統的交互,是一個動態的建構過程,可以根據不同學習者的能力和反應給出不同的學習規劃,也可以給出學習空間。學生是個性化、群體性、社會性和交互性的集合,
四個特性構成了教育情境的基本要素。人工智能能夠將其變成一個可回溯的多層次行為建模,給出個人成長、知識掌握、教育資源優化配置的一些因果關聯。人工智能不僅僅實現個性化教育,實際上對我們提高高等教育質量以及迎接新的社會變革到來,發揮著不可替代的作用。所以人工智能賦能教育不是簡單地把學生數據收集起來,而是要改變當前的傳統教育模式與人才培養體系,但現在大學里,一些教師上課依然是20多年前的模式,顯然是和我們當前的追求目標不一致的。
04 人工智能人才培養如何應對國家重大戰略需求
什么是國家重大戰略需求?我們在面對這個問題的時候,應當思考怎么能夠提升我國在人工智能領域的競爭力,怎么能夠形成在未來的人工智能領域的競爭優勢。就技術發展而言,人工智能可以走向很遠,但是我們無法確定人工智能最終是否具有人類敏感性的天賦。人工智能可以完成人類賦予它幾乎所有的任務,甚至超過人類,但靈魂和精神總是來自人類。人工智能只能是人類的偉大助手。
人工智能是一種“贏者通吃”的技術,這意味著獲得優勢的國家將會長期享有優勢。目前我國在人工智能領域與國際最先進水平仍有相當大的差距,主要集中在芯片、工具和平臺等方面。芯片、工具和平臺的背后,需要新的模型、新的算法作為支撐,這顯然對人才培養提出了新的挑戰。中國是人口大國,人工智能13為我們帶來了豐富的數據,這些數據只要用好就會形成我們的優勢。2017年 7 月,我國發布了《新一代人工智能發展規劃》,因此我們要在國家重大發展規劃的引導下,根據本校的優勢和特點建立人才培養的體系,并通過國內人工智能領域學者的通力合作,形成更大的共同研究和人才培養的平臺。
大家知道,對于一個計算模型而言,當算力確定了,不斷提升模型復雜度,或者說提升算法的密度,整體性能是提高不了的,這就是受算力所約束,所以從計算機角度而言需要研究怎么提供更強大的算力;但是從算法角度而言,我們怎么能夠通過模型改造降低算法密度,依然達到約束條件下最優的結合點,這就是算法的威力。我們人工智能在許多場合要用新的模型、新的算法,來發揮智能的效果,這也是我們人工智能人才培養需要高度重視的領域。
05 人工智能人才培養的課程體系
早在 1986 年西安交通大學就設立了人工智能與機器人研究所,研究所是“視覺信息處理與應用國家工程實驗室”的支撐單位,擁有“模式識別與智能系統”國家重點學科,每年在讀碩士、博士研究生約 170 人,是西安交通大學培養高層次人才的重要基地,經過 33 年的發展,可以說西交大的人工智能研究和高端人才培養走在了全國前列。
2017 年開始,西交大制訂了人工智能拔尖學生培養計劃。在這個人才培養方案中我特別加了一句——培養一流的工程師,因為人工智能本身是一種技術和工程,當然我們的工程師不是作坊里的,我們要培養具有科學家素養的一流工程師。我們培養的宗旨就是為學生今后成為人工智能領域的一流工程師、科學家和企業家奠定知識和創新能力的基礎。
2018 年秋季,我校的人工智能試驗班開始正式招生。其中高考招生選拔20人,校內新生選拔 25 人,少年班選拔 10 人,共計招生 55 人。實驗班采用動態進出的管理機制,保證人才培養質量。
在課程設置方面,我們經過一年的充分和深入研討,設計了人工智能人才培養課程體系,涵蓋八大課程群,分別是:人工智能核心課程群、計算機科學核心課程群、數學與統計課程群、認知與神經科學課程群、人工智能平臺與工具課程群、人工智能倫理課程群、先進機器人學課程群、科學和工程課程群。每個課程群由一名教授擔任群長,由群長組織課程群的任課教師研討教學。我們把過去行之有效的教學組、教研室的作用充分發揮出來,邀請校內外相關學科優秀教師參與人工智能人才培養工作。
在人工智能核心課程群中,設置有“人工智能的現代方法 I”和“人工智能的現代方法II”兩門大課,“人工智能的現代方法 I”課程包括問題表達與求解,“人工智能的現代方法II”課程包括機器學習、自然語言處理、計算機視覺等。認知與神經科學課程群,包括“認知心理學”和“神經科學基礎”,“人類的記憶與學習”“語言與思維”以及“計算神經工程”等課程。先進機器人學課程群,包括“先進機器人控制”“認知機器人”“機器人規劃與學習”“仿生機器人”等課程。人工智能倫理課程群,包括“人工智能、社會與人文”和“人工智能哲學基礎與倫理”等課程。
前文談到了平臺和芯片的重要性。所以,在這些課程中,結合我校的特點,特別是人工智能與機器人研究所30多年來在這方面的研究,開設了人工智能平臺與工具課程群,包括“群體智能與自主系統”“無人駕駛技術與系統實現”“游戲設計與開發”“計算機圖形學”“虛擬現實與增強現實”等一批特色課程,部分課程還邀請企業參與設計與教學。因為人工智能很多新的算法需要在交互游戲中得到驗證,人工智能很多方法也可以運用于游戲之中,所以我們在人工智能平臺與工具課程群里設置了“游戲設計與開發”課程,是 2 學分選修課。
同時,我們積極拓展辦學資源,加強與人工智能領域領軍企業合作,深化產教融合、校企協同育人,并通過國際合作辦學、國際一流學者講學、組織高水平國際會議、資助學生國際交流學習等,建立高層次、立體化的高端國際合作培養體系,形成國際化培養氛圍,培養具有國際化視野和國際競爭力的一流學生。
新一代人工智能的發展需要腦科學、神經科學、認知心理學、信息科學等相關學科的實驗科學家和理論科學家的共同努力,尋找人工智能的突破點,同時必須要以嚴謹的態度進行科學研究,讓人工智能學科走在正確、健康的發展道路上。作為教育工作者,我體會到教育是一種緩慢而優雅的過程。我們需要定下心,穩住神,堅持立德樹人,才能提高教育的質量,走出一條各個高校都具有自己特色的人才培養之路。我們不能搞成千校一面,即便我前面講到我們設置的這些課程,對其他高校而言或許是不合適的,因為每一所學校的學科發展都有自己的歷史底蘊和教師專長,所以需要把歷史底蘊、教師專長和科研特點整合起來,我們就能設置出非常好的適合因材施教的課程體系。另外,支持“好奇心驅動的研究”,支持“相信且追尋自身直覺的科學家”,是一個成功的創新生態系統的必備要素,也是回答“錢學森之問”的關鍵條件。我們有責任為社會作出我們自己的貢獻!
來源:德先生