這個被微軟高看的中國AI研究院,是何方神圣?
上周,微軟總裁在接受采訪時,cue到了一家中國機(jī)構(gòu):
(資料圖片僅供參考)
我們認(rèn)為有三家公司處于絕對的前沿,一是與微軟合作的Open AI,二是谷歌,三是北京智源人工智能研究院(Beijing Academy of Artificial Intelligence,BAAI)。
谷歌自然不難理解,但說到智源研究院,大部分圈外人可能都要懵一會。
這是哪家機(jī)構(gòu),怎么之前好像沒聽說過?
事實上,這家機(jī)構(gòu)確實很年輕——2018年創(chuàng)建,誕生至今也不過五年。
但它做的事情可不小。
2021年,智源推出了中國首個+世界最大超大規(guī)模預(yù)訓(xùn)練模型【悟道2.0】,參數(shù)量達(dá)到了驚人的1.75萬億,這是GPT-3.5的十倍,也超越了谷歌的超大模型 Switch Transformers(1.6萬億)。
在國際公認(rèn)的9項的機(jī)器學(xué)習(xí)任務(wù)“跑分”項目上,【悟道2.0】都取得了優(yōu)異成績,超過了 GPT-3、Google ALIGN 等領(lǐng)域內(nèi)同類技術(shù)。
此外,悟道2.0本身的訓(xùn)練過程,也獲得了中國超級計算機(jī)項目的幫助。事實上,它也是中國團(tuán)隊首次在100%國產(chǎn)的超級計算機(jī)上訓(xùn)練出來的深度神經(jīng)網(wǎng)絡(luò)模型。
而國外媒體也對其表示了密切關(guān)注。
除了大模型,智源研究院還推出了“天演”生命智能模型、“九鼎”智算平臺、“FlagOpen飛智大模型”,推動我國人工智能行業(yè)從基礎(chǔ)設(shè)施到跨學(xué)科應(yīng)用的層層進(jìn)步。
2022年5月,智源天演團(tuán)隊發(fā)布天寶1.0,即生物精度最高的仿真秀麗線蟲,能夠高精度模擬秀麗線蟲全部302個神經(jīng)元及連接關(guān)系,邁出天演人工智能生命模擬工程的第一步。
同日,智源推出的大型云計算服務(wù)平臺“九鼎智算平臺”,圍繞通用大模型、AI for Science等方向,為大模型訓(xùn)練提供算力、數(shù)據(jù)、算法三方面的創(chuàng)新支持。
今年3月推出的“飛智”大模型技術(shù)開源體系,則是智源與多家產(chǎn)學(xué)研單位共同構(gòu)建的大模型開源開放軟件體系,包含算法、模型、工具、評測等多個部分,能夠顯著降低大模型開發(fā)的難度。
盡管成立時間短,但智源已在業(yè)內(nèi)聲名赫赫:一年一度的智源大會,已成為業(yè)內(nèi)的每年的重要活動之一。
這些都暗示著,在大多數(shù)人都未曾注意到的時候,中國的人工智能技術(shù),正悄悄走到了世界前列。
起源
智源研究院的起源,是一場“群英薈萃”(不是蘿卜開會)。
2018年年初,北京市出臺《北京市支持建設(shè)世界一流新型研發(fā)機(jī)構(gòu)實施辦法》,進(jìn)行科技體制的飛躍式改革。
同年,北京為建設(shè)懷柔科學(xué)城,聘請了清華大學(xué)藥學(xué)院教授魯白、原國家自然科學(xué)基金委員會主任楊衛(wèi)院士、美國國家科學(xué)院院士楊培東、原微軟亞太研發(fā)集團(tuán)首席技術(shù)官張宏江博士等四位專家擔(dān)任戰(zhàn)略專家。
在那年的一場研討會上,專家們圍繞“如何推動北京人工智能創(chuàng)新工作發(fā)展”提出了六項建議:
建設(shè)“北京智源”等人工智能軟硬件計算平臺建立“產(chǎn)學(xué)研用”聯(lián)合創(chuàng)新的人工智能基礎(chǔ)研究模式積極推動政府?dāng)?shù)據(jù)和企業(yè)數(shù)據(jù)開放共享開放人工智能應(yīng)用場景和加大基礎(chǔ)保障加大人才培養(yǎng)、引進(jìn)和完善保障措施加大國際交流力度
于是,2018年12月,在科技部和北京市委市政府的指導(dǎo)和支持下,北京智源人工智能研究院正式成立。
資料顯示,智源人工智能研究院依托了北京大學(xué)、清華大學(xué)、中國科學(xué)院、百度、小米、字節(jié)跳動、美團(tuán)點(diǎn)評、曠視科技等北京人工智能領(lǐng)域優(yōu)勢單位共建,實行理事會領(lǐng)導(dǎo)下的院長負(fù)責(zé)制,張宏江擔(dān)任理事長,北京大學(xué)信息科學(xué)技術(shù)學(xué)院教授黃鐵軍擔(dān)任智源研究院院長。
智源研究院的員工匯集了來企業(yè)、學(xué)術(shù)等不同背景的專家,集合了一支包括清華、人大、北大等知名學(xué)府不同專業(yè)方向的團(tuán)隊,也有各合作企業(yè)的員工進(jìn)駐。
對于人才,智源通常給予四類定位:首席科學(xué)家、研究項目經(jīng)理、研究員,和青年科學(xué)家。在每一個研究不同技術(shù)方向的子團(tuán)隊當(dāng)中,都有不同資深程度、專業(yè)和技能方向、供職背景的成員,員工構(gòu)成非常多元化。
2019年,智源推出了“智源學(xué)者計劃”。截至2021年,已遴選智源學(xué)者近百人,其中38歲以下的青年科學(xué)家就有40位。
主要涉及的研究方向包括人工智能的數(shù)理基礎(chǔ)、人工智能的認(rèn)知神經(jīng)基礎(chǔ)、機(jī)器學(xué)習(xí)、自然語言處理、智能信息檢索與挖掘、智能系統(tǒng)架構(gòu)與芯片等。
可以說,智源研究院匯聚了中國AI圈內(nèi)的頂尖人才,“集中力量辦大事”,誓要將北京在2028年建設(shè)為國際領(lǐng)先的人工智能創(chuàng)新中心。
自由探索+目標(biāo)導(dǎo)向
智源人工智能研究院的定位是“新型研發(fā)機(jī)構(gòu)”,但在這一領(lǐng)域上,如何規(guī)范、高效地運(yùn)作,國內(nèi)始終未有成熟且成功的樣板參考。
通過摸索,智源提出了一套“智源模式”:
即建立自由探索與目標(biāo)導(dǎo)向相結(jié)合的科研管理機(jī)制,以小同行視角遴選支持智源學(xué)者自由探索,以“集中力量辦大事”的科研組織模式推動“悟道”大模型等重大科研任務(wù)的實施。
所謂“自由探索”,指智源研究院能夠賦予科學(xué)家最大的技術(shù)路線決定權(quán)和經(jīng)費(fèi)使用權(quán),給予科學(xué)家盡可能大的研究自由度。
而“目標(biāo)導(dǎo)向”,就是對于學(xué)界共識的方向,智源學(xué)者們的研究能夠聚焦在一個統(tǒng)一的愿景上,并自然錯開研究方向,頻繁相互交流反饋,形成來自組織的合力。
在這一體制的滋養(yǎng)下,智源研究院實現(xiàn)的科研成果斐然。
根據(jù)2021年智源研究院三周年時公布的數(shù)據(jù),智源研究院發(fā)表或支持發(fā)表國際AI頂會頂刊論文1470余篇,其中,被AAAI、CVPR、ACL、ICLR、NIPS、SIGIR、TPAMI等國際頂級會議期刊收錄論文約1060篇,占比逾七成,形成多個國際首創(chuàng)、首發(fā)重大成果。
科學(xué)研究的探索之路往往曲折而漫長,作為學(xué)者的后盾,研究機(jī)構(gòu)需要給予自由度,以鼓勵創(chuàng)新和促進(jìn)進(jìn)步,但同時也需要進(jìn)行一定的引導(dǎo),避免“迷失方向”。
正如智源研究院理事長張宏江在為圖靈獎獲得者Yann LeCun的自傳《科學(xué)之路》作序時所寫:
風(fēng)險提示及免責(zé)條款 市場有風(fēng)險,投資需謹(jǐn)慎。本文不構(gòu)成個人投資建議,也未考慮到個別用戶特殊的投資目標(biāo)、財務(wù)狀況或需要。用戶應(yīng)考慮本文中的任何意見、觀點(diǎn)或結(jié)論是否符合其特定狀況。據(jù)此投資,責(zé)任自負(fù)。歷史上多數(shù)突破性研究成果的出現(xiàn)都是偶然事件,而研究機(jī)構(gòu)所有努力都是為了提升這類偶然事件發(fā)生的概率。
智源要做的就是希望通過構(gòu)筑協(xié)作社區(qū),打造用于未來研究的計算和數(shù)據(jù)平臺,更重要地是,集結(jié)最優(yōu)秀的同行,專注未來可能產(chǎn)生原始創(chuàng)新與長期影響的領(lǐng)域(包括過往投入不足、重視不夠的領(lǐng)域)等一系列機(jī)制和努力,讓創(chuàng)新系統(tǒng)更高效地運(yùn)行,通過我們的努力能讓中國出現(xiàn)突破性成果的概率增加。
關(guān)鍵詞: