從智源走出去的人才，最后成立初創(chuàng)公司的大概有20個(gè)。不過，智源的定位是國際頂尖AI研究機(jī)構(gòu)，創(chuàng)業(yè)是副產(chǎn)品，如果一開始是沖著創(chuàng)業(yè)和孵化的目的發(fā)展，我們的性質(zhì)就發(fā)生了變化。

開欄語

當(dāng)人工智能的浪潮席卷全球，北京正以科技創(chuàng)新之姿，成為AI大模型領(lǐng)域的戰(zhàn)略高地。從智源的“悟道”大模型問世，到“天使投資人”模式孵化原創(chuàng)成果，再到月之暗面、智譜等人工智能獨(dú)角獸崛起，這座城市不僅匯聚了前沿技術(shù)，更以開放生態(tài)孕育突破性成果。

如今，北京正積極打造“全球開源之都”，一大批研發(fā)機(jī)構(gòu)、企業(yè)積極擁抱開源，而開源也已深入到汽車、機(jī)器人等眾多行業(yè)。發(fā)展AI將是一場科技長征，在北京市科委、中關(guān)村管委會(huì)的支持下，新京報(bào)AI研究院推出“AI浪潮錄”系列專欄，深度訪談此次AI浪潮的親歷者與見證人，講述AI競爭新格局與背后的故事。

北京智源人工智能研究院理事長黃鐵軍。受訪者供圖

成府路150號(hào)，是一棟現(xiàn)代與歷史巧妙融合的7層建筑，紅磚幕墻外觀富有濃濃的學(xué)院氣息，屋頂花園和大玻璃窗設(shè)計(jì)則讓建筑更有科技范兒。這里曾是一座破舊廠樓，經(jīng)過設(shè)計(jì)師巧妙改造，現(xiàn)如今成了中國AI發(fā)展的策源地之一。

坐落于此的北京智源人工智能研究院（下稱“智源”）緊鄰清華大學(xué)，并與北京大學(xué)相望，天然資源優(yōu)勢催化下智源悄然成了中國大模型的“黃埔軍?！保浩吣陼r(shí)間，孵化了約20家AI創(chuàng)業(yè)公司。智譜唐杰、月之暗面楊植麟、面壁劉知遠(yuǎn)……不少知名AI公司的創(chuàng)始人都曾在智源從事研究。

北京智源人工智能研究院理事長黃鐵軍經(jīng)常騎車往返于北大和智源之間，從1995年開始從事人工智能研究，他親歷了近30年AI發(fā)展的技術(shù)浪潮。2018年11月，擔(dān)任北京大學(xué)計(jì)算機(jī)系主任的黃鐵軍參與創(chuàng)立了北京智源人工智能研究院并擔(dān)任首任院長，28個(gè)月后，智源發(fā)布了超大規(guī)模信息智能模型“悟道1.0”，填補(bǔ)了中國大模型的空缺。

黃鐵軍當(dāng)時(shí)表示，人工智能發(fā)展已經(jīng)從“大煉模型”逐步邁向了“煉大模型”，這也是“大模型”一詞首次在中文互聯(lián)網(wǎng)上被人所熟知。當(dāng)ChatGPT出現(xiàn)并引發(fā)大模型熱潮時(shí)，智源作為新型研發(fā)機(jī)構(gòu)已經(jīng)在前沿領(lǐng)域默默耕耘了四年。

黃鐵軍在接受新京報(bào)AI研究院專訪時(shí)表示，科學(xué)與技術(shù)不同，前者需要天才的靈感達(dá)成原始創(chuàng)新，后者則更需要物質(zhì)條件的支持與反復(fù)試錯(cuò)。而智源的任務(wù)是完成“從0到1”的創(chuàng)新，“做大學(xué)做不了，企業(yè)不愿做的”。他把智源定位為AI人才在北京發(fā)展的“第一站”，瞄準(zhǔn)成為國際頂尖的AI機(jī)構(gòu)。“如果思想上不引領(lǐng)，只做別人做過的東西，誰會(huì)承認(rèn)北京是國際科技創(chuàng)新中心？讓科技中心轉(zhuǎn)移到中國，人才密度大的北京責(zé)無旁貸?！?/p>

迭代·大模型是技術(shù)不是一門科學(xué)

新京報(bào)AI研究院：作為研究人工智能多年的專家，如何看待AI大語言模型技術(shù)在近些年的迅猛發(fā)展？

黃鐵軍：首先我必須強(qiáng)調(diào)，人工智能大語言模型是一項(xiàng)技術(shù)，并不是一門科學(xué)。

科學(xué)要研究出原理、公式，而技術(shù)需要依靠不斷嘗試探索、優(yōu)化改進(jìn)；科學(xué)的基本原理靠個(gè)人也可以突破，比如牛頓和愛因斯坦，但技術(shù)實(shí)現(xiàn)必須有方案方法和路線工藝；科學(xué)要回答“為什么”的問題，而技術(shù)解決“怎么做”的問題。舉例來說，指南針就是一項(xiàng)技術(shù)發(fā)明，但要明白指南針的原理，需要理解地球磁場的概念。

回到人工智能也是一樣，我們有技術(shù)能力做出大模型、做出智能系統(tǒng)，但大模型為什么表現(xiàn)得如此優(yōu)秀？沒有任何科學(xué)家解釋得了。大模型作為人類最新的技術(shù)進(jìn)展，正變得越來越智能、成本越來越低，這是技術(shù)和工藝不斷改進(jìn)的結(jié)果。

從2018年到2022年，大模型實(shí)現(xiàn)了一個(gè)又一個(gè)版本的迭代，智能逐漸增強(qiáng)，這是技術(shù)角度上的進(jìn)步。OpenAI和智源所做的都是“從1到10”，但大模型的“從0到1”，則要追溯到Y(jié)oshua Bengio（約書亞·本吉奧）在2000年和2003年發(fā)表關(guān)于使用神經(jīng)網(wǎng)絡(luò)預(yù)測下一個(gè)token（詞元）以訓(xùn)練模型的文章，那時(shí)模型規(guī)模不夠大、算力有限、數(shù)據(jù)不足，所以智能不顯著，一直沒引起太多的關(guān)注。

2018年之后，上述幾項(xiàng)條件逐漸成熟，因此有團(tuán)隊(duì)顯化了智能，就像發(fā)明了指南針。到2022年和2023年，我們已經(jīng)基本可以判斷大模型“有智能”，雖然有時(shí)它仍然存在幻覺，但大多數(shù)時(shí)候還“挺像那么回事”，目前我們就處在這樣的階段。

新京報(bào)AI研究院：“從0到1”的創(chuàng)新需要什么條件，當(dāng)前DeepSeek等國內(nèi)大模型公司在進(jìn)行怎樣的創(chuàng)新？

黃鐵軍：包括DeepSeek在內(nèi)的許多大模型公司所做的工作，實(shí)際上更多的是“從10到100”，即讓大模型智能更強(qiáng)、成本更低。由于不存在確定路徑，工藝積累只能通過不斷試錯(cuò)進(jìn)行，許多企業(yè)遇到的“卡脖子”技術(shù)大多屬于這一類。DeepSeek擁有很多算力，這就給了它試錯(cuò)所必需的物質(zhì)條件，雖然DeepSeek公布的模型訓(xùn)練成本很低，但如果加上試錯(cuò)成本，其投入也不會(huì)小。

對(duì)于科技發(fā)展，“從10到100”的創(chuàng)新需要足夠多的資本，單靠國家支持是不夠的。但“從0到1”的創(chuàng)新，公共性資金就可以支持，但此時(shí)不要去問科研人員“你怎么創(chuàng)新？”，他本人可能還沒想明白，我們此時(shí)能做的就是給這些有可能產(chǎn)生靈感的人穩(wěn)定的支持、基本的生活保障，讓他們“慢慢想”。

創(chuàng)新·放手做事，自由之外也有紅線

新京報(bào)AI研究院：據(jù)說DeepSeek團(tuán)隊(duì)中不少人是北京大學(xué)的學(xué)生，DeepSeek和智源是否有過接觸？

黃鐵軍：深度求索公司（DeepSeek）在2023年7月成立后，就跟智源進(jìn)行了接觸。我們也愿意和他們合作，智源跟中外所有企業(yè)、研發(fā)機(jī)構(gòu)都持開放合作態(tài)度。

DeepSeek對(duì)我們比較有吸引力的點(diǎn)，在于其擁有較強(qiáng)的算力。DeepSeek的成功說明創(chuàng)新需要各種條件，缺一不可，算力就是其中之一。

DeepSeek成立時(shí)的第一處辦公室在蘇州橋，緊鄰北大西南門，離北大計(jì)算機(jī)學(xué)院不遠(yuǎn)，我們多媒體實(shí)驗(yàn)室的很多學(xué)生都到DeepSeek實(shí)習(xí)過，并發(fā)表了很多學(xué)術(shù)論文。DeepSeek的北京團(tuán)隊(duì)中的關(guān)鍵崗位算法崗，北大計(jì)算機(jī)學(xué)院的學(xué)生占據(jù)了一半。充沛的算力也保證了研究條件，他們做的創(chuàng)新解法也成就了DeepSeek。這是好事，不管人才在杭州還是在北京，都為中國AI創(chuàng)新發(fā)展作出了貢獻(xiàn)。

新京報(bào)AI研究院：智源是在什么背景下成立的？

黃鐵軍：2017年，國家新一代人工智能發(fā)展規(guī)劃發(fā)布，2018年，北京市政府一號(hào)文件中提及了“建設(shè)世界一流新型研發(fā)機(jī)構(gòu)”，而人工智能是重要的方向，智源就是在這樣的背景下誕生的。

“智源”這個(gè)名字最早由第一任理事長張宏江提出，希望我們成為“人工智能的源頭”。智源選址的位置方便周邊幾家機(jī)構(gòu)，讓清華、北大、中國科學(xué)院的老師同學(xué)們能夠步行或騎自行車通勤，我有時(shí)也騎自行車往返北大，這樣大家交流起來更加方便。出于便利的角度，張鈸院士就在這里工作和接待來訪者。

新京報(bào)AI研究院：作為智源的首任院長和現(xiàn)任理事長，智源這樣的新型研發(fā)機(jī)構(gòu)有何優(yōu)勢？

黃鐵軍：作為首任院長，我的工作包括確定智源的大致戰(zhàn)略和發(fā)展方向，以及牽頭準(zhǔn)備論證報(bào)告等材料。

我在體制內(nèi)多年，既申請(qǐng)過各類科技項(xiàng)目，也從事管理工作，對(duì)傳統(tǒng)科研體制的優(yōu)缺點(diǎn)心知肚明，當(dāng)北京出現(xiàn)了新型研發(fā)機(jī)構(gòu)、新管理體制，我也很愿意參與。智源風(fēng)氣自由，但自由度之外也有紅線。

實(shí)際上，智源同時(shí)做到了“資源支持”和“讓團(tuán)隊(duì)放手做事”。沒有支持、沒有資源，很多研究無法進(jìn)行。但管理上干預(yù)過多也會(huì)帶來麻煩，如果科研人員一半的時(shí)間用在了管理上，創(chuàng)新也就只剩下了一半時(shí)間。

制度越織越密、管理越來越細(xì)致在某種程度上并不利于科技創(chuàng)新，這是因?yàn)榭萍紕?chuàng)新是動(dòng)態(tài)變化的，跟建樓、修橋不同，存在不確定性。做不到提前半年、一年就知道之后的路怎么走，需要自己摸索。

計(jì)劃內(nèi)的創(chuàng)新首先要有人想到，但機(jī)會(huì)不是擺在大街上的，而是在細(xì)微之處，即便專業(yè)技術(shù)人員也不一定能創(chuàng)新，從事管理的領(lǐng)導(dǎo)想創(chuàng)新就更難。而智源作為北京新型研發(fā)機(jī)構(gòu)，最大的創(chuàng)新就是破除項(xiàng)目立項(xiàng)制度以及繁瑣的管理流程，將方向和過程的管理完全交給各個(gè)院系自己決定。

拔尖·不拘一格招攬人才

新京報(bào)AI研究院：作為從事大模型研究最早的機(jī)構(gòu)，智源將邁入第十個(gè)年頭，未來發(fā)展有何目標(biāo)？

黃鐵軍：2028年11月，智源成立就滿10年了。目前，智源正在向10年的目標(biāo)邁進(jìn)——成為國際頂尖的人工智能機(jī)構(gòu)。我們理解和定義的“頂尖”，是指國際前三，而其基本標(biāo)志是一定要有國際公認(rèn)的對(duì)人工智能發(fā)展具有重大影響的標(biāo)志性成果。如2016年DeepMind推出AlphaGo擊敗了人類職業(yè)圍棋選手，2022年OpenAI推出ChatGPT引領(lǐng)了大模型浪潮。因此，它們是大家公認(rèn)的頂尖的AI機(jī)構(gòu)，而我們要做出不同。

我們是國內(nèi)從事大模型研究最早的機(jī)構(gòu)，也對(duì)生態(tài)作出了重大貢獻(xiàn)，但這和國際頂尖機(jī)構(gòu)做出的貢獻(xiàn)相比還不夠。我們現(xiàn)在的目標(biāo)是在2028年之前做出1到3項(xiàng)頂尖成果。

新京報(bào)AI研究院：北京有許多新型研發(fā)機(jī)構(gòu)，智源和其他機(jī)構(gòu)有什么不同？

黃鐵軍：智源和其他研發(fā)機(jī)構(gòu)的關(guān)系，并不是“N+1”，而是“1+N”，有了這個(gè)“1”之后，讓這些“N”能夠互相打通。在AI領(lǐng)域，有了智源后，高校教授們可以不再各自為政走申請(qǐng)立項(xiàng)、發(fā)指南、進(jìn)行評(píng)審程序的“老路”。智源成立后不久，就起到了平臺(tái)作用，聚集了AI領(lǐng)域的學(xué)者們，在經(jīng)歷了約一年的討論之后，立即開始了大模型領(lǐng)域的研發(fā)工作。

智源匯聚了國內(nèi)主要AI人才，在我們的社區(qū)里，幾乎每天都有大大小小的討論會(huì)，平均每年兩三百場。在思想碰撞中，對(duì)于有價(jià)值的想法，我們會(huì)立刻動(dòng)手去做。當(dāng)然，由于資源有限，投入較大的想法需要在院務(wù)會(huì)上深入討論。而對(duì)于一些年輕人提出的并不耗費(fèi)過多資源的想法，如果一段時(shí)間之后得不到驗(yàn)證，我們也不再擴(kuò)大支持。

在人才規(guī)模大、密度高的北京，智源提供了讓人才相互交流、快速行動(dòng)的創(chuàng)新生態(tài)環(huán)境。當(dāng)一個(gè)想法大學(xué)做不了、企業(yè)不愿做，就到智源這樣的新研發(fā)機(jī)構(gòu)來。

智源是AI生態(tài)的一個(gè)窗口，是AI人才在北京發(fā)展的“第一站”。當(dāng)一名國外歸來的人才去高校發(fā)展，就要按照高校的程序進(jìn)行申請(qǐng)，如果當(dāng)助理教授，需要至少半年到一年的人事周期才有可能批準(zhǔn)，到企業(yè)則需要做企業(yè)產(chǎn)品。此時(shí)，智源靈活度高的優(yōu)勢就顯現(xiàn)出來了，這也是北京市給我們的任務(wù)：不拘一格招攬人才，人才在這只待三個(gè)月也行，未來無論想創(chuàng)業(yè)還是想當(dāng)教授都可以。同時(shí)，我們對(duì)在這里研發(fā)的技術(shù)成果不追求高額利潤，對(duì)成果轉(zhuǎn)化持開放的態(tài)度。

簡而言之，智源負(fù)責(zé)把北京的人工智能做到世界領(lǐng)先，至于選擇什么技術(shù)路線、招哪些人、過程中遭遇哪些困難，需要自己解決。

新京報(bào)AI研究院：不少從智源走出來的人都創(chuàng)立了自己的公司，智源有意成為AI企業(yè)的“孵化器”嗎？

黃鐵軍：從智源走出去的人才，最后成立初創(chuàng)公司的大概有20個(gè)。不過，智源的定位是國際頂尖AI研究機(jī)構(gòu)，創(chuàng)業(yè)是副產(chǎn)品，如果一開始是沖著創(chuàng)業(yè)和孵化的目的發(fā)展，我們的性質(zhì)就發(fā)生了變化。成為世界頂尖機(jī)構(gòu)不是靠創(chuàng)業(yè)，我們現(xiàn)在從事的科研活動(dòng)，有些暫時(shí)看不出未來有多大可能性變成產(chǎn)品，但不這么做就不能推動(dòng)前沿技術(shù)發(fā)展。

我們相信這些工作一定會(huì)以某種方式在未來發(fā)揮作用，一開始做研究時(shí)卻不能這樣算賬，我們只能是做別人沒做過的事，做創(chuàng)新機(jī)構(gòu)要做的事。和DeepSeek等大模型企業(yè)可能不同，我們應(yīng)該是前沿，智源的成功應(yīng)該是“從0到1”的成功。

新京報(bào)AI研究院：北京在科技創(chuàng)新上發(fā)揮什么作用？

黃鐵軍：當(dāng)前，無論是智源還是字節(jié)、DeepSeek，其實(shí)都是在“從1到10”“從10到100”的過程中，一群人在不斷摸索更強(qiáng)模型、更低成本模型的過程。在此過程中，哪里人才密集度夠高，創(chuàng)新就在哪里發(fā)生。資金問題可以通過各種方式解決，但人才密度的分布是天然的，北京的人才密度從國際范圍來看都是足夠高的，所以可以預(yù)期，未來北京會(huì)發(fā)生更多的創(chuàng)新。

智源要做國際頂尖的AI機(jī)構(gòu)，北京要做國際科技創(chuàng)新中心，要想科技中心轉(zhuǎn)移到中國，人才密度大的北京責(zé)無旁貸。

記者聯(lián)系郵箱：luoyidan@xjbnews.com

新京報(bào)貝殼財(cái)經(jīng)記者羅亦丹

編輯王進(jìn)雨

校對(duì) 柳寶慶

43 +1

微博

微信

我要評(píng)論

直播

預(yù)告

高考第二日語數(shù)英收官考場外考生暢聊感受
2025-06-08 14:30

AI浪潮錄丨黃鐵軍：孵化AI公司是副產(chǎn)品，智源要在國際拔尖

我要評(píng)論

直播

熱點(diǎn)

最新

熱議

AI浪潮錄丨黃鐵軍：孵化AI公司是副產(chǎn)品，智源要在國際拔尖

我要評(píng)論

直播

熱點(diǎn)

最新

熱議

AI浪潮錄丨黃鐵軍：孵化AI公司是副產(chǎn)品，智源要在國際拔尖