在清華科技園科建大廈3樓,面壁智能聯(lián)合創(chuàng)始人、CEO李大海的辦公室中央掛著一幅大型拼圖,一艘船在風(fēng)雨中劈波斬浪。

今年已是李大海來到中關(guān)村的第23年。

2006年,從北京大學(xué)數(shù)學(xué)系畢業(yè)后,李大海加入谷歌中國(guó),成為創(chuàng)始員工之一。后來他又參與了云云網(wǎng)、豌豆莢、知乎的創(chuàng)業(yè)。2023年,一場(chǎng)大模型掀起的技術(shù)風(fēng)暴席卷而來,時(shí)任知乎CTO的李大海決定投身其中。當(dāng)年4月,在李大海的推動(dòng)下,知乎完成了對(duì)面壁智能的獨(dú)家天使輪投資。

李大?春妹姹谥悄,是因?yàn)槠鋭?chuàng)始人、青年科學(xué)家劉知遠(yuǎn)是國(guó)內(nèi)首批開展大模型研究的研究者之一。2020年12月,劉知遠(yuǎn)團(tuán)隊(duì)發(fā)布了全球第一個(gè)中文開源大模型“CPM”,這一項(xiàng)目也是后來中國(guó)奠基性大模型“悟道”的前身。兩年后,劉知遠(yuǎn)發(fā)起成立面壁智能。

投資一家優(yōu)秀的大模型企業(yè),對(duì)李大海來說絕非終點(diǎn)。大模型掀起的洶涌浪潮讓他興奮得難以入睡!斑@是一場(chǎng)堪比蒸汽機(jī)改變世界的大變革!”一次次在深夜爬起來看代碼、追蹤大模型前沿進(jìn)展的李大海,決定從大廠高管轉(zhuǎn)身,再次創(chuàng)業(yè)。2023年6月,李大海出任面壁智能CEO。

彼時(shí),大模型領(lǐng)域激戰(zhàn)正酣,一場(chǎng)前所未有的“百模大戰(zhàn)”正在上演。與此同時(shí),隨著大模型迅猛發(fā)展,作為大模型“燃料”的算力告急,行業(yè)內(nèi)出現(xiàn)GPU“一卡難求”“排隊(duì)預(yù)定”的局面。如何才能從白熱化的競(jìng)爭(zhēng)中殺出重圍?

高效——是李大海與團(tuán)隊(duì)給出的答案!芭c其盲目地把模型做大,不如花更多精力讓模型變好,以同樣的模型參數(shù)量實(shí)現(xiàn)更高的智能與知識(shí)密度!被趯(duì)大模型本質(zhì)規(guī)律的觀察,他們提出了大模型的密度定律(DensingLaw):大模型知識(shí)密度每3.3個(gè)月翻一番,大模型將變得越來越“小”,同時(shí)能力越來越強(qiáng)。

基于這一理念,團(tuán)隊(duì)選擇避開同質(zhì)化嚴(yán)重的對(duì)話式AI聊天機(jī)器人,將視野轉(zhuǎn)向了一個(gè)在當(dāng)時(shí)看來不算熱門的方向——端側(cè)大模型。李大海認(rèn)為,人們的生活早已離不開手機(jī)、平板、汽車等各種各樣的硬件終端設(shè)備,而在不久的將來,這些智能終端都將擁有具備自主思考能力的“超級(jí)大腦”。

“我們要讓小模型跑出大能量,讓本地模型能力滿足日常絕大多數(shù)的智能需求。”李大海堅(jiān)信,相比于時(shí)下最火熱的跑在“云”上,并且需要大量算力的千億級(jí)超大模型,在“斷網(wǎng)、弱網(wǎng)”環(huán)境下,仍然能讓各種智能終端具備自主思考能力的端側(cè)大模型,將成為面壁獨(dú)特的競(jìng)爭(zhēng)力。

用更小的參數(shù)、更高的效率、更低的成本,實(shí)現(xiàn)更好的智能——達(dá)到這個(gè)目標(biāo),并不容易!澳P湍芰θ招略庐,但模型效率的領(lǐng)先如同芯片制程一般,須形成比較硬的相對(duì)優(yōu)勢(shì)。我們要攻克的,就好比大模型行業(yè)的‘光刻機(jī)’!崩畲蠛Uf。

拿算法來說,過去,由于模型訓(xùn)練過程中充滿不確定性,傳統(tǒng)的大模型訓(xùn)練被業(yè)界戲稱為“煉丹”。而面壁研發(fā)團(tuán)隊(duì)通過上千次模型沙盒實(shí)驗(yàn),在算法的各種細(xì)節(jié)上摸索出了一系列最優(yōu)配置,大幅優(yōu)化了模型效果。

為了打磨大模型“光刻機(jī)”,從高質(zhì)量的數(shù)據(jù)原材料,到模型訓(xùn)練與調(diào)校,一個(gè)個(gè)環(huán)環(huán)相扣的細(xì)節(jié),研發(fā)人員都細(xì)細(xì)打磨。2024年初,面壁推出了端側(cè)大模型MiniCPM,用僅僅24億參數(shù)實(shí)現(xiàn)了超過百億參數(shù)大模型的性能。

“超級(jí)大腦”仍在不斷進(jìn)化。今年1月,面壁智能發(fā)布MiniCPM-o2,這也是全球首個(gè)達(dá)到OpenAI公司GPT-4o水平的端側(cè)多模態(tài)大模型。這款僅有80億參數(shù)量的模型,能夠?qū)崟r(shí)流式處理文本、圖像、音頻和視頻信息,“視、聽、說”都很伶俐。

在今年中關(guān)村論壇年會(huì)期間,面壁又發(fā)布了一項(xiàng)領(lǐng)先業(yè)界的成果——首個(gè)純端側(cè)超級(jí)智能助手,可應(yīng)用于汽車智能座艙。在端側(cè)大模型的支撐下,即便車輛沒有網(wǎng)絡(luò),超級(jí)智能助手也能隨時(shí)“在線”,實(shí)現(xiàn)從車外到車內(nèi)的各種感知并執(zhí)行任務(wù)。

由于在安全性、實(shí)時(shí)性等方面的巨大優(yōu)勢(shì),面壁的端側(cè)模型一經(jīng)推出就很快獲得了法律、消費(fèi)電子等行業(yè)用戶的認(rèn)可。就在上月,面壁與合作伙伴發(fā)布了首個(gè)純端側(cè)大模型量產(chǎn)車型。

“2026年,裝上面壁端側(cè)模型的設(shè)備數(shù)將達(dá)2025年的10倍!狈叛畚磥,李大海的眼中是更廣闊的星辰大!磥砣?qū)⒂?00億的設(shè)備終端,它們都有望裝上一個(gè)個(gè)“超級(jí)大腦”。

獨(dú)角獸“秘笈”:冷靜取舍 以小博大

智譜、月之暗面、百川智能、零一萬物、面壁智能……在今年年初第三方機(jī)構(gòu)公布的國(guó)內(nèi)大模型獨(dú)角獸排行榜中,多家北京企業(yè)赫然在列,顯示出創(chuàng)新資源高度集聚的效應(yīng)。

在被人們稱為“宇宙中心”的五道口一帶,辦公租金并不便宜,李大海坦言,背靠五道口周邊極強(qiáng)的人才優(yōu)勢(shì),是成立僅三年的面壁得以迅猛發(fā)展的重要原因。

身處北京,依靠全國(guó)領(lǐng)先的AI人才資源和“AI第一城”的創(chuàng)新生態(tài),與行業(yè)巨頭憑借巨額資金和海量算力投入“大力出奇跡”的發(fā)展路徑不同,以面壁為代表的北京人工智能初創(chuàng)企業(yè),向世界展現(xiàn)出高效創(chuàng)新、“以小博大”的創(chuàng)新范式。

“對(duì)創(chuàng)業(yè)公司來說,‘不做什么’和‘做什么’都很重要,‘不做什么’甚至更重要!崩畲蠛Uf。面對(duì)巨大機(jī)遇,創(chuàng)業(yè)公司需要注意的是“專注一個(gè)點(diǎn)做透”,并在此過程中不斷辨別哪些是應(yīng)勇于“取”的機(jī)遇,哪些是要勇于“舍”的誘惑。在“大煉模型”的風(fēng)潮下,面壁就曾先后做出不做AI聊天機(jī)器人、放棄大模型基礎(chǔ)設(shè)施等重要決策,專注打磨端側(cè)模型,提升模型效率與知識(shí)密度,“以小博大”。

蛇年春節(jié),DeepSeek旋風(fēng)席卷全球。以低成本實(shí)現(xiàn)高性能,正是DeepSeek一鳴驚人之處!堵槭±砉た萍荚u(píng)論》隨后刊發(fā)了一篇題為《關(guān)注DeepSeek之外的四家中國(guó)人工智能初創(chuàng)公司》的報(bào)道,點(diǎn)贊中國(guó)“四劍客”,其中就有面壁智能。

勇于面壁,方能破壁——DeepSeek和面壁智能,都在用實(shí)際行動(dòng)印證著一個(gè)道理,不盲目跟風(fēng),勇于探索新路徑,即便在有限的資源環(huán)境下也能激發(fā)、倒逼出無限的創(chuàng)新潛力。

編輯:龐婷
更多精彩資訊請(qǐng)?jiān)趹?yīng)用市場(chǎng)下載“央廣網(wǎng)”客戶端。歡迎提供新聞線索,24小時(shí)報(bào)料熱線400-800-0088;消費(fèi)者也可通過央廣網(wǎng)“啄木鳥消費(fèi)者投訴平臺(tái)”線上投訴。版權(quán)聲明:本文章版權(quán)歸屬央廣網(wǎng)所有,未經(jīng)授權(quán)不得轉(zhuǎn)載。轉(zhuǎn)載請(qǐng)聯(lián)系:cnrbanquan@cnr.cn,不尊重原創(chuàng)的行為我們將追究責(zé)任。
長(zhǎng)按二維碼
關(guān)注精彩內(nèi)容