三個清華校友,爭搶大模型一哥

來源: 編輯:匿名 發表時間:2024-04-20 16:50:11 熱度:14

導讀: 本文經授權轉載自 時代財經 (ID:tf-app) 作者:徐曉倩 僅僅過了一年,大模型競爭就出現了分野。 近期,有媒體報道稱,由王小川創立的百川智能進行新一輪數億美元融資,將成爲國內2024年最大A...

本文經授權轉載自

時代財經

(ID:tf-app)

作者:徐曉倩

僅僅過了一年,大模型競爭就出現了分野。

近期,有媒體報道稱,由王小川創立的百川智能進行新一輪數億美元融資,將成爲國內2024年最大AI領域融資之一。來自參與的投資人證實,百川智能今年以來估值已超18億美元(約130億元)。對此,百川智能方面回應時代財經表示,報道存在一定誤差,具體信息有待官方進一步宣布。

如果上述融資消息落地,這意味着又一家清華系大模型公司躋身百億估值俱樂部。

據時代財經不完全統計,2019年-2023年至少有30位清華校友下場創業,投入大模型產業,創辦公司超過15家,累計融資超過150億元。這些由清華校友創辦的企業,在業內被稱爲“清華系”。

隨着清華系大模型企業估值走高,一場行業內的“三國殺”默默上演。

大模型繞不开清華系

年前,兩位初代互聯網創業大佬先後宣告退圈。

2020年12月,美團發布內部信宣布,美團聯合創始人、高級副總裁王慧文已經順利完成交棒,按計劃正式退出。半年後,搜狗被騰訊收購,曾經在搜索領域叱吒風雲的王小川也逐漸遠離互聯網舞台中央。

此時的大洋彼岸,AI學術界正升起一顆耀眼的新星。OpenAI推出的GPT-3橫空出世,在學術界掀起不小波瀾,其參數規模高達1750億,不僅能做語言生成,而且對語言的理解能力也有了很大的提升。

對外界而言,GPT還遠沒有爆發出潛在的能量。但是一群清華大學的頂尖學者迅速做了一個重大的決定:追趕GPT3、投入大模型訓練中。

三年後,GPT-4通過一款對話產品將大模型的風吹到全球各地。王慧文率先發起了AI大模型人才的招募令,緊接着,王小川、李开復等互聯網明星創業者紛紛登場。王慧文、王小川這對昔日的清華校友,因爲大模型再次交匯於競技場上。只是這一次,他們離开舒適區後,還要面臨着更多來自“學術圈”的對手。

展开全文

(圖/Unsplash)

在百模大战的核心風暴中,清華系毫無疑問地成爲舉足輕重的一方勢力,他們如同一條奔騰的江河逐漸分流成各具特色的溪流,有的是在互聯網時代身經百战的老法師,有的已經在大模型研究領域中蟄伏多年。

“如果你做大模型或者芯片,那你最好是清華的。”一位芯片行業從業者向時代財經表示。諸多科研人才、創業公司與技術儲備,共同構建起一張叫做“清華系”的人脈之網,這似乎已經成爲某種行業共識。

過去一年裏,大模型獨角獸企業技術人員每天熬夜,爲了追趕OpenAI前僕後繼。

光年之外和智譜AI都把根據點選在了清華東門外的搜狐大廈;隔着一條街是賽爾大廈,王小川在此創立了百川智能;搜狐大廈南側的成府路上也有兩家清華系創業公司,分別是聆心智能和深言科技。

一場新的造富運動正轟轟烈烈开展,“清華系”成爲繞不开的歷史鋼印。

1位先鋒串起半部創業史

多年後,當外界追憶起這段烈火烹油的大模型創業潮時,智源研究所無疑會成爲一個標志性的符號。這裏距離清華大學南門步行只要5分鐘,如今,清華主校區三公裏以內都是大模型創業的根據地。

2020年,人工智能普遍陷入了進退兩難的困局,AI四小龍市值跌落谷底,巨額的研發投入和低效的落地產出,使得一批投資人紛紛撤退。西南證券的一份研報顯示,AI企業融資次數從2019年开始,出現了大幅下滑,九成AI公司處於虧損狀態。

與外界濃重的悲觀情緒相反,智源研究所正在默默酝釀着一場變革,該研究所齊聚了孫茂松、唐傑、劉知遠、楊植麟等一衆大模型先鋒人物,他們一致認爲大模型訓練能夠帶來一場顛覆性的變革。

數百人將自己的熱情和精力投入大模型的煉丹爐中,开啓了一段漫長的开荒期。

(圖/Unsplash)

2021年初,命名爲悟道1.0的大模型登場,該系列大模型呈現了3000萬圖文數據對訓練的多模態模型 BriVL 1.0、百億參數中英雙語大模型GLM-10B 與多模態模型CogView 1.0 等成果。

在此基礎上,身爲帶隊老師的唐傑做了一個更大膽的嘗試,他調用外部資源,訓練了幾個百萬億級別的大模型。3個月後,悟道2.0系列大模型亮相。作爲對標GPT-3的國產大模型系統,悟道2.0以1.75萬億的參數量,創造了當時全球最高紀錄,超出了GPT-3近10倍,這也成爲中國大模型初創階段標志性的裏程碑。

唐傑的另一個身份是智譜AI的創始人之一,公司成立於2019年6月,清華大學計算機系知識工程實驗室是其搖籃,團隊核心成員幾乎都是清華血脈。

悟道系列大模型一战成名後,清華系創業的氛圍被推向了一個小高潮。一批清華校友逐漸從實驗室走出來,探究大模型商業化的路徑。

(圖/Unsplash)

2021年11月,黃民烈創立了聆心智能;2022年3月,孫茂松的博士生豈凡超創立了深言科技;2022 年 8 月,劉知遠創立了面壁智能,專注於法律領域;2023年,同樣師從孫茂松的朱軍建立了生數科技。

此時,大模型創業團隊再次面臨一個困局:找不到大模型與市場的連接點,愿意喫螃蟹的企業並不多,甚至不知道怎樣調度大模型的能力。

直到一個核爆點的出現,這批早期的开荒者才搶到了通向下一個技術變革的入場券。

學院派VS創業派

2022年11月,OpenAI推出的ChatGPT橫空出世,自動生成文字的功能震撼了全球科技圈,用戶規模在短短2個月內突破1億,大模型开始進入大衆視野。

如同一夜春風襲來,默默耕耘數載的清華系大模型收獲了資本的青睞,最先搶佔了風口。時代財經整理發現,2023年,清華系大模型的融資逐漸迎來了快車道,超過一半的清華系大模型第一筆上億級別的融資發生在2023年。

“過去幾年,AI投資基本爲0,在大家覺得滿眼霧霾的時候,突然ChatGPT出來了,給人帶來了光。”瀾舟科技創始人周明發出了這樣的感嘆。

這是一場深不見底的資源投入,訓練一款高質量的大模型,需要數以萬計的芯片集群和雲計算調度,並且還要夜以繼日的追趕被OpenAI疊高的行業指標,一旦开啓,就意味着啓動了龐大的碎鈔機。

(圖/Unsplash)

據國盛證券研報,GPT-3僅訓練一次的成本就高達140萬美元,對於一些更大的LLM,一次訓練成本介於200萬美元至1200萬美元之間。智譜AI CEO張鵬也曾在公开場合表示,25億元的融資根本不夠,不管融多少、掙多少錢,都是通向AGI這條路上的盤纏。

2023年10月,智譜AI宣布完成超25億元融資(估值過百億元);也在同一時期,百川智能迎來了新一輪的融資,金額超過3億美元;月之暗面則在去年接連完成了兩輪共計近20億元的融資。

相比學院派艱難低調的蟄伏,互聯網明星創業者通常更加果斷堅決,他們對應用產品和市場有更爲敏銳的判斷力。2023年年初,在見證ChatGPT的問世後,身爲互聯網連續創業者的王小川嗅到了技術變革的氣息,他激動地發了一條朋友圈:“OpenAI的勝利,是技術理想主義的勝利。”

先成立公司、再招募技術團隊的路徑,是創業者快速搶佔市場目光的最佳方式。思考了兩周後,王小川便放下了手頭的智慧健康項目,轉而進攻大模型。

不到半年,百川智能的團隊便搭建起來了,王小川拿到5000萬美元啓動資金,正式宣布進入AI模型創業賽道。此外,他還拉來了舊部下——前搜狗COO、清華1998級校友茹立雲,新的創業公司有一半成員來自原搜狗團隊。

經歷了長達半年的橫衝直撞,獨角獸大模型名單逐漸浮出水面——智譜AI、月之暗面、百川智能、MiniMax和零一萬物,其2023年公开披露的融資約爲100億元,佔全國AI投資的40%,清華系大模型再次贏得了半壁江山。

(圖/Unsplash)

然而,從整體的融資規模來看,大模型概念的火爆並沒有引發投資熱潮。根據晚點報道,2023年AI領域的總融資額同比減少4.5%,爲257億元,不到2021年的一半。

“這個市場目前處在募資難、投資難、退出難的形勢下,所以對於大模型,大多數機構還都是看爲主,真正出手的話,也不像以前我們經常說的 FOMO(fear of miss out),是出於‘擔心錯過’的情緒。”梅花創投創始合夥人吳世春此前接受時代財經採訪時表示。

誰是清華系大模型一哥?

如果沒有智能助手Kimi的爆火,月之暗面可能不會快速站在聚光燈下。過去一年,創始人楊植麟幾乎隱匿於同門師兄聲勢浩大的追逐中,獲得的曝光度並不多。

2024年开年,文生視頻應用Sora、長文本概念走紅,短暫熄火的大模型投資得以再次回溫。月之暗面最先被資本擡高身價,傳出完成新一輪超10億美元的融資,這是ChatGPT出現後大模型賽道最大一筆融資,估值達到25億美元(約180億元),投資方包括阿裏、紅杉中國、小紅書、美團等。

1992年出生的楊植麟成爲整個大模型領域的焦點人物,入局大模型之前,楊植麟已經構思了兩個問題,一是創業籌備的第一筆資本,二是構建創業的方向——通過與人類互動找到應用機會。

2023年10月,月之暗面推出了智能助手Kimi,成爲大模型創業公司的首個爆款項目,3月19日,月之暗面宣布把長文本能力從20萬字提升至200萬字,其當周訪問量達到了394萬次,略高於文心一言的338萬次,一度躍升爲國內網頁端周度訪問量最高的AI應用。

(圖/pexels)

在部分行業人士看來,月之暗面彎道超車的武器在於綁定了長文本的標籤,並且定位比較垂直。“面向C端的產品更容易贏得市場關注,但同時也會因爲缺乏技術壁壘容易被超越。”AI創業者張維向時代財經說道,他認爲,大模型的發展方向依然比較模糊,大家都在摸着石頭過河,面對的是一個完全未知的世界。

作爲大模型行業的布道者,唐傑參與創立的智譜AI頻繁對外投資,出現在13家大模型公司的融資隊伍中,包括了算力、軟硬件、應用、醫藥、保險等多個方向。

(圖/Unsplash)

不過,當技術像煙花一樣盛放光芒時,身在局中的人很難分清楚這是虛晃的幻術還是可以碰觸的真實世界。

“以爲得到一把萬能的錘子,看見什么都覺得是釘子,但其實發現,業務場景很難切入。面向B端去做企業資源不夠,選擇做C端推廣和成本都是問題。”張維向時代財經說道。

即便是生態較爲成熟的百度,也尚未在大模型領域找到光明的出口。根據公开披露的數據,2023年最後一個季度,大模型爲百度雲業務僅帶來6.6億元的增量收入。

“掌握模型核心技術的團隊會在競爭中脫穎而出,推出相應的應用產品,進行多次的迭代和優化,找到合適的路线。如果只單純开發應用產品,沒有自己掌握的核心技術,基本上只有一次試錯機會。”啓明創投合夥人周志峰近日在公开場合表示,在他看來,具備大模型技術水平的公司終將會走向模型應用一體化的公司。

如果把視线放在清華系競技場的核心地帶,“三國殺”也开始步入正題。

智譜AI、月之暗面和百川智能快速躋身100億美元估值俱樂部,只是三者使用的武器並不相同:擁有學院派背景的智譜AI,在尋找企業與大模型的融合場景;月之暗面創始人楊植麟是極致的技術理想主義,他相信技術“暴力美學”能夠改變世界;而在兩種路线躊躇的王小川更想在理想主義和現實主義中找到另一種視角。

和大多數從業者一樣,混沌與彷徨幾乎貫穿了張維創業的一整年,不知道接下來行業走向何方的他,還在等待一個坐標系的出現。



標題:三個清華校友,爭搶大模型一哥

地址:https://www.vogueseek.com/post/62006.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。