帝都魔都雙雙押寶,年底了AI圈居然還有高手?

來源: 編輯:匿名 發表時間:2024-12-26 00:52:17 熱度:3

導讀: 好好好,本以爲 OpenAI 直播已經是 24 年 AI 領域的尾聲,沒想到還有高手,國內 AI 圈又傳出個大新聞。 就在前幾天, 國產 AI 六小虎中的階躍星辰,拿到了數億美元的融資。 而且更值得...

好好好,本以爲 OpenAI 直播已經是 24 年 AI 領域的尾聲,沒想到還有高手,國內 AI 圈又傳出個大新聞。

就在前幾天, 國產 AI 六小虎中的階躍星辰,拿到了數億美元的融資。

而且更值得一提的是,這輪融資的背景可不簡單,差評君還從投資方裏找到了上海國資的身影。

要知道就在幾天前,北京國資也投了六小虎中的另一家智譜。

一南一北兩大超級城市,各自押寶,都上了賭桌。

有一說一,經過前段時間的 “ 百模大战 ” , AI 在融資圈兒其實是有些降溫的,結果這次兩大國資先後出手:

這一波,難不成是大模型版的滬爺 VS 京爺?

雖然話是這么說,估計一些網友還是對 “ 階躍星辰 ” 的名字有點陌生, “ 這又是從哪冒出的大模型公司? ”

展开全文

但其實在圈兒內,階躍星辰早就小有名氣,不過倒也不怪大家沒聽過,主要這企業確實比較低調。

相對其他AI 創業公司,階躍是六小虎裏最後出場的,但在登場時,就已經是獨角獸的存在了。

如果要用一句話來形容的話,差評君能想到的就是 “ 低調神祕有實力,國資背景大牛多 ” ,是國產 AI 裏的一匹黑馬。

不僅在首秀時, 階躍星辰就掏出了個對標 GPT-4 的萬億參數模型,而且主打一個速度快、效率高, 10 個月內就發布 11 款模型,並且在 16 個月內,就搗騰出了從理解到生成的全系列模型矩陣。

雖然人家確實挺有實力,不過咱這次的重點倒不是純講這個。

差評君覺得借着拿階躍星辰融資這事,還是有挺多有意思的 AI 圈內故事,能和大家聊聊的。

首先不可否認的是,大模型領域實際已經在縮決賽圈兒了。

差評君也和不少圈內人聊了聊,發現大家基本都在從兩個點,來判斷這家公司有無能喫雞的冠軍相。

一個是有沒有牛逼的人才,另一個是能不能堅持投入技術研發搞 AGI

咱先說人才, 其實大模型的人才圈兒,可能比差評君的朋友圈還小。

就拿今年諾獎得主喬弗裏辛頓來說,他這個深度學習之父的實驗室,一向就是各大公司眼中的頂級宗門。

像什么 OpenAI 聯合創始人伊利亞,就是他的博士;谷歌 DeepMind 的大佬阿列克謝,是他的博士後;

Meta 的人工智能負責人楊立昆也是他的弟子;前百度首席科學家吳恩達,也跟他有千絲萬縷的關系。

而在國內,被北京國資選中的智譜 AI ,實際上也是學術上的大宗門出身,直接來自有 27 年人工智能研究歷史的清華大學知識工程實驗室。

所以說,有沒有這些牛逼人才,往往是行業內認不認可一家公司的理由之一,甚至有時候請這些圈內大牛,要比花錢买顯卡搞計算還重要。

前不久,差評君就和某大模型一线技術人員聊了聊,他用前不久字節高薪挖阿裏通義大模型技術負責人周暢的新聞舉例,告訴差評君目前圈內人才急缺。

他覺得傳聞中花費 8 位數薪資挖人的操作,是可以理解的。

因爲大模型訓練成本動不動就是幾千萬上億, 而合適的人才,能少走很多彎路,反而是最省的操作。

而這次的階躍星辰,差評覺得它能被資本看好,也和人才脫不了幹系。。。

不過與學院派京爺智譜不同,滬爺階躍這方面也很特色,很多人都是行業內老人了。

他們裏面很多研究人員都是從讀博士开始搞相關領域,然後在大廠工作過,親身在一线經歷了過去 10 年 AI 的最前沿發展。

比如階躍星辰的 創始人、CEO 姜大昕,這哥們以前是微軟前全球副總裁,日活上億、備受差友們喜歡的 Bing 搜索,還有全球最早的智能個人助理 Cortana ,都是他曾參與過的項目。

這么說吧,他把深度學習技術應用到了 Bing 上,幫助 Bing 搜索服務擴展到全球 200 多個國家和地區。

除了CEO ,階躍的首席科學家張祥雨,在這個圈子裏也很有名。

這老哥本來是西交跟微軟亞洲研究院的博士生,師從孫劍和何愷明,還是开山大弟子。

但這還不是重點,重點在於讀博期間,他們師門四人完成了——引用次數幾十萬、本世紀最火的深度學習著名論文—— ResNet ( 殘差學習),而張祥雨在裏面就負責了底層框架和編碼。

有的差友可能不了解這個 ResNet ,沒關系,重點就一句話, 這文章的核心思想殘差網絡,對現代深度學習影響巨大。

當年打敗八冠王捷豹的 AlphaGo 系列,就用了 ResNet 技術;現在的 Transformer 網絡 ( GPT 裏那個 T )裏,同樣也用了殘差網絡。

除了這個,張祥雨在其他技術上也很牛逼,在這咱就不細說了。就說一個蘋果的 3D 人臉解鎖,也就是 FaceID ,那其實也是受他的 ShuffleNet 技術影響才搞出來的。。。

總之,這個 2023 年 4 月才建立的團隊, 在六小虎裏亮相最晚,但人才的實力卻絲毫不虛,從這點上看,能拿到魔都的投資也不算奇怪。

然而另一方面,除了人才以外,大模型廠商路线的選擇,也越來越受重視。

而 AGI 基座模型這方向,其實也是技術理想主義者們最興奮的方向,是大部分創業者入局大模型領域的初心所在。

換句話說,基座大模型就是那一層地基,只有地基扎實了,模型的基礎能力逐漸提升了,才有可能在未來搞出能真理解世界的通用模型,並運用到各種場景中改變人們的生活。

像是 OpenAI 、 Google 、 Anthropic 、 Meta ,還有國內的智譜、階躍等,就屬於這一派,在堅持推出各類 AI 應用的同時,也依舊在基座大模型的探索上越走越遠。

然而就像开頭說過的,整個 AI 領域其實有些降溫。

不少初創廠商們因爲成本上的壓力,逐漸擱置了基座大模型的研究和探索, 把重心放在 AI 應用上。

要么轉向垂直行業賽道、要么單純搞 toC 的生意來賺錢,畢竟要先活着才能去實現理想。

而在 2024 年,國內依舊在不斷更新基座模型,依舊在公开場合重申 AGI 爲最終目標的公司裏,智譜和階躍星辰算是很典型的代表了。

幾個月前,差評編輯部就跟智譜的 CEO 張鵬對話過。張鵬表示:我們的目標定在 AGI ,這裏面每一個問題的突破都有可能帶來飛躍式的發展。

包括階躍星辰也一樣,階躍的創始人姜大昕曾經說,高昂的訓練成本的確是一個挑战。 有人調侃 “ 講卡傷感情,沒卡沒感情,用卡費腦筋 ” ,但如果追求的目標就是 AGI 的話,付出再多也還是要堅持下去

姜大昕給階躍星辰設計的技術路线中,就分成 “ 單模態 - 多模態 - 多模理解和生成 - 世界模型 -AGI” ,一共五個步驟。

這可能也是階躍的大模型系列之所以被命名爲 Step 的原因,五步成詩。

到了現在,階躍星辰已經走出了兩步。

階躍的第一步,就是萬億參數大模型 Step-2 ,它在上個月就炸場了一番。

在圖靈獎得主楊立昆親推的權威榜單,有 “ 全球最難大模型評測 ” 之稱的 LiveBench 上, Step-2 拿下了國內第一、總榜第五的成績,成了唯⼀進⼊前⼗名的中國語⾔⼤模型。

榜單成績時間:2024-11-19

而階躍的 “ 第二步 ”Step-1V 走的也不錯。

拿⼤模型競技場 Chatbot Arena 的數據來看,這個競技場網站裏網友們可以試用所有的大模型,然後給它們打分, 今年 11 ⽉的榜單裏 Step-1V 的總分已經達到了 Gemini1.5 的水平。

他家的躍問拍照問,也是最早接入 iPhone 16 相機控制的國產大模型功能。

還有一上线就快速衝上 App Store 美食榜前三的 胃之書,用的就是階躍的多模態大模型

今年在圈內爆紅的AI 小遊戲換你來當爹、靈魂提取器,也是基於階躍模型能力开發出來的。

像是界面財聯社這些財經垂類的專業媒體,也跟階躍做過 AI 合作。

但歸根結底,階躍星辰給人最深的感覺,還是在低調有實力,和堅持着 AGI 初心這兩點上。

而這,或許就是上海國資之所以選擇它的另一個原因。

最後,差評君覺得在 AI 領域逐漸降溫的 2024 年末,智譜和階躍星辰兩家先後拿到了國家隊的投資,這對國產 AI 行業來說也是一個比較重要的信號。

一方面,這意味着行業內的方向已經开始逐漸清晰,最頂端國家隊的層面,也希望能盡快看到 AGI 。

而另一方面,這也可以說是拉开了國內大模型下半場的序幕:

擁有人才、找准方向、能堅持到最後的人,才有機會向人工智能的 One Piece —— AGI 進軍。

撰文:納西

編輯:江江 & 面线

美編:萱萱

圖片、資料來源

姜大昕:攀登AGI的路徑與實踐,萬億參數和多模融合

36氪:大模型獨角獸「階躍星辰」,完成數億美元 B 輪融資

每日經濟新聞:階躍星辰完成數億美元B輪融資,“AI六小強”迎來基座模型雙強新格局

第一財經:階躍星辰完成數億美元B輪融資,上海國有資本與騰訊投資入股

新浪財經:LiveBench榜單比拼,階躍星辰成爲國內大模型第一

階躍星辰,Chatbot Arena,LiveBench,中國證券報,未來科學大獎等,部分圖源網絡



標題:帝都魔都雙雙押寶,年底了AI圈居然還有高手?

地址:https://www.vogueseek.com/post/107499.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。