來源: 編輯:匿名 發表時間:2024-09-06 00:50:29 熱度:25
《科創板日報》9月5日訊(特約記者 王雲嘉)今日,“‘In AI·無限未來’創新大會”正式亮相外灘大會。本次AI 創新大會由上海報業集團旗下財聯社、科創板日報主辦, AI daily、藍鯨新聞協辦,於上海·黃浦世博園區 C11館舉行,是2024外灘大會核心“見解論壇”之一。
大模型如何幫助金融工作者降本增效?它又如何發揮潛能幫助管理金融機構內外部知識? 在“In AI 無限未來”創新大會的“‘我與AI’TED演講”上,恆生聚源總經理吳震操分享了他的思考與實踐。
▍信息爆炸時代如何獲取資訊
“對於投資來說,這是特別知識密集型的工作。不管是機構投資者、研究員、還是基金經理,大家每天要處理海量的信息,全國各地去跑參加路演,調研不同公司,閱讀大量的文檔、資訊,摘要、整理再計算做估值,做各種各樣的推理演算,最後給自己的买方形成報告或者給自己的基金經理形成報告。”
“數據公司在這裏面是做什么呢?恆生聚源作爲一家數據公司,在過去二十幾年裏面,第一件事就是幫助所有的投資者,能夠從龐大的資訊裏面找到他們需要的信號。大家能夠對於他們投資的方向作出分析判斷,對還是錯?風險在哪兒?我們從2000年开始做一件事,就是把非結構化的數據結構化,把全國、乃至全球各地的數據全部搬到大家的桌面,這個事情做了二十幾年,一直到人工智能出現。我們發現人工的速度確實趕不上機器進化的速度。”
如何用人工智能解決這個問題?在2016年,恆生聚源選擇的第一條路是知識圖譜,“我們花了很大的力氣去給產業做各種各樣的標籤,包括產業鏈的梳理,構建三元組,構建各種各樣的關系等等,這裏面花費了大量的人力物力。知識圖譜很准,但是最大問題是要弄清楚所有的知識和關系的蔓延,這意味着我們還需要繼續花費大量的人力和物力。”
▍大模型顛覆投資研究範式
“一直到2022年,大模型徹底的改變了我們整個知識生產,以及大家消費知識的方式。斯坦福在今年初的報告裏說,到2026年市場上所有的高質量的數據都會被大模型消耗掉,到2030年全球所有的公开數據都會被大模型喫掉。接下來,數據的收集、知識的生成、把數據整合成知識的過程將被徹底地顛覆。從源頭數據到連接信息到生產知識的整個過程被高度壓縮了,大模型顛覆了整個知識生產,也顛覆了投資和研究的知識處理。我們想趕上這個浪潮,於是在我們自己內部开始了一個金融大模型的項目,取名叫做‘語控萬數’。”
“金融行業大模型應用最關鍵的一點是要准,但是在大模型實踐運用中,很多信息是不准確的,很多推理也不正確。很多結論和推斷不知道是爲什么給出的,這恰恰是金融行業你需要去解決的。不管是研究員或者投資顧問也好,你需要告訴你所服務的基金經理或者個人投資者,你的數據是哪兒來的。”
“過去兩年時間我們在大模型和投研上走了一條很長的路。嘗試了Bloom、Pythia、智譜、LLaMa2、千問等多個基座大模型。在訓練金融垂域大模型時,使用了我們在過去20年積累的4000億Token、3500萬篇文本。同時,我們已經寫了一百萬條精調的語料,全是我們的研究員一條條寫出來的。通過這些訓練,我們有了一個更懂金融的大模型,接下來我們又做了中間層,做了自己的RAG鏈路,使用小的模型解析我們的問題,接着拿這些解析結果到我們的金融數據庫裏面來搜尋最精確的數據,把數據反饋回來,給到大模型做提示、組裝,直到產生最後的結果。使得大模型的反饋做到了及時、准確、和可溯源”
“我們基於自己的金融大模型以及中間件开發了一個智能投研工作台——WarrenQ。它是一個融合了大模型、AI工具、協同筆記、金融數據等各種工具,給研究員提供一站式的數據和信息獲取、加工、分析、以及寫作的平台。通過“大模型+AI工具+金融數據+N場景”的模式,WarrenQ已經與多家金融機構進行了多樣性、深度場景化的合作探索落地,未來也將持續爲金融人士提供智能化的數據分析和交互技術,提升工作效率。
“在人工智能的時代,AI模型爆發的過程中,投資研究底層邏輯還是要基於數據。算法、算力和數據,在金融領域中,數據最後永遠是最重要的那一點。投資決策是基於精准的判斷。智能投研在增質提效中一定要以大模型平台服務爲中心,去連接各種各樣的數據源,形成機構自己的知識管理能力。”吳震操表示。
(科創板日報特約記者 王雲嘉)
標題:吳震操:大語言模型將改變投資研究範式|直擊2024外灘大會
地址:https://www.vogueseek.com/post/85865.html
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。