您的位置:首頁 >熱訊 > 聚焦 >

讓大模型信得過、用得起,火山方舟開辟了新玩法|要聞

ChatGPT火爆之后,國內不少企業紛紛發布大模型,百度的文心一言、阿里的通義千問、騰訊的混元大模型和華為盤古大模型……

作為近年來發展速度最快的互聯網廠商之一,字節旗下火山引擎雖然看似低調,不過憑借業務IT資源和基礎架構的規模優勢,已悄然將業務拓展至外部客戶。在大模型領域,與大多數互聯網廠商不同,火山引擎采取了“淘金賣水”的商業策略,類似于京東、天貓模式,不僅匯集了一批來自AI創新公司和科研院所的優秀模型,還提供充沛算力、安全互信、企業服務等重要支持。


(資料圖片僅供參考)

在最近火山引擎主辦和英偉達合作舉辦的V-Tech體驗創新科技峰會上,火山引擎發布大模型服務平臺火山方舟,并面向企業提供模型精調、評測、推理等全方位的平臺服務。目前,火山方舟集成了百川智能、出門問問、復旦大學MOSS、IDEA研究院、瀾舟科技、MiniMax、智譜AI等多家AI科技公司及科研院所的大模型,并已啟動邀測。

此次發布會上火山方舟產品的確讓人眼前一亮。一般來說,企業為了數據安全會希望大模型在本地部署,然而這一模式又會導致大模型供應商的知識產權外漏,大模型的使用方與提供方彼此之間的信任問題勢必需要解決。此次大會中,火山公布的大模型安全互信計算方案,有望從根本上解決產業互信的問題,為長期發展做鋪墊。

在大模型站在風口的當下,雖然各類模型百花齊放,但如何以成本與效率兼顧的原則,挑選出適合企業本身的模型仍是個不小的學問。這也是為何我們認為火山方舟有很大看點的原因:解決互信問題、幫助企業挑選好適合自己的大模型、結合行業屬性精調,讓大模型發揮出更大價值,幫助更多企業踏上人工智能的時代快車。

01

應用好大模型將是企業未來的核心競爭力

隨著ChatGPT在全球掀起熱潮,一時之間其背后的AI大模型風起云涌。

對此,李開復甚至稱AI大模型是絕對不能錯過的歷史機遇。因為這將是有史以來最大的平臺革命,它將比Windows、安卓要大10倍甚至更多,它會讓每個應用改寫,會重新重構人類的工作,會讓有創意的那些人的聰明才智被放大10倍或者更多。

在AI1.0的時代,數據集和模型之間較為孤立,需要大量的人工標記工作。然而到了AI2.0時代,超級巨量數據訓練將會解決這些障礙,微調后就可以執行五花八門的任務。

根據產業發展規律,新技術發展初期,由于自身因素限制,往往很難形成大規模應用,但是起到了很好的改變市場認知作用,為后續增長空間做出很好的鋪墊。而當新技術的限制因素被逐漸解決之后,其在產業的應用便會迅速落地,打開市場空間。

可以看到的是,大模型將會逐步過渡到商業化落地階段,會在未來會給企業和員工的工作、運營方式帶來變革性影響。作為比肩甚至超越移動互聯網浪潮的時代機遇,學會用好大模型,將會成為企業和個人在未來的核心競爭力。

直到目前,國內外多家互聯網公司都開啟了大模型領域的應用布局,產業發展如火如荼。

在海外市場,谷歌I/O上發布一系列生成式AI新進展,包括新一代語言模型PaLM 2、升級AI聊天機器人Bard、生成式AI實驗版搜索引擎、Duet AI for Workspace等;微軟推出ZeRO++技術,可顯著減少AI大模型訓練時間和成本;Meta開源多感官大模型,讓AI用6種模態體驗虛擬世界,為實現元宇宙鋪路。

國內的科技企業也沒有閑著。百度文心大模型已經迭代到了3.5版本,與3.0版本相比,訓練速度提升了2倍,推理速度提升了17倍;騰訊成立了混元助手項目組,由騰訊首席科學家張正友帶隊研發;阿里發布“通義千問”后,瞄向AI音視頻賽道推出“通義聽悟”,并且正式開啟公測。

當然,市場上有競爭力的玩家并不止于大模型的供應方,還有火山引擎這類做大模型商業平臺的創新型選手。火山引擎最初的定位就是將字節內部長期以來沉淀的技術能力和應用工具開放給外部企業。如今,在火山引擎發布的火山方舟大模型服務平臺中,提供了面向企業開發者提供大模型精調、評測、推理、干預等全方位的大模型服務,加速大模型應用落地。

對于火山引擎這類采用“淘金賣水”式生意的公司而言,在AI風口下有望迎來更具確定性的增長。

02

企業如何挑選大模型

公開數據統計,自3月以來,國內已有超過20家企業入局大模型賽道,共計發布了79個10億級參數規模的大模型,產業在短期內迎來了爆發式增長。

我們也可以看到通用大模型并不能解決全部問題,比如ChatGPT對于許多基礎問題存在回答“張冠李戴”的現象。同時,由于專業知識訓練的語料不夠,ChatGPT在專業領域提供的回答通常過于膚淺,甚至經常存在生成質量不穩定、邏輯不連貫、重復或不一致的現象,這會導致回答缺乏可靠性,無法滿足專業領域對回答質量的高要求。

因此,對于B端和G端客戶來說,垂直大模型是重要的發展方向。通過精調,垂直大模型能夠以更低的成本實現更精準的輔助工作。通用大模型更多的是解決80%的通識性問題,要100%解決場景問題必須結合行業屬性,這一點在如今越來越成為共識。

比如對于醫療健康行業,容錯性很低,模型的準確度可能要達到99%以上才可進入商業化階段。而如此高的精準度自然是通用大模型無法達到的,將大模型結合行業屬性,才是大模型在產業應用商業化落地的良藥。

再比如,微軟有一個研究團隊,他們制作專門為回答醫學問題而設計的語言模型——BioGPT。基于GPT-2,研究團隊在預訓練中使用8個Nvidia V100 GPU進行20萬步,而微調則使用單個Nvidia V100 GPU進行32步,然后使用3.57億個參數進行調整,最終讓BioGPT相較于GPT-2而言,展示了更卓越的生物醫學內容文本生成能力。

可見,一個經過良好微調訓練的小模型,在特定工作上的表現上,甚至會優于一個通用的大基座模型。畢竟對于大多數行業而言,并不需要非常通用的、巨大的基座模型。

除此之外,由于通用大模型不是本地部署,許多問題需要上傳到云端之后在異地進行解答,很容易導致企業內部數據泄露。而且對于大多數公司而言,通用大模型給企業帶來的成本過高,很多時候百億級垂直大模型就能滿足需求,如果使用千億級大模型就會造成成本的浪費。

從長期來看,大模型的推理開銷會遠大于訓練開銷。大的基座模型推理成本高昂,會倒逼企業選擇大模型時更加考慮性價比因素。

所以企業在挑選大模型時需要尤為關注模型可用性、安全性和成本等因素。

最后,國內大模型還在初級階段,技術流動和發展也非常快,并沒有哪家大模型遙遙領先。眾多大模型在不同任務上的效果表現各擅勝場,企業不該把業務綁定在一家大模型上,而是應該按照業務場景需求,擇優選用不同的模型。

為了全方位支持企業挑選合適與自己的大模型,火山方舟還提供了統一的工作流對接多家大模型提供商,可以幫助企業為不同場景選擇最合適的模型,包括大模型精調、評測(效果指標)、推理、干預(內容安全、質量評估)等全方位的專業支持,在基本不改變工作流的情況下可以切換使用多個不同模型。

03

為何要選擇火山方舟?

目前,火山方舟集成了百川智能、出門問問、復旦大學MOSS、IDEA研究院、瀾舟科技、MiniMax、智譜AI等多家AI科技公司及科研院所的大模型,并已啟動邀測。

不同于自建應用,去服務企業和C端用戶,火山方舟選擇了類似于大模型領域的京東或天貓模式,通過匯集了一批來自AI創新公司和科研院所的優秀模型,提供充沛算力、安全互信、企業服務等重要支持。

不同的商業模式所打造出來的差異化服務,也成為企業選擇火山方舟的重要原因。

首先,針對安全方面,對于企業而言,非本地部署的大模型會給企業信息安全帶來很大隱患。然而,換個角度思考,如果將大模型私有化部署,不但企業將承擔更高的成本,模型生產方的知識資產安全也無從保障。

為此,火山方舟在業內首創了安全互信計算,為大模型使用者、提供者和云平臺提供可以互相信任的安全保障。

據火山引擎智能算法負責人吳迪介紹,火山方舟已上線了基于安全沙箱的大模型安全互信計算方案,利用計算隔離、存儲隔離、網絡隔離、流量審計等方式,實現了模型的機密性、完整性和可用性保證,適用于對訓練和推理延時要求較低的客戶。

會上,吳迪還表示,火山方舟還在探索基于NVIDIA新一代硬件支持的可信計算環境、基于聯邦學習的數據資產分離等多種方式的安全互信計算方案,更全面的滿足大模型在不同業務場景的數據安全要求。

其次,火山方舟提供了豐富的模型精調和評測支持。吳迪介紹,企業可以用統一的工作流對接多家大模型,對于復雜需求可設置高級參數、驗證集、測試集等功能,再通過自動化和人工評估直觀對比模型精調效果,在不同業務場景里還可靈活切換不同的模型,實現最具性價比的模型組合。

如此一來,企業可以大幅降低大模型的推理成本,并結合自身業務場景,選擇更具性價比的模型。

目前,集團內部已有十多個業務團隊試用火山方舟,在代碼糾錯等研發提效場景,文本分類、總結摘要等知識管理場景,以及數據標注、歸因分析等方面探索,利用大模型能力促進降本增效。

火山方舟的首批邀測企業,包括金融、汽車、消費等眾多行業的客戶。通過海量數據訓練,火山方舟已有能力將沉淀下來的經驗、方法為外部客戶進行服務。

AI時代,在大模型領域絕不會一家獨大,期待火山方舟能以不一樣的方式,讓更多企業踏上人工智能時代的快車。

作者 | Greg

來源 | 征探財經(ID:teccj6)

關鍵詞: