“To B or not to B?這是 AI 大模型的「哈姆雷特之問」。”
跨入2023年,大模型興起、諸多公司「跑步進場」的頭幾個月,大模型一邊倒向 C 端類 ChatGPT 的研發,對成本、效率更敏感的企業客戶似乎不在關注焦點。
然而近兩個月,情況發生了變化?;卺t療、金融、教育等垂直行業的大模型開始出現。而已經發布通用大模型的公司,也在針對行業推出模型服務。
(資料圖片僅供參考)
這將給大模型的市場發展帶來什么變化?
01MaaS的疑問
隨著「大模型是AI時代的基礎設施」的提法深入人心,MaaS(Model as a Service,模型即服務)的概念逐漸廣為人知。簡單來說,用戶可以直接在云端調用、開發與部署模型,而無需投資構建和維護自己的模型所需的基礎設施、硬件和專業知識。
但從「用家」的角度來看,這一模式還有疑問。
現任某知名智能家居品牌 CTO 的陳平告訴雷峰網,他們的智能產品銷往全球各地,對大模型有突出需求,就是想用大模型來提升多國語言識別與處理的能力。以前的語音識別做不到「一模通用」,而是要根據不同的國家設計不同的方案,但 ChatGPT 出來后,他們調用 API 調試,發現大模型能有效地解決這個問題。
在海外,該品牌與亞馬遜進行合作。他們的產品本身就需要通過亞馬遜的平臺在海外銷售,亞馬遜自己做的 Echo 音箱也賣到海外很多個國家,驗證了亞馬遜語音識別技術的成熟度。盡管亞馬遜的效率成本比較高,但能夠較好地滿足他們的需求。
但在國內,他們還不知道該用哪一家的模型:目前國內已發布的大模型數量太多,如果他們要將所有的模型都驗證一遍、一一對比模型的效果,那么所消耗的人力成本會非常大。
國內模型能力的「賣方」可分為兩類:一類是BAT等大廠和大模型初創公司(如智譜、MiniMax)為主;此外還有大模型的「中間商」,主要是基于大模型開發應用型服務的創始團隊,包括底層算力與框架的提供者,甚至還包括提供大模型微調的第三方公司。
陳平的想法,反映了部分B端大客戶的需求,他們希望有一個專屬于自身行業的大模型,這正好介于兩類賣方所提供的產品與服務之間。
一位大廠工程師在與雷峰網的交談中,將市場需求分為金字塔的底層、中層與上層:
底層是通用大模型,如 ChatGPT。據不完全統計,過去三個月里,國內發布了超過 70 個 To C 通用大模型產品,如百度的文心一言、阿里的通義千問、科大訊飛的星火等等。
中層是行業大模型,如彭博發布的金融大模型 Bloomberg GPT,這類大模型或是與底層想做大模型基礎設施的通用大模型廠商合作定制,或直接調用 API 接口,或大廠云廠商自研。
上層是一系列應用型服務,基于通用大模型或行業大模型開發 AI 工具,如構建一個專注于論文解讀(含翻譯、摘要總結、生成等等)的學術平臺。
從數據安全的角度看,陳平更青睞與大廠合作,因為第三方公司雖然懂得訓練大模型,但不懂智能家居的知識,他們依然要提供大量的數據給對方訓練,而數據提供過去后,他們一是無法保障模型的能力得到延展,二是無法避免第三方公司將這些數據與對應的模型賣給陳平所在品牌的競爭對手。
當理論落地現實,陳平的困境也是許多 B 端企業的共同難題。
02重回焦點
過去三個月,國內大模型產品設計一味追隨 ChatGPT,將問題的定義交給用戶自由發揮(俗稱「AI 召喚師」),造成了嚴重的同質化,大模型的應用局限于文本生成、代碼生成等通識屬性強的場景上,滿足用戶社交、娛樂或創作的需求。
更接近生產,對于成本效率要求更高的產業市場,并未被過多提及。
今年 5 月份,陳平曾經嘗試聯系一家大廠的大模型團隊,希望探討大模型落地方案,得到的回復是優先級不在智能家居行業。
但眼下,大廠和創業公司們正在將眼光重新聚焦于產業。
之前,國內類 ChatGPT 的大模型產品都無一例外地側重「對話交互型」,而非「知識增強型」,大多數 C 端用戶與 AI 的對話內容趨向于「Chat」(閑聊)而非「GPT」(生成/創造)。但另一方面,C 端用戶的付費意愿低,To C 的通用大模型產品短期內無法復制 ChatGPT 的成功模式,在同質化產品的圍攻下被迫加入資源競賽的燒錢游戲。回過頭看,To B 客戶付費意愿高。隨著市場回歸理性,大模型選擇 To B 幾乎成為行業內心照不宣的一個范式。
有報告指出,B端的Mass服務需要針對行業領域和業務場景進行大量工程工作,但B/G端客戶付費能力更強,未來盈利空間以及成長空間廣闊。
但To B客戶的需求也更「強勢」,一不小心走歪,很可能回到上一代 AI 模型定制化的老路。
例如,市面上已經出現了一些專門提供模型精調服務的第三方公司。
雷峰網了解到,這類第三方公司采用一次性開發+訂閱的收費模式,如初始研發費用 100 萬、再加上終身授權許可的設備費用(8塊錢一個),幫助 B 端客戶根據需求訓練出滿足它們行業需求的大模型,然后在客戶的平臺上進行私有化部署。因為在市面上暫時找不到合適的標化產品,這類公司受到了沒有自主研發團隊、同時又渴求大模型能力的B 端企業客戶(區別于大 B)的青睞。
03兩個盲區
雷峰網也關注到,越來越多大模型的研發團隊準備彎道超車,繞過激烈的C端市場,專注研究面向行業的大模型,如王小川建立的百川智能就剛剛推出了一個參數規模 7B的開源商用模型。
騰訊也計劃在 6 月 19 日發布行業大模型及商用訓練平臺。在此前4月,騰訊發布了的面向大模型訓練的新一代HCC高性能計算集群,整體性能比過去提升了3倍,并通過騰訊云MaaS面向企業輸出模型訓練相關服務。
看起來,騰訊沒有急于推出聊天助手產品,而是選擇了通用大模型、行業大模型兩條腿走路,進一步對外釋放行業大模型服務能力。在剛剛結束的中關村論壇上表示,李彥宏提出未來每一個行業都會有屬于自己的大模型。大模型會深度融合到實體經濟當中去,賦能千行百業,助力中國經濟開創下一個黃金30年。阿里公布的模型即服務三層架構中,也涵蓋了企業專屬大模型。
可以看出,企業客戶對大模型落地很迫切,各類廠商與創業者也在追趕需求。
事實上,B 端企業客戶往往自帶場景與數據,是大模型落地的*檢驗場。那么,在大模型的落地上,企業客戶最關心什么?
據雷峰網調研,大模型在企業落地有兩個盲區:一是數據安全,二是成本可控。
數據安全包含「數據隱私」與「專業知識」兩塊,行業人士認為,ChatGPT 生成的答案應該由相關領域的專業人士判斷?;谕ㄓ么竽P?,目前用戶并非將專業知識輸入模型后就能得到專業的結果。此外,陳平指出,應用型的公司基本不愿意將自身微調的模型貢獻到公有版本里與其他人分享,所以企業還是傾向于訓練自己的大模型。訓練完后在本地進行私有部署。
行業現有的通常做法是,提供一個通用大模型,然后開放給行業的客戶去微調,再進行私有化部署。可陳平的經驗是,以 Open AI 為例,雖然它們開放了 API,但API無法私有化部署,客戶無法在最新的模型版本上微調;大模型的技術變化太快,對企業來說,跟上潮流的成本太高。
一家企業的CTO向雷鋒網表示,目前大模型在企業落地的成本分兩塊:一是模型前期微調與訓練的成本,二是模型后期與業務結合的運行成本。大模型的訓練需要算力、數據與工程等幾塊體系的支持?!钙髽I要考慮訓練定制化模型的人力與時間成本,更傾向于選擇能同時提供兩種能力的廠商,將模型訓練與運行成本降到*。」
一個值得警惕的點是:目前看來,并非所有的場景都適合大模型落地。大模型剛火起來時,一些行業與未及時推出大模型技術或產品的公司擔心自身業務被大模型改寫,觀望兩個月后,他們發現「自己想多了」。他們認為,原因可能有兩塊:一是缺少提出好問題的 AI 產品經理,二是大模型的技術屬性所限。找場景一直是技術公司的難題,同樣也是 ToB 的難題。大模型團隊尋找合適的場景,也是深入 To B 服務的關鍵一步。
每個掌握大模型自研能力的公司都想做大模型時代的「基礎設施運營商」。三個月下來,行業目前只能確定,如果大模型真的是 AI 時代的智能運營商,如水電網等社會基礎設施,無論現有的行業玩家再多,最終也只有少數幾家能成功。
先發有先發制人的優勢,后發有后來居上的可能,大模型驅動新生產力的游戲還在繼續。如果大模型真的代表一個新時代,行業集體多花點時間進行深入思考也無可厚非,目前看來,繼續留在牌桌上就已經是正確的一步。
【本文由投資界合作伙伴微信公眾號:雷峰網授權發布,本平臺僅提供信息存儲服務。】如有任何疑問,請聯系(editor@zero2ipo.com.cn)投資界處理。
標簽: