技術(shù)是佐料,需求才是主菜。

大模型應(yīng)用的商業(yè)化進(jìn)展慢,為什么慢?

2023-07-05 10:09:32發(fā)布     來(lái)源:多知網(wǎng)    作者:大力正手  

  文|大力正手 教育行業(yè)研究者

  編者按:

  本文系多知網(wǎng)約稿。當(dāng)前,不完全統(tǒng)計(jì)國(guó)內(nèi)有超過(guò)80個(gè)基礎(chǔ)大模型,對(duì)于大模型來(lái)說(shuō),參與開(kāi)發(fā)的畢竟是少數(shù)企業(yè),中小企業(yè)更多的是使用者。但是,到現(xiàn)在真正應(yīng)用大模型的商業(yè)化并不突出。本文作者從幾個(gè)角度來(lái)解釋大模型應(yīng)用商業(yè)化進(jìn)展緩慢的原因,并認(rèn)為技術(shù)本質(zhì)上是一種手段,而滿足用戶需求才是真正追求的目標(biāo)。

  自2022年底ChatGPT發(fā)布后,截止6月份,國(guó)內(nèi)企業(yè)已經(jīng)發(fā)布了約80個(gè)基礎(chǔ)大模型,打著AI旗號(hào)的產(chǎn)品更數(shù)不勝數(shù)。但實(shí)際上大模型的商業(yè)化一直存問(wèn)題,可以說(shuō),并沒(méi)有幾家企業(yè)在大模型領(lǐng)域真正產(chǎn)生大額收入,其收入可能僅占估值的1/100,絕大部分都是靠著融資以及創(chuàng)始人自有資金將企業(yè)往前推進(jìn)。文章將從幾個(gè)角度來(lái)解釋大模型應(yīng)用的商業(yè)化進(jìn)展緩慢的原因。

  01

  大模型還不足夠好,小概率但可能是大風(fēng)險(xiǎn)

  當(dāng)你問(wèn)早期ChatGPT3.5“林黛玉為什么會(huì)倒拔垂楊柳”,他回答說(shuō)“因?yàn)榱主煊癖瘋^(guò)度,倒拔垂楊柳緩解悲傷情緒”;早期的文心一言更是會(huì)回答一些匪夷所思的答案。這就是模型幻覺(jué)——一本正經(jīng)胡說(shuō)八道。但當(dāng)GPT-4出來(lái)后,再問(wèn)他“林黛玉為什么會(huì)倒拔垂楊柳”,他會(huì)告訴你“林黛玉是紅樓夢(mèng)的人物,倒拔垂楊柳是水滸傳的情節(jié),兩個(gè)不能放在一起”。更精準(zhǔn)的回答,正是模型幻覺(jué)的減少,這也意味著大模型正在越來(lái)越好。

  然而,盡管大規(guī)模模型的性能正在改善,但他們依舊存在缺陷。在商業(yè)應(yīng)用中,我們必須從小概率風(fēng)險(xiǎn)的角度去考慮。盡管GPT-4的錯(cuò)誤可能相對(duì)較小,但在某些關(guān)鍵領(lǐng)域,如航空和醫(yī)療,即使只有一次的錯(cuò)誤,也可能帶來(lái)嚴(yán)重后果。因此,我們發(fā)現(xiàn)大模型最先被應(yīng)用于容錯(cuò)率較高的行業(yè),如聊天、游戲、社交等,因?yàn)樵谶@些領(lǐng)域,偶爾的錯(cuò)誤不會(huì)帶來(lái)嚴(yán)重的影響。另一種情況,大模型作為輔助決策的存在,如辦公場(chǎng)景中的會(huì)議摘要等,這也就意味著,在最終的產(chǎn)品或者內(nèi)容觸達(dá)用戶之前,肯定有人的參與,來(lái)作為剔除小概率風(fēng)險(xiǎn)的保障。

  02

  大模型還不夠穩(wěn),宕機(jī)了企業(yè)惹不起

  GPT-4是目前最先進(jìn)的大型人工智能模型,其優(yōu)越的邏輯推理能力引領(lǐng)著業(yè)界的發(fā)展趨勢(shì),國(guó)內(nèi)的研發(fā)也在不斷向GPT-3.5靠近。然而,對(duì)于中國(guó)的C端用戶而言,OpenAI的賬戶使用門(mén)檻較高,需要海外的郵箱、手機(jī)號(hào)和銀行賬戶,這使得只有少部分人能夠獲取到優(yōu)質(zhì)的GPT-4服務(wù)。對(duì)于國(guó)內(nèi)的B端企業(yè)希望使用GPT,一方面受限于國(guó)內(nèi)法規(guī)限制,一方面open ai不定期對(duì)亞太地區(qū)特別是中國(guó)大陸進(jìn)行封號(hào),使得B端企業(yè)很難獲得穩(wěn)定的api接口。雖然可以通過(guò)微軟云服務(wù)的方式接入,但也存在著一定的不確定性。

  在商用領(lǐng)域,穩(wěn)定性是至關(guān)重要的。就像游戲體驗(yàn)中,最讓人破防的的往往是突然的宕機(jī),而這在ChatGPT這樣的世界級(jí)產(chǎn)品中也出現(xiàn)過(guò)多次。對(duì)于依賴GPT-3.5或4作為底層模型的企業(yè),用戶會(huì)對(duì)任何宕機(jī)行為產(chǎn)生抱怨,但他們不會(huì)關(guān)心問(wèn)題的來(lái)源,只會(huì)感到服務(wù)的中斷并把憤怒發(fā)泄到企業(yè)。通常,企業(yè)會(huì)選擇備用模型以應(yīng)對(duì)核心模型的突然問(wèn)題,然而目前在商用層面特別是國(guó)內(nèi),還沒(méi)有能真正匹敵GPT-4的模型。這意味著,即使備用模型能保證穩(wěn)定性,其效果和用戶體驗(yàn)卻可能大大低于以前,這是所有企業(yè)都不愿意看到的。

  03

  大模型還不夠便宜,模型之外還有成本

  對(duì)于基礎(chǔ)大模型的開(kāi)發(fā),這顯然不是所有企業(yè)都能參與其中的,其訓(xùn)練成本極其高昂。對(duì)于大多數(shù)人來(lái)說(shuō),更多地是從使用者的角度與大模型打交道。盡管對(duì)于采用大模型的企業(yè)來(lái)說(shuō),API的價(jià)格已經(jīng)大幅降低,比如2023年3月份ChatGPT API的價(jià)格比2022年底下滑了90%,而在2023年6月份,輸入端的價(jià)格再次降低了25%。即使如此,這種新型的計(jì)算方式相較于傳統(tǒng)的運(yùn)算方式依然更加昂貴。據(jù)路透社報(bào)道,谷歌的母公司Alphabet的董事長(zhǎng)John Hennessy表示,與大型語(yǔ)言模型進(jìn)行交互的成本可能是進(jìn)行標(biāo)準(zhǔn)關(guān)鍵詞搜索的10倍。所以,雖然大模型的使用成本已經(jīng)在不斷下降,但其價(jià)格依然不菲。

  另外,僅僅將大模型接入到特定的領(lǐng)域,可能并不能達(dá)到最佳的效果。因此,在接入API并將其投入商用之前,企業(yè)還需要在諸多方面付出額外的成本。這包括數(shù)據(jù)準(zhǔn)備和預(yù)處理的成本、模型訓(xùn)練和調(diào)優(yōu)的成本、部署和運(yùn)維的成本、模型更新和迭代的成本,以及法規(guī)合規(guī)的成本。所有這些因素都使得應(yīng)用大模型的總體成本依然很高。

  以科大訊飛的學(xué)習(xí)機(jī)T20為例,由于其搭載了星火大模型,其價(jià)格比前一代的T10高出2000元。據(jù)業(yè)內(nèi)人士透露,這額外的2000元其實(shí)并沒(méi)有覆蓋大模型的成本??紤]到市面上一臺(tái)普通的學(xué)習(xí)機(jī),其硬件制造和版權(quán)購(gòu)買的總成本也僅在1000-1500元左右,這就更加凸顯了大模型在商業(yè)應(yīng)用中的高昂成本。

  04

  靠大模型創(chuàng)收,難,很難,特別難

  商業(yè)得以運(yùn)轉(zhuǎn),核心是收益能否超越成本。目前的商業(yè)環(huán)境已經(jīng)不再青睞通過(guò)燒錢(qián)搶占市場(chǎng)或者策略性虧損的策略,而是更傾向于自我造血的企業(yè)。然而大模型領(lǐng)域的企業(yè)自我造血能力均欠佳。

  以目前的頭部大模型企業(yè)為例。OpenAI是目前最知名的AI大模型公司,雖然他們已經(jīng)籌集了超過(guò)100億美元的資金,并且公司估值達(dá)到了290億美元,但是他們預(yù)計(jì)在2023年的收入只有2億美元。另一個(gè)例子是Hugging Face,作為全球最大的AI/ML社區(qū)和平臺(tái),同時(shí)也是最重要的大模型基礎(chǔ)設(shè)施之一,他們的估值是20億美元,但growjo對(duì)其年收入預(yù)估僅0.3億美元。另一家獨(dú)角獸公司Adept AI,他們是AI助手(大模型應(yīng)用)的開(kāi)發(fā)者,雖然他們籌集了4.1億美元的資金,公司估值達(dá)到了10億美元,但growjo對(duì)其年收入預(yù)估只有0.04億美元,可以說(shuō)幾乎還沒(méi)有商業(yè)化。

  國(guó)內(nèi)的各大模型公司,例如百度、阿里、騰訊、華為等,雖在大模型領(lǐng)域有所布局,但并未從中獲取實(shí)質(zhì)性的豐厚收益。此外,大模型領(lǐng)域的中小型獨(dú)立企業(yè),其收入可能僅為公司估值的百分之一。其對(duì)于直面C端用戶的產(chǎn)品,大公司在沒(méi)有全面考慮的策略前,往往謹(jǐn)慎行事,不輕易推向市場(chǎng)。因此,像文心一言、通義千問(wèn)、星火大模型等產(chǎn)品,都需要用戶申請(qǐng)才能使用,而非直接面向公眾。對(duì)于中小型公司,雖然它們能迅速推出產(chǎn)品,但由于資金等限制,產(chǎn)品往往處于冷啟動(dòng),推廣困難,因此大模型領(lǐng)域的小公司用戶數(shù)通常較少。

  大模型的確是一項(xiàng)優(yōu)秀的技術(shù),但它當(dāng)前的價(jià)值更多地體現(xiàn)在"錦上添花",而不是"雪中送炭"。也就是說(shuō),大模型帶來(lái)的邊際價(jià)值,并未能滿足市場(chǎng)的剛需。從商業(yè)模式上看,大部分的產(chǎn)品都是以原產(chǎn)品的增值服務(wù)的方式提供,而非推出獨(dú)立產(chǎn)品。如多鄰國(guó)的涵蓋大模型AI能力的增值訂閱服務(wù),售價(jià)30美元/月;Quizlet的增值服務(wù)AI導(dǎo)師Q-chat,訂閱費(fèi)用為3.99美元/月。

  大模型的上游企業(yè)收取中游企業(yè)的接入費(fèi),而中游企業(yè)則通過(guò)向下游用戶收費(fèi)來(lái)提供基于大模型的產(chǎn)品。最終,是用戶的需求驅(qū)動(dòng)了整個(gè)市場(chǎng)。但是,為什么用戶不愿意為大模型付費(fèi)呢?

  首先,AI領(lǐng)域的發(fā)展和普及需要時(shí)間。許多領(lǐng)域,包括專業(yè)領(lǐng)域如midjourney和GEN2,甚至包括熱門(mén)產(chǎn)品如ChatGPT,都還沒(méi)有得到廣泛的了解。其次,模型的成熟度對(duì)用戶的接受程度有重要影響。如果用戶接觸到的產(chǎn)品不夠成熟,他們可能無(wú)法充分體驗(yàn)到大模型的能力,這可能直接降低他們對(duì)大模型的評(píng)價(jià)和付費(fèi)意愿。最后,付費(fèi)方式和費(fèi)用也是影響用戶付費(fèi)意愿的重要因素。如果付費(fèi)方式復(fù)雜或費(fèi)用過(guò)高,原有路徑依賴直接阻礙了用戶付費(fèi)。

  05

  技術(shù)是佐料,需求才是主菜

  教育信息化來(lái)說(shuō),一般情況下,購(gòu)買方往往是學(xué)校或教育局,而真正使用這些產(chǎn)品的卻是老師。只有深入了解教師在教學(xué)過(guò)程中面臨的實(shí)際問(wèn)題,推出的信息化產(chǎn)品才能真正提升教學(xué)效率。過(guò)于追求大屏幕或快速反應(yīng)等技術(shù)特性,往往只是企業(yè)自我陶醉。同理,此前線下培訓(xùn)為何受歡迎?原因在于,面對(duì)面的教學(xué)效果通常更好,而且家長(zhǎng)能把孩子交給老師,從而得到休息的時(shí)間。相較而言,盡管在線教育在某種程度上解決了學(xué)習(xí)問(wèn)題,但家長(zhǎng)仍需監(jiān)督孩子在家的學(xué)習(xí),家長(zhǎng)并沒(méi)有獲得整塊的休息時(shí)間。

  識(shí)別用戶需求并不簡(jiǎn)單,特別是在應(yīng)用大模型技術(shù)的過(guò)程中??赡芘c大模型簽約的并非實(shí)際的用戶,或者用戶根本無(wú)法表達(dá)出自己的實(shí)際需求。例如,在使用大模型實(shí)現(xiàn)學(xué)生答疑的時(shí)候,可能會(huì)以為學(xué)生只關(guān)注學(xué)習(xí)相關(guān)的問(wèn)題,但實(shí)際上,除了提問(wèn),許多學(xué)生更渴望的是交談的機(jī)會(huì)。有時(shí)候,學(xué)生說(shuō)出的十句話中,可能有九句是想與老師閑聊,但如果問(wèn)學(xué)生,學(xué)生說(shuō),“我就是想問(wèn)問(wèn)題”。

  因此企業(yè)必須深入理解用戶,尋找用戶真正的痛點(diǎn),而不是讓技術(shù)變成一種噱頭。技術(shù)本質(zhì)上是一種手段,而滿足用戶需求才是真正追求的目標(biāo)。

  當(dāng)然,大模型商用落實(shí)到實(shí)踐的時(shí)候,還有更多的問(wèn)題。我們也將在之后的文章中,逐一展開(kāi)。

  相關(guān)閱讀:

  普通教育從業(yè)者也能看得懂的GPT原理:知其厲害,知其所以厲害

  長(zhǎng)遠(yuǎn)看GPT等大模型對(duì)教育的影響

  (本文僅代表作者個(gè)人觀點(diǎn),供讀者參考。)