大模型應(yīng)用的商業(yè)化進(jìn)展慢，為什么慢？

2023-07-05 10:09:32發(fā)布來(lái)源：多知網(wǎng) 作者：大力正手

　　文|大力正手教育行業(yè)研究者

　　編者按：

　　本文系多知網(wǎng)約稿。當(dāng)前，不完全統(tǒng)計(jì)國(guó)內(nèi)有超過(guò)80個(gè)基礎(chǔ)大模型，對(duì)于大模型來(lái)說(shuō)，參與開(kāi)發(fā)的畢竟是少數(shù)企業(yè)，中小企業(yè)更多的是使用者。但是，到現(xiàn)在真正應(yīng)用大模型的商業(yè)化并不突出。本文作者從幾個(gè)角度來(lái)解釋大模型應(yīng)用商業(yè)化進(jìn)展緩慢的原因，并認(rèn)為技術(shù)本質(zhì)上是一種手段，而滿足用戶需求才是真正追求的目標(biāo)。

　　自2022年底ChatGPT發(fā)布后，截止6月份，國(guó)內(nèi)企業(yè)已經(jīng)發(fā)布了約80個(gè)基礎(chǔ)大模型，打著AI旗號(hào)的產(chǎn)品更數(shù)不勝數(shù)。但實(shí)際上大模型的商業(yè)化一直存問(wèn)題，可以說(shuō)，并沒(méi)有幾家企業(yè)在大模型領(lǐng)域真正產(chǎn)生大額收入，其收入可能僅占估值的1/100，絕大部分都是靠著融資以及創(chuàng)始人自有資金將企業(yè)往前推進(jìn)。文章將從幾個(gè)角度來(lái)解釋大模型應(yīng)用的商業(yè)化進(jìn)展緩慢的原因。

　　大模型還不足夠好，小概率但可能是大風(fēng)險(xiǎn)

　　當(dāng)你問(wèn)早期ChatGPT3.5“林黛玉為什么會(huì)倒拔垂楊柳”，他回答說(shuō)“因?yàn)榱主煊癖瘋^(guò)度，倒拔垂楊柳緩解悲傷情緒”;早期的文心一言更是會(huì)回答一些匪夷所思的答案。這就是模型幻覺(jué)——一本正經(jīng)胡說(shuō)八道。但當(dāng)GPT-4出來(lái)后，再問(wèn)他“林黛玉為什么會(huì)倒拔垂楊柳”，他會(huì)告訴你“林黛玉是紅樓夢(mèng)的人物，倒拔垂楊柳是水滸傳的情節(jié)，兩個(gè)不能放在一起”。更精準(zhǔn)的回答，正是模型幻覺(jué)的減少，這也意味著大模型正在越來(lái)越好。

　　然而，盡管大規(guī)模模型的性能正在改善，但他們依舊存在缺陷。在商業(yè)應(yīng)用中，我們必須從小概率風(fēng)險(xiǎn)的角度去考慮。盡管GPT-4的錯(cuò)誤可能相對(duì)較小，但在某些關(guān)鍵領(lǐng)域，如航空和醫(yī)療，即使只有一次的錯(cuò)誤，也可能帶來(lái)嚴(yán)重后果。因此，我們發(fā)現(xiàn)大模型最先被應(yīng)用于容錯(cuò)率較高的行業(yè)，如聊天、游戲、社交等，因?yàn)樵谶@些領(lǐng)域，偶爾的錯(cuò)誤不會(huì)帶來(lái)嚴(yán)重的影響。另一種情況，大模型作為輔助決策的存在，如辦公場(chǎng)景中的會(huì)議摘要等，這也就意味著，在最終的產(chǎn)品或者內(nèi)容觸達(dá)用戶之前，肯定有人的參與，來(lái)作為剔除小概率風(fēng)險(xiǎn)的保障。

　　大模型還不夠穩(wěn)，宕機(jī)了企業(yè)惹不起

　　GPT-4是目前最先進(jìn)的大型人工智能模型，其優(yōu)越的邏輯推理能力引領(lǐng)著業(yè)界的發(fā)展趨勢(shì)，國(guó)內(nèi)的研發(fā)也在不斷向GPT-3.5靠近。然而，對(duì)于中國(guó)的C端用戶而言，OpenAI的賬戶使用門(mén)檻較高，需要海外的郵箱、手機(jī)號(hào)和銀行賬戶，這使得只有少部分人能夠獲取到優(yōu)質(zhì)的GPT-4服務(wù)。對(duì)于國(guó)內(nèi)的B端企業(yè)希望使用GPT，一方面受限于國(guó)內(nèi)法規(guī)限制，一方面open ai不定期對(duì)亞太地區(qū)特別是中國(guó)大陸進(jìn)行封號(hào)，使得B端企業(yè)很難獲得穩(wěn)定的api接口。雖然可以通過(guò)微軟云服務(wù)的方式接入，但也存在著一定的不確定性。

　　在商用領(lǐng)域，穩(wěn)定性是至關(guān)重要的。就像游戲體驗(yàn)中，最讓人破防的的往往是突然的宕機(jī)，而這在ChatGPT這樣的世界級(jí)產(chǎn)品中也出現(xiàn)過(guò)多次。對(duì)于依賴GPT-3.5或4作為底層模型的企業(yè)，用戶會(huì)對(duì)任何宕機(jī)行為產(chǎn)生抱怨，但他們不會(huì)關(guān)心問(wèn)題的來(lái)源，只會(huì)感到服務(wù)的中斷并把憤怒發(fā)泄到企業(yè)。通常，企業(yè)會(huì)選擇備用模型以應(yīng)對(duì)核心模型的突然問(wèn)題，然而目前在商用層面特別是國(guó)內(nèi)，還沒(méi)有能真正匹敵GPT-4的模型。這意味著，即使備用模型能保證穩(wěn)定性，其效果和用戶體驗(yàn)卻可能大大低于以前，這是所有企業(yè)都不愿意看到的。

　　大模型還不夠便宜，模型之外還有成本

　　對(duì)于基礎(chǔ)大模型的開(kāi)發(fā)，這顯然不是所有企業(yè)都能參與其中的，其訓(xùn)練成本極其高昂。對(duì)于大多數(shù)人來(lái)說(shuō)，更多地是從使用者的角度與大模型打交道。盡管對(duì)于采用大模型的企業(yè)來(lái)說(shuō)，API的價(jià)格已經(jīng)大幅降低，比如2023年3月份ChatGPT API的價(jià)格比2022年底下滑了90%，而在2023年6月份，輸入端的價(jià)格再次降低了25%。即使如此，這種新型的計(jì)算方式相較于傳統(tǒng)的運(yùn)算方式依然更加昂貴。據(jù)路透社報(bào)道，谷歌的母公司Alphabet的董事長(zhǎng)John Hennessy表示，與大型語(yǔ)言模型進(jìn)行交互的成本可能是進(jìn)行標(biāo)準(zhǔn)關(guān)鍵詞搜索的10倍。所以，雖然大模型的使用成本已經(jīng)在不斷下降，但其價(jià)格依然不菲。

　　另外，僅僅將大模型接入到特定的領(lǐng)域，可能并不能達(dá)到最佳的效果。因此，在接入API并將其投入商用之前，企業(yè)還需要在諸多方面付出額外的成本。這包括數(shù)據(jù)準(zhǔn)備和預(yù)處理的成本、模型訓(xùn)練和調(diào)優(yōu)的成本、部署和運(yùn)維的成本、模型更新和迭代的成本，以及法規(guī)合規(guī)的成本。所有這些因素都使得應(yīng)用大模型的總體成本依然很高。

　　以科大訊飛的學(xué)習(xí)機(jī)T20為例，由于其搭載了星火大模型，其價(jià)格比前一代的T10高出2000元。據(jù)業(yè)內(nèi)人士透露，這額外的2000元其實(shí)并沒(méi)有覆蓋大模型的成本?？紤]到市面上一臺(tái)普通的學(xué)習(xí)機(jī)，其硬件制造和版權(quán)購(gòu)買的總成本也僅在1000-1500元左右，這就更加凸顯了大模型在商業(yè)應(yīng)用中的高昂成本。

　　靠大模型創(chuàng)收，難，很難，特別難

　　商業(yè)得以運(yùn)轉(zhuǎn)，核心是收益能否超越成本。目前的商業(yè)環(huán)境已經(jīng)不再青睞通過(guò)燒錢(qián)搶占市場(chǎng)或者策略性虧損的策略，而是更傾向于自我造血的企業(yè)。然而大模型領(lǐng)域的企業(yè)自我造血能力均欠佳。

　　以目前的頭部大模型企業(yè)為例。OpenAI是目前最知名的AI大模型公司，雖然他們已經(jīng)籌集了超過(guò)100億美元的資金，并且公司估值達(dá)到了290億美元，但是他們預(yù)計(jì)在2023年的收入只有2億美元。另一個(gè)例子是Hugging Face，作為全球最大的AI/ML社區(qū)和平臺(tái)，同時(shí)也是最重要的大模型基礎(chǔ)設(shè)施之一，他們的估值是20億美元，但growjo對(duì)其年收入預(yù)估僅0.3億美元。另一家獨(dú)角獸公司Adept AI，他們是AI助手(大模型應(yīng)用)的開(kāi)發(fā)者，雖然他們籌集了4.1億美元的資金，公司估值達(dá)到了10億美元，但growjo對(duì)其年收入預(yù)估只有0.04億美元，可以說(shuō)幾乎還沒(méi)有商業(yè)化。

　　國(guó)內(nèi)的各大模型公司，例如百度、阿里、騰訊、華為等，雖在大模型領(lǐng)域有所布局，但并未從中獲取實(shí)質(zhì)性的豐厚收益。此外，大模型領(lǐng)域的中小型獨(dú)立企業(yè)，其收入可能僅為公司估值的百分之一。尤其對(duì)于直面C端用戶的產(chǎn)品，大公司在沒(méi)有全面考慮的策略前，往往謹(jǐn)慎行事，不輕易推向市場(chǎng)。因此，像文心一言、通義千問(wèn)、星火大模型等產(chǎn)品，都需要用戶申請(qǐng)才能使用，而非直接面向公眾。對(duì)于中小型公司，雖然它們能迅速推出產(chǎn)品，但由于資金等限制，產(chǎn)品往往處于冷啟動(dòng)，推廣困難，因此大模型領(lǐng)域的小公司用戶數(shù)通常較少。

　　大模型的確是一項(xiàng)優(yōu)秀的技術(shù)，但它當(dāng)前的價(jià)值更多地體現(xiàn)在"錦上添花"，而不是"雪中送炭"。也就是說(shuō)，大模型帶來(lái)的邊際價(jià)值，并未能滿足市場(chǎng)的剛需。從商業(yè)模式上看，大部分的產(chǎn)品都是以原產(chǎn)品的增值服務(wù)的方式提供，而非推出獨(dú)立產(chǎn)品。如多鄰國(guó)的涵蓋大模型AI能力的增值訂閱服務(wù)，售價(jià)30美元/月;Quizlet的增值服務(wù)AI導(dǎo)師Q-chat，訂閱費(fèi)用為3.99美元/月。

　　大模型的上游企業(yè)收取中游企業(yè)的接入費(fèi)，而中游企業(yè)則通過(guò)向下游用戶收費(fèi)來(lái)提供基于大模型的產(chǎn)品。最終，是用戶的需求驅(qū)動(dòng)了整個(gè)市場(chǎng)。但是，為什么用戶不愿意為大模型付費(fèi)呢?

　　首先，AI領(lǐng)域的發(fā)展和普及需要時(shí)間。許多領(lǐng)域，包括專業(yè)領(lǐng)域如midjourney和GEN2，甚至包括熱門(mén)產(chǎn)品如ChatGPT，都還沒(méi)有得到廣泛的了解。其次，模型的成熟度對(duì)用戶的接受程度有重要影響。如果用戶接觸到的產(chǎn)品不夠成熟，他們可能無(wú)法充分體驗(yàn)到大模型的能力，這可能直接降低他們對(duì)大模型的評(píng)價(jià)和付費(fèi)意愿。最后，付費(fèi)方式和費(fèi)用也是影響用戶付費(fèi)意愿的重要因素。如果付費(fèi)方式復(fù)雜或費(fèi)用過(guò)高，原有路徑依賴直接阻礙了用戶付費(fèi)。

　　技術(shù)是佐料，需求才是主菜

　　教育信息化來(lái)說(shuō)，一般情況下，購(gòu)買方往往是學(xué)校或教育局，而真正使用這些產(chǎn)品的卻是老師。只有深入了解教師在教學(xué)過(guò)程中面臨的實(shí)際問(wèn)題，推出的信息化產(chǎn)品才能真正提升教學(xué)效率。過(guò)于追求大屏幕或快速反應(yīng)等技術(shù)特性，往往只是企業(yè)自我陶醉。同理，此前線下培訓(xùn)為何受歡迎?原因在于，面對(duì)面的教學(xué)效果通常更好，而且家長(zhǎng)能把孩子交給老師，從而得到休息的時(shí)間。相較而言，盡管在線教育在某種程度上解決了學(xué)習(xí)問(wèn)題，但家長(zhǎng)仍需監(jiān)督孩子在家的學(xué)習(xí)，家長(zhǎng)并沒(méi)有獲得整塊的休息時(shí)間。

　　識(shí)別用戶需求并不簡(jiǎn)單，特別是在應(yīng)用大模型技術(shù)的過(guò)程中?？赡芘c大模型簽約的并非實(shí)際的用戶，或者用戶根本無(wú)法表達(dá)出自己的實(shí)際需求。例如，在使用大模型實(shí)現(xiàn)學(xué)生答疑的時(shí)候，可能會(huì)以為學(xué)生只關(guān)注學(xué)習(xí)相關(guān)的問(wèn)題，但實(shí)際上，除了提問(wèn)，許多學(xué)生更渴望的是交談的機(jī)會(huì)。有時(shí)候，學(xué)生說(shuō)出的十句話中，可能有九句是想與老師閑聊，但如果問(wèn)學(xué)生，學(xué)生說(shuō)，“我就是想問(wèn)問(wèn)題”。

　　因此企業(yè)必須深入理解用戶，尋找用戶真正的痛點(diǎn)，而不是讓技術(shù)變成一種噱頭。技術(shù)本質(zhì)上是一種手段，而滿足用戶需求才是真正追求的目標(biāo)。

　　當(dāng)然，大模型商用落實(shí)到實(shí)踐的時(shí)候，還有更多的問(wèn)題。我們也將在之后的文章中，逐一展開(kāi)。

　　相關(guān)閱讀：

　　普通教育從業(yè)者也能看得懂的GPT原理：知其厲害，知其所以厲害

　　長(zhǎng)遠(yuǎn)看GPT等大模型對(duì)教育的影響

　　(本文僅代表作者個(gè)人觀點(diǎn)，供讀者參考。)

商學(xué)院

Open Talk

大模型應(yīng)用的商業(yè)化進(jìn)展慢，為什么慢？

相關(guān)閱讀

商學(xué)院

Open Talk

大模型應(yīng)用的商業(yè)化進(jìn)展慢，為什么慢？

相關(guān)閱讀

大模型應(yīng)用的商業(yè)化進(jìn)展慢，為什么慢？