對(duì)于教育應(yīng)用場(chǎng)景來(lái)說(shuō),迎來(lái)更好的機(jī)會(huì)。

字節(jié)、阿里、百度開(kāi)打大模型價(jià)格戰(zhàn),應(yīng)用端即將崛起!

2024-05-21 18:10:50發(fā)布     來(lái)源:多知    作者:王上  

  多知5月21日消息,繼上周字節(jié)跳動(dòng)的大模型喊出比行業(yè)便宜99.3%之后,今天阿里云也宣布大模型降價(jià)了,緊跟著,百度智能云宣布文心大模型兩大主力模型全面免費(fèi),立即生效。

  5月15日上午,字節(jié)跳動(dòng)旗下云服務(wù)平臺(tái)火山引擎總裁譚待在發(fā)布會(huì)上正式宣布,字節(jié)跳動(dòng)自研豆包大模型對(duì)外提供服務(wù)。

  譚待稱(chēng),經(jīng)過(guò)一年時(shí)間的迭代和市場(chǎng)驗(yàn)證,豆包大模型正成為國(guó)內(nèi)使用量最大、應(yīng)用場(chǎng)景最豐富的大模型之一,目前日均處理1200億Tokens文本,生成3000萬(wàn)張圖片。

  根據(jù)在發(fā)布會(huì)披露數(shù)據(jù),豆包用戶(hù)規(guī)模在快速增長(zhǎng),月活用戶(hù)數(shù)已達(dá)2600萬(wàn),被創(chuàng)建智能體達(dá)800多萬(wàn)個(gè)。

  在定價(jià)方面,字節(jié)是第一家降價(jià)的大廠,譚待在發(fā)布會(huì)上宣布,豆包通用模型pro-32k版模型推理輸入價(jià)格僅為0.0008元/千Tokens,比行業(yè)低99.3%。

WechatIMG8.jpg

  一元錢(qián)就能買(mǎi)到豆包主力模型的125萬(wàn)Tokens,大約是200萬(wàn)個(gè)漢字,豆包稱(chēng),200萬(wàn)個(gè)漢字相當(dāng)于3本《三國(guó)演義》。

  緊跟著,5月21日,阿里云宣布,通義千問(wèn)GPT-4級(jí)主力模型Qwen-Long,API(應(yīng)用程序編程接口)輸入價(jià)格從0.02元/千tokens降至0.0005元/千tokens,降價(jià)幅度高達(dá)97%。

WechatIMG6.jpg

  這意味著,1元錢(qián)可以買(mǎi)200萬(wàn)tokens。阿里云稱(chēng),200萬(wàn)個(gè)漢字相當(dāng)于5本《新華字典》的文字量。這款模型最高支持1千萬(wàn)tokens長(zhǎng)文本輸入。

  而百度智能云直接在官方賬號(hào)宣布,文心大模型兩大主力模型ENIRESpeed、ENIRELite將全面免費(fèi)全面免費(fèi),上下文長(zhǎng)度為8K、128K。

WechatIMG7.jpg

  值得注意的是, 百度 文心大模型系列包括:旗艦版的ERNIE3.5和4.0,和輕量版的ERNIE Speed、Lite、Tiny等。也就是說(shuō),百度宣布免費(fèi)的是小尺寸的模型ENIRESpeed和ENIRELite。

  具體來(lái)看,ERNIE Speed是百度在2024年發(fā)布的自研高性能大語(yǔ)言模型,通用能力優(yōu)異,適合作為基座模型進(jìn)行精調(diào),更好地處理特定場(chǎng)景問(wèn)題,同時(shí)具備極佳的推理性能;ERNIE Lite則是百度自研的輕量級(jí)大語(yǔ)言模型,兼顧優(yōu)異的模型效果與推理性能,適合低算力 AI 加速卡推理使用。

  但小尺寸的模型可能對(duì)于不少創(chuàng)業(yè)公司已經(jīng)夠用。百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏在Create 2024百度AI開(kāi)發(fā)者大會(huì)上曾解釋?zhuān)?nbsp;“小模型推理成本低,響應(yīng)速度快,在一些特定場(chǎng)景中,經(jīng)過(guò)SFT(監(jiān)督)精調(diào)后的小模型,它的使用效果可以媲美大模型。這就是我們發(fā)布ERNIE Speed、Lite、Tiny三個(gè)輕量模型的原因。”

  不但是大廠降價(jià)了, 最近,大模型初創(chuàng)公司智譜AI將旗下入門(mén)級(jí)大模型GLM-3-Turbo(128K上下文)的價(jià)格從0.005元/千tokens降低到0.001元/千tokens,降幅達(dá)80%。私募巨頭幻方量化旗下的大模型DeepSeek-V2(32K上下文)價(jià)格降至每千tokens輸入0.001元、輸出0.002元。

  對(duì)比國(guó)外,國(guó)外廠商GPT-4、Gemini1.5 Pro及Claude 3 Sonnet每千tokens輸入價(jià)格分別為0.22元、0.025元及0.022元,均遠(yuǎn)高于國(guó)內(nèi)的價(jià)格。

  可以看到,大廠們讓大模型價(jià)格“卷”起來(lái)了,預(yù)示著大模型的商業(yè)化更進(jìn)一步,但也讓一些直接研發(fā)大模型的創(chuàng)業(yè)公司面臨更殘酷的競(jìng)爭(zhēng),同時(shí),也預(yù)示著應(yīng)用端即將崛起。

  有“教育+AI Agent”項(xiàng)目創(chuàng)始人向多知提到:“對(duì)于我們這些初創(chuàng)公司而言,在調(diào)用大模型的時(shí)候非常注重價(jià)格,價(jià)格低的產(chǎn)品對(duì)我們更有吸引力。尤其是AI Agent,需要調(diào)用不同的大模型。”

  不過(guò)也有業(yè)內(nèi)人士提到:“大模型的應(yīng)用,不僅要看價(jià)格,還要看應(yīng)用效果和響應(yīng)速度。”

  不論如何,對(duì)于教育應(yīng)用場(chǎng)景來(lái)說(shuō),迎來(lái)更好的機(jī)會(huì),未來(lái)將有更多大模型應(yīng)用落地。(多知 王上)