“AI是一個非常大的領(lǐng)域,我們只是在元蘿卜上做了第一步?!?/p>

商湯元蘿卜機器人的研發(fā)邏輯:“AI是效率、質(zhì)量、成本的最好結(jié)合”

2023-09-19 09:53:09發(fā)布     來源:多知網(wǎng)    作者:杜軒  

  來源|多知網(wǎng)

  整理|徐晶晶

  攝|張蔚斐

  2016、2017年,谷歌旗下DeepMind公司開發(fā)的Alpha Go先后戰(zhàn)勝李世石、柯潔等人類冠軍,“人機大戰(zhàn)”引發(fā)世界轟動。而第一款家庭端圍棋機器人——商湯元蘿卜圍棋機器人卻要到七年后才正式面世。

  在多知第42期OpenTalk活動現(xiàn)場,商湯科技創(chuàng)新工程院教學(xué)產(chǎn)品負責人杜軒解析了棋類機器人必備的三要素:人工智能是對人類行為的模擬,機器人要模擬人類感知世界進行思考,對外界做出反饋。如果類比成人類下棋的動作,Alpha Go的出現(xiàn)可以視作在算力算法層面率先實現(xiàn)突破,相當于下棋機器人有了大腦;機器人下棋也需要眼睛,這就需要依靠視覺識別技術(shù),辨別不同光線下棋子位置;第三,機器人下棋取子落子還需要手臂,高精度且高安全性的家用級機械臂技術(shù)的出現(xiàn),使得機器人的出現(xiàn)成為了可能。

  

  (商湯科技創(chuàng)新工程院教學(xué)產(chǎn)品負責人杜軒)

  正如商湯科技董事長兼CEO徐立在發(fā)布會中提到的:“從超大的數(shù)據(jù)中心到小巧的家用機器人,‘元蘿卜’的背后源于算力的巨大進步、極高的手眼協(xié)同精度和強大的工程創(chuàng)新成果。”

  在此三要素上,兼顧成本控制,下棋機器人才能更好地為C端市場所接受。在杜軒看來,“AI是效率、質(zhì)量、成本的最好結(jié)合。”

  那么,以To B業(yè)務(wù)起家商湯為什么要以圍棋機器人為切口,作為其第一款To C家庭端產(chǎn)品?

  “之所以會選擇機器人這種形式,是因為它是AI技術(shù)非常重要的載體。與AI技術(shù)發(fā)展的大趨勢也是相呼應(yīng),都是從感知到?jīng)Q策再到行動。”此前,商湯創(chuàng)新工程院院長、集團副總裁沈徽曾在元蘿卜發(fā)布會上表示。

  杜軒更進一步透露了商湯研發(fā)棋類機器人的思考:“我們想讓作為新技術(shù)的AI走進千家萬戶,而將新技術(shù)與中國傳統(tǒng)文化相結(jié)合是一個思路,象棋、圍棋都是中國傳統(tǒng)文化的典型代表,也是一個垂直細分的大市場。”

  2022年8月、2023年6月,商湯先后上線元蘿卜象棋版、圍棋版機器人。其中,元蘿卜圍棋版定位為陪練產(chǎn)品,“把機器人做難(高級別對弈)很容易,但是做到跟孩子的能力匹配(降級)是一個很難的過程。”在教育屬性之外,元蘿卜還具備家庭休閑、娛樂屬性。

  這兩款Q萌的機器人顯然受到了市場的歡迎。在2023年上半年業(yè)績報告中,商湯透露,元蘿卜單月銷量迅速破千臺,居天貓、京東雙平臺機器人品類交易排行榜第一。

  在家庭端產(chǎn)品之外,杜軒還透露元蘿卜走進圍棋課堂的最新思考——面向機構(gòu)和公立校推出圍棋智能教室,幫助老師提高教學(xué)效率。

  以下為杜軒分享原文,經(jīng)多知編輯整理:

  大家好,我是杜軒。希望跟大家一起探討人工智能能如何對棋類和其他的教育類產(chǎn)品產(chǎn)生更多的幫助。

  先介紹一下商湯科技的基本情況。商湯科技是一家業(yè)內(nèi)領(lǐng)先的人工智能公司,擁有超過百億AI基礎(chǔ)建設(shè)投入,超過1萬個專利,超過5000名員工,前段時間也推出了大模型。我們在很多領(lǐng)域也取得了很多成績,包括在自研深度學(xué)習(xí)框架、AR和識別與自動機器學(xué)習(xí)這些方面都取得很大的收獲。

  01

  從To B延展到To C場景,元蘿卜是怎樣誕生的?

  可以看到,以往商湯做了這么多事情,核心聚焦的是從科技領(lǐng)域切入服務(wù)B端、G端,那么,要想讓AI進入家庭,商湯要想進入To C的家庭端市場,可以提供什么樣的產(chǎn)品呢?

  我們的思考是,AI是最新的技術(shù),我們希望把最新的技術(shù)與中國的傳統(tǒng)文化相結(jié)合,比如象棋、圍棋都是中國傳統(tǒng)文化的精華,這兩個方向到底該怎么結(jié)合?我們先思考自身的優(yōu)勢:

  其一,商湯擁有家用級機械臂技術(shù)。以往,機械臂主要應(yīng)用場景是在工業(yè)領(lǐng)域,也很貴,也很笨重。商湯可以說是第一家把機械臂做到家庭領(lǐng)域的公司。機械臂是非常精密的技術(shù),要進入家庭,需要在縮小體積的同時提升更高的精準度,這需要突破很多技術(shù)難點,包括如何做到精準將每一顆棋子精準落到棋盤格上。

  其二是成本控制。進到家庭場景的消費級產(chǎn)品,其制作成本一定要降下來,才能普惠大眾,讓AI更好地服務(wù)大眾,讓更多家庭接觸、喜歡上象棋、圍棋這樣的國學(xué)文化。

  第三是安全性。小朋友在和小元蘿卜下棋的過程中會進行高頻互動,難免有所碰觸。為了確保家庭場景中機械臂足夠安全、不會對小朋友造成傷害,我們經(jīng)過多次研發(fā)和嘗試,最終做到機械臂在正常擺動不影響下棋效率的前提下做到接觸力最小,上市之初我們也對一些易碎產(chǎn)品進行了測試,均在機械臂的碰撞下不會產(chǎn)生破壞。

  因此,商湯從2020年開始研發(fā)元蘿卜,直到2022年才正式發(fā)布元蘿卜機器人。

  人工智能分兩方面,一方面是硬件部分,另一方面是軟件部分。剛剛提到的機械臂是硬件部分,它相當于真人落子的手臂。在軟件層面,我們也需要做很多:

  首先,圖像識別方面,利用全棧視覺算法精準識別。人工智能是對人類很多行為的模擬,要模擬我們?nèi)祟惛兄澜缛ニ伎?,對外界做出一個反饋的機制。所以第一步肯定要有視覺識別,它通過對不同光線下對棋子位置的識別,判斷要下一步落子??梢詫⑷珬R曈X算法簡單理解為機器人的眼睛。

  第二,語義分析方面,元蘿卜要從棋盤上分析出棋子的位置,通過對棋盤建模進行位置判斷。這就相當于是大腦,對弈的過程中,它不僅要能看到棋子、精準抓取棋子,它還要思考怎么跟人下才能獲勝。

  從最初入門級別到最高的職業(yè)級別,我們根據(jù)每個級別的棋力都做了一個相對應(yīng)的算法匹配。對于級別匹配,其實做到難(高級別)很容易,但是做簡單級別比做難級別(降級)要更難。比如一個小朋友剛學(xué)習(xí)下圍棋不久,下得不是很好,可能犯一些錯誤,機器人跟他下,怎么讓小朋友覺得自己跟機器人是一個水平的,有勝有負,這樣才不會打擊小朋友的自信心,這個其實很難。

  此外還要結(jié)合機器算法和仿真模擬算法,確保機器人對環(huán)境的認知,能更快適應(yīng)這個物理世界,通過算法可提高效率降低成本。

  基于以上,我們把元蘿卜象棋機器人、圍棋機器人先后生產(chǎn)出來了。當然,圍棋機器人的取子結(jié)構(gòu)比象棋更復(fù)雜,它的機械臂精度要更復(fù)雜。

  有了硬件和軟件的技術(shù)加持,誕生了這兩款可愛的元蘿卜產(chǎn)品,它們能做什么呢?

  首先,我們跟中國象棋協(xié)會合作,做了象棋的教學(xué)與考級。

  這是一款在家庭中能夠幫助孩子做教學(xué)的機器人。它有機械臂、屏幕和語音,可以模擬真人教學(xué)講課,也能把教和練結(jié)合在一起,在棋盤上擺棋子。教完之后,元蘿卜可以讓孩子嘗試一下這個棋可以怎么走,孩子走對則給予鼓勵,走錯的話則教孩子怎么走。

  在教和練之外,我們跟象棋協(xié)會合作做了在線考級,這是象棋領(lǐng)域第一款在線考級的產(chǎn)品,全國首個由官方授權(quán)的在線象棋考級機器人,也是我們弘揚中國文化的一次嘗試。

  其次,元蘿卜提供做題和復(fù)盤功能。

  其實市面上有很多軟件產(chǎn)品上也都可以幫孩子做題,但是做題的關(guān)鍵點不是判斷做對與否,而是當他做對了告訴他為什么是對的,當他做錯了分析哪是錯的。我們特意做了一些工作和努力,幫助孩子去理解。

  比如以往當孩子圍棋做題的時候,如果做錯了,很多軟件就是讓孩子重新試一遍。元蘿卜不是這樣的邏輯,而是告訴孩子:“你做錯了,我可以跟你繼續(xù)下,告訴你哪錯了。”在一些常見錯誤下,元蘿卜會告訴你,你這個錯誤為什么產(chǎn)生。

  第三就是非常重要的陪練功能。

  剛才提到,把機器人做難(高級別對弈)很容易,但是做到跟孩子的能力匹配(降級)是一個很難的過程。我們通過不斷細化級別,讓機器學(xué)習(xí)這個階段孩子常犯的錯誤,讓他們更有人的屬性。

  考慮到孩子們也喜歡跟真人對奕,我們也對接了一些線上對弈平臺(包括99圍棋、新博少兒、弈客和佳弈等),可以通過元蘿卜實現(xiàn)遠程真人對弈。這樣對孩子的視力健康也有幫助。

  除了有教育屬性之外,它還有一個非常重要的屬性即家庭休閑、娛樂屬性。全家人可以一起幫下棋的孩子支招;元蘿卜還有語音對話功能,問它一些簡單的問題都可以。

  Q萌的元蘿卜面世后,自然很受孩子們的歡迎。去年機器人大會上,元蘿卜被圍得里三層、外三層,家長、孩子都非常感興趣。

  

  02

  元蘿卜的更多可能:“圍棋智能教室”走進課堂

  其實在元蘿卜研發(fā)之初我們就在思考,除了可以在家庭生活中可以幫助孩子學(xué)習(xí)圍棋、象棋,元蘿卜是否可以走入教室輔助老師更好教學(xué),讓學(xué)生在課堂中有更深刻、更有趣的體驗?因此,未來我們也在暢想和探討一個全新的方向——讓元蘿卜走進課堂。

  大家都知道傳統(tǒng)圍棋教室是講臺上有一個立著的大棋盤,老師用它來教學(xué)演示,孩子用的是小棋盤。但是老師并不能時時觀察到每個孩子的動向。

  我們暢想未來的智能教室老師用一套智能教學(xué)系統(tǒng),可以直接在其中講課,也可以跟孩子做互動。

  教師端有一個設(shè)備,既可以用于教學(xué),也可以同步看到學(xué)生的對弈情況,還可以給學(xué)生下發(fā)任務(wù),也可以把學(xué)生做題過程拿出來做復(fù)盤講解。每個孩子面前有一臺元蘿卜設(shè)備,可以接收任務(wù),可以跟設(shè)備進行交互,完成練習(xí)過程。

  舉個例子來說,老師想讓孩子做一道圍棋題會是什么流程?

  在傳統(tǒng)教室里,老師講完課之后,會在大棋盤上把題做出來,下一步孩子需要解這道題的話,孩子執(zhí)黑或者執(zhí)白,要把兩方情況都想到,孩子如果想對則是非常順利的情況,但如果想錯的話,老師會看孩子完成情況,把錯誤之處記錄下來,然后在棋盤上擺出來。

  但是在智能教室里,老師講完課之后直接通過一體機把題目發(fā)到孩子那邊的機器上,每個孩子會看到這道題目,由機器擺好棋盤。老師發(fā)令后孩子可以直接做題。做題過程中老師可以實時看到每個孩子的情況,打開這個掛屏也可以做講解。

  可以看到,智能教室相對于傳統(tǒng)圍棋教學(xué)會有一些優(yōu)勢,首先會拉近老師和學(xué)生的距離,讓我們之間不再是老師是老師,學(xué)生是學(xué)生的狀態(tài)。老師可以在上面查看學(xué)生練習(xí)對弈的情況;同時也有記錄可以輕松復(fù)盤,老師很自由,如果看見存在的問題也不用立馬打斷,孩子先做,最后再調(diào)出來講解。同時我們能夠把整個教學(xué)過程中,孩子們遇到所有問題全部記錄下來,不管老師還是家長,后面對這些問題都會做包括復(fù)盤、了解、記錄,知道孩子什么地方有問題,后面可以去提高。

  對于公立校來說,現(xiàn)在圍棋協(xié)會、象棋協(xié)會都在推圍棋、象棋進學(xué)校,但很多學(xué)校開展不了是受限于圍棋老師的資源不足,因為這是比較專業(yè)的領(lǐng)域,學(xué)??赡軟]有專業(yè)的圍棋、象棋老師。

  針對這種情況,元蘿卜則提供了可能性,采用雙師模式,公立校老師可以先播放教學(xué)視頻,讓孩子看知識點。后面可以用元蘿卜練習(xí),幫助孩子們完成學(xué)習(xí)跟進。

  這是元蘿卜目前在To B方向的嘗試。

  AI是一個非常大的領(lǐng)域,我們只是在元蘿卜上做了第一步。暢想一下后面可以做什么?我們可以把孩子學(xué)習(xí)記錄,學(xué)情、診斷全部記錄下來,讓AI幫助孩子、幫助家長、老師定位孩子的問題,幫他做個性化方案,以及在過程中不斷跟進,調(diào)整,讓孩子按節(jié)奏去學(xué)習(xí)。

  在傳統(tǒng)教育里大家都想做這件事情,但是受限于效率、質(zhì)量、成本。這就是AI的優(yōu)勢,AI有大量算力和數(shù)據(jù)記錄可以確保這個事情完成。AI是效率、質(zhì)量、成本的最好結(jié)合。

  今天就分享到這兒,非常感謝大家。

  

  (現(xiàn)場觀眾體驗元蘿卜圍棋機器人)

  在演講后的Q&A互動環(huán)節(jié),對于觀眾提問的元蘿卜是否會推出國際象棋版本,杜軒表示,盡管象棋、圍棋已經(jīng)有元蘿卜機器人了,但國際象棋依然需要具體問題具體分析。國際象棋的棋子是立體棋子,不同于其它棋類棋子,他認為,國際象棋取子這個事情本身不復(fù)雜,但真正的挑戰(zhàn)在于,基于現(xiàn)有的產(chǎn)品框架上,受限于家庭空間,這類產(chǎn)品的體積不能太大。團隊內(nèi)部也在探討國際象棋機器人的市場需求和成本實現(xiàn)之間的可能性。

  有觀眾提問,元蘿卜圍棋版目前主要聚焦的是陪練場景,以后是否會發(fā)展成為教練?對此,杜軒分析了象棋、圍棋兩款產(chǎn)品不同的市場:“象棋是大家有基礎(chǔ),很少有人報班學(xué);會圍棋的人沒象棋那么多,但會的人基本都要報班學(xué)習(xí)。所以圍棋大家如果想往更專業(yè)方向走,會更多通過學(xué)校的方式來實現(xiàn),象棋則是普及為主。”