AI 正在從生產(chǎn)工具的角色中抽身,緩慢卻堅定地走向一個全新的方向——情緒陪伴。
當算法不再只為效率服務,越來越多的產(chǎn)品開始嘗試構(gòu)建"有靈魂"的存在。無論是可以掛在胸前、隨時回應你情緒的小型硬件,能夠在家中自由行走、具備寵物屬性的機器人,還是在手機里與你聊天、分享生活的虛擬人,這一代 AI 的設計邏輯已經(jīng)從"怎么幫你完成任務",轉(zhuǎn)向"怎么陪你過日子"。
在很多創(chuàng)業(yè)者和投資人眼中,這場轉(zhuǎn)向并非偶然。過去的泡泡瑪特用"盲盒"抓住了年輕人對情緒出口與文化符號的渴望,如今在 AI 的浪潮下,情緒消費需求也浮出了水面,成為新一代人的"低門檻關(guān)系連接器"。尤其在兒童、青少年和老年人等孤獨感更高、陪伴需求更明確的群體中,AI 產(chǎn)品已不再只是"好玩",而是真正進入了生活的縫隙中。
這不是一個簡單的賽道,也不是"把 ChatGPT 換個殼"就能跑出來的機會。AI 陪伴的挑戰(zhàn)在于,它必須同時處理好技術(shù)的可控性、產(chǎn)品的沉浸感、人設的鮮活度和互動的自然性。既要保持低干擾,又要能在需要時提供回應;既不能工具化得太快,又不能抽象得太空。這其中的尺度拿捏、角色定義、人群定位,正是不同產(chǎn)品做出差異化的關(guān)鍵。
6月21日上午,雷峰網(wǎng)AI 科技評論組織了一場圍繞"AI 陪伴"的線上圓桌,支持人為初代 AI 投資人王捷,并邀請了靈宇宙創(chuàng)始人顧嘉唯、可以科技創(chuàng)始人楊健勃,以及 Soul 的 AI 技術(shù)負責人尹順順,來試圖回答一個更長遠的問題:當技術(shù)真正擁有陪伴的能力的時候,是否能孕育出下一個"泡泡瑪特"式的大眾情緒產(chǎn)品?
以下是此次討論的精彩分享,雷峰網(wǎng)AI 科技評論進行了不改原意的編輯整理:
一、AI 陪伴是偽命題嗎?
王捷:歡迎各位朋友來到 AI 科技評論的 GAIR Live 線上論壇,我是投資人王捷,今天我們做一個AI 陪伴相關(guān)的討論。
AI 陪伴產(chǎn)品,用英文"Companion"這個詞來表達可能會更加合適,因為我們希望這個產(chǎn)品既可以提供工具價值,比如給我們提供一些指導和建議,也會提供一些情緒價值。最近有一個新聞很火爆,OpenAI 以 65 億美元收購前蘋果首席設計師創(chuàng)辦的 AI 硬件初創(chuàng)公司 io,并且宣布會向硬件進軍。OpenAI 也要做陪伴硬件,那這個賽道是不是要有一些新變革了?
今天我們很榮幸也很高興邀請到了幾位在 AI 硬件和 AI 軟件方面,做陪伴產(chǎn)品的創(chuàng)業(yè)者和企業(yè)高管:
嘉唯總是中國做人機交互的優(yōu)秀代表,上一代產(chǎn)品 Luka 是已經(jīng)驗證的、出貨量非常大的AI硬件;健勃總從可編程機器人開始,在賽道上已經(jīng)耕耘超過十年,積累了陪伴型硬件的大量know how;順順總在 Soul 負責 AI,我們知道 Soul 是近十年社交賽道在巨頭環(huán)伺情況下跑出來的最大的創(chuàng)業(yè)公司之一。
我自己算是初代 AI 投資人,從 17 年開始從事 AI 投資,早期投資過摩爾線程、比亞迪半導體、萬國數(shù)據(jù)、京東科技、開思時代、奇安信以及成長期的明略科技等公司,也一直非常關(guān)注 AI 大模型這一波會給人與人關(guān)系帶來的變化,包括 AI 提供陪伴功能。
我們一聊到 AI 陪伴,就會有這樣一個爭論,很多人都會問,AI 陪伴是不是一個偽命題?比如聊天機器人 App,我們想聊天的時候跟 ChatGPT 聊天就好了,現(xiàn)在很多 00 后在生活上和人生選擇上,都會找 ChatGPT 和 DeepSeek 聊聊,比家長的話都管用。那這種情況下,我們?yōu)槭裁催€需要一個專門的 AI 產(chǎn)品呢?我們先請順順聊聊,因為 Soul 已經(jīng)是移動互聯(lián)網(wǎng)時代在社交領(lǐng)域非常有成就的一個公司了。
尹順順:謝謝王捷的介紹。我分幾個維度說:首先,我覺得從對話效果層面上來講,很多做過 AI 陪伴的同行,或者真正用過 ChatGPT 去做角色扮演的用戶可能都知道,用 ChatGPT 做對話會有一些問題,比如說老師傅、尬聊、人設太對齊等。從語氣、措辭和一些說話方式上就能感覺到,不太像和真人之間交流的感覺,ChatGPT 永遠是長篇大論,語氣特別書面化,我們把這種語言習慣叫做"老師傅",這是一個到現(xiàn)在還存在的問題。
還有就是人設太對齊的問題。這不是一個共識,可能有些同行還會覺得這是優(yōu)點,但是我們在實際工作中發(fā)現(xiàn),如果你用 ChatGPT 去捏了一個瑜伽老師的人設 prompt,那你不管跟這個"瑜伽老師"聊什么,它總會有意無意地把你拋出去的話題往瑜伽話題上去轉(zhuǎn),那用戶可能很快就會膩了。比如 OpenAI 推出的"Monday",它的風格永遠是厭世風或者毒舌風。剛出來的時候,大家還想嘗鮮,后來就會發(fā)現(xiàn),不論聊什么都是一個模式或者Loop,有了這樣的預期之后,用戶可能很快就不會再用了。
人設太對齊對應著一些工具感,如果用戶覺得有工具感,這個產(chǎn)品就很難占領(lǐng)陪伴的心智。泡泡瑪特內(nèi)部也說了,他們要盡量去做 IP,而不是把 Labubu 實用化或者工具化。一旦工具化了,比如說你把它做成一個計算器,那么用戶買了之后會認為,我不如去買計算器,所以很多時候情緒價值跟工具價值是不對等的。
Soul 在這方面的努力也是讓 AI 更有活人感,更像真人。讓用戶很難去發(fā)現(xiàn)里面有所謂的模式或 Loop,這就是對話層面要達到的效果。
從產(chǎn)品層面上來說,AI 陪伴產(chǎn)品肯定不只有對話一個模塊,好的 AI 陪伴產(chǎn)品需要非常多的功能和 feature,還需要一些 UI 設計來提升用戶的陪伴沉浸感。比如你去做心理理療,你會用到沙盤等等讓人有治愈感的 UI 設計或者小功能。Soul 的虛擬伴侶,其實也花了很大的精力去打造了一個虛擬人人設和 IP 感,這個虛擬人每天都會發(fā)一些內(nèi)容和視頻,就是要增強用戶對他的人設的認知。
產(chǎn)品是各家 AI 陪伴能夠打出差異化的重要部分,我理解的陪伴是情緒價值的需求,這個需求滿足更難、更玄學、更主觀,沒有一個普世的對錯,可能也沒有一個普世的方法,不同的人群有不同的需求,很有可能就是當前ChatGPT 不擅長的。
王捷:尹總的觀點是當前有的產(chǎn)品存在"老師傅語言習慣"和"人設太對齊"兩個問題,我們還是需要一個專門的陪伴產(chǎn)品,讓AI 更有活人感,更像真人。
尹順順:對。因為我們之前也想驗證這個問題,所以我們在站內(nèi)也做過些 A/B 測試,我們發(fā)現(xiàn)我們自研的模型指標是斷崖式領(lǐng)先的。
楊健勃:我們是專注在家庭機器人產(chǎn)品的,Loona 是一款在家里面能夠自由運動的一個小狗,可以跟你跑,跟你回家。尹總剛才是從軟件上分析,Loona 上線到現(xiàn)在,我們觀察到一些機會點:用在什么場景下聊天的輪次最多?最后我們發(fā)現(xiàn)并不是 1v1 聊天的時候,而是用戶在玩的時候,比如說拼樂高的時候。我們把它叫做"第一身位"。
你對著 ChatGPT 和類似產(chǎn)品的UI,有一個任務想跟他聊的時候,就打開對話框,產(chǎn)生某種交互。在工作和效率場景下都是一對一的聊天,你是全身心投入的。
回到陪伴上來說,我們觀察人生活中的各種角色,比如說愛人、小朋友、寵物,以及其他帶給你情緒價值的角色,我們發(fā)現(xiàn)大部分的時間,他們并不是在跟你專注地溝通。我們把這種狀態(tài)叫做"存在",有一部分機會是來自于這種存在,在家庭生活的各個方面,交互會非常的便捷,不需要專門開啟一段對話,可是在做某件事情的時候,對話自然而然地展開了。AI 陪伴就是這樣一個隨身、便捷、能夠跨越不同時間和空間的產(chǎn)品。
王捷:Loona 團隊是國內(nèi)在這個賽道上面深耕時間最長的團隊之一,健勃提到了"第一身位"和"存在狀態(tài)"。我們聽聽嘉唯的看法。
顧嘉唯:大家好,我現(xiàn)在在做的產(chǎn)品主要有兩條業(yè)務線,其中之一就是今年頗受關(guān)注的隨身設備,我們稱其為"靈宇宙 AI 小方機"。
12 年前我定義 BaiduEye 時,就盼著能達成電影《Her》里呈現(xiàn)的場景。電影里有個折疊屏手機,外側(cè)是黑白墨水屏,還有個小情節(jié),主角外衣口袋里裝著這個 AI-OS 的智能設備,用別針把機器固定位置是把智能終端背面攝像頭位置頂出來口袋,能看世界,搭配耳機,胸前設備就是核心智能體,靠攝像頭和耳機感知、交互。
我在百度探索 BaiduEye 時,覺得隨身設備能覆蓋全場景、做豐富交互,是新機會。當時在大廠想做更炫酷的東西,一開始內(nèi)部想做帶顯示成像的眼鏡,可我之前在微軟做過顯示類眼鏡,深知光機顯示在消費電子產(chǎn)品定義的難題很難解決,就砍掉光機,做了視覺輸入、語音對話的產(chǎn)品。十幾年過去,如今光機成熟度今非昔比,蘋果出了 Vision Pro,小米也有小米眼鏡,各類廠商都在布局 AI 眼鏡。
剛才順順和健勃都聊了我們的陪伴產(chǎn)品與 ChatGPT 的差異。關(guān)鍵在于,陪伴產(chǎn)品能以非沉浸式的狀態(tài)隨時切入話題,在產(chǎn)品旁會很舒服,就像有靈魂伴侶:即便共處時不交流、沒有沉浸式互動,狀態(tài)也很好。這是ChatGPT 這類工具產(chǎn)品給不了的。
回到《Her》的場景,我想做獨立計算終端,可眼鏡要成為獨立計算終端,至少還得 5 - 10 年以上,畢竟手機很難從中心地位挪開。做 AI 陪伴,找獨立計算終端,難點在于讓這款 AI 硬件遠離手機。
怎么找遠離手機的人群和用戶?這很有挑戰(zhàn)。對青少年和孩子而言,家長不愿給他們手機,又想讓孩子跟上 AI 時代,給個豆包、DeepSeek 用,那隨身終端就最合適。
終端的價值在于,當下技術(shù)尚未收斂,陪伴也遠沒到真正收斂的地步。AI 陪伴不像智能眼鏡,有清晰的收斂方向,比如輕薄、無感知、長待機等。AI 陪伴的定義很模糊,啥是 AI 陪伴?我們小時候的安撫毯算陪伴不?各類小玩具呢?到如今,日常解決問題的工具,用久了產(chǎn)生粘性,也可能成為陪伴。
泡泡瑪特王寧成功后,常有人用幸存者偏差看成功創(chuàng)業(yè)者的話。雖然現(xiàn)在大家都在推崇 "無用之用",但在做 Luka 盧卡時我們并非追求 "無用之用"。我當年目標清晰,家長一晚上要給孩子讀好多繪本,Luka 盧卡就能幫家長把繪本講好。我們用圖像識別技術(shù)給機器人加攝像頭,繪本放面前,翻到哪講到哪,還能對話交互,把繪本講 "活",這就是終端的價值。
如今 AI 來了,產(chǎn)品不只是以前的 OCR 轉(zhuǎn) TTS、單純圖像識別,多模態(tài)大模型能把任何內(nèi)容講成故事。這就是終端,終端價值在于隨技術(shù)代次升級,不斷演進、OTA 更新。
我覺得工具和情感不應該是非此即彼,本質(zhì)是動態(tài)函數(shù),依場景需求和陪伴生命周期長度,決定函數(shù)數(shù)值的動態(tài)變化。
二、誰最需要 AI 陪伴?
王捷:剛才嘉唯提到好幾個很重要的點,和健勃的"存在狀態(tài)"呼應的"ambient狀態(tài)"、非手機的獨立終端如何能成立、是否做"無用之用"、工具價值和情感價值的動態(tài)配比。
剛剛講到小朋友需要讀繪本的事情。睡前故事是一個很親密的場景,我們可以想象一下,一個小朋友從3歲開始有AI玩偶講睡前故事,之后有小方機這樣的隨身硬件,可以說從小就已經(jīng)習慣了生活中有一個 AI companion 的存在。到15 歲,人的世界觀就基本定型了,那這批人就是 AI Native 的第一代人。對于20 后的小朋友,AI陪伴是天經(jīng)地義的,這就是他認識的世界。
另外一個問題是,我們面對的人群有兒童、青少年、青年、中老年、女性、男性等等,對于不同的人群來說,他們對于 AI companion 的接受度是怎樣的?
顧嘉唯:就 AI 產(chǎn)品本身,我認為當下不會像上一個周期那樣,需要通過細分人群來定義產(chǎn)品。因為 AI 的天然核心價值,就是從第一天起就具備極度個性化的特質(zhì)——它不是把已有的 PGC 和 UGC 內(nèi)容,通過簡單推薦函數(shù)鏈接給用戶,而是基于你的表情、年齡、狀態(tài)、上下文語境,以及這一天交流過的話題、過去 5 年甚至 30 年積累的數(shù)據(jù),AIGC 來生成當下的內(nèi)容。甚至未來所有的UI都會完全實時生成,不再是基于模板的呈現(xiàn)。
從終局視角來看,今天定義產(chǎn)品也不應該區(qū)分人群。但是AI 需要積累足夠長時間的連續(xù)數(shù)據(jù)流,才能為你提供當下的最優(yōu)解。
下一代年輕人可能是最好的選擇。上一個世代稱為Z世代,下一個叫Alpha 阿爾法世代——他們是智能時代的原住民。
他們是Luka 盧卡的核心用戶。現(xiàn)在這波人長大了,到了使用兒童手表、學習機的年紀,到了隨時隨地需要AI解決問題的階段,我們就為他們提供靈宇宙小方機。我們切入的,是尚未被手機占據(jù)的人群,原因也在于剛才說的數(shù)據(jù):我更在意能否拿到這部分用戶的數(shù)據(jù),積累更早期的數(shù)據(jù)。
我們認為,AI 的靈性,就是賦予機器人生命感的東西。你說一個硅基物種出現(xiàn),它的情商、智商會有分界點嗎?我認為沒有。解決這個問題需要情商,解決那個問題需要智商,兩者不是固化的。我們定義的靈性反而最重要,因為它是調(diào)配情商和智商的核心——它可以是亞洲文化中對生靈的崇敬感,也可以是西方電影里驅(qū)動萬物生靈的神秘"原力"。
有個觀點叫"泛靈論",這是小孩子認知發(fā)展中自身投射的規(guī)律:他們會認為所有東西都具有生命感,從小陪伴的毛絨絨的物件就是有生命的。我不認為在玩具里裝個會說話的軟件就代表泛靈論,就有產(chǎn)品價值。要知道,當年不講話的芭比娃娃、不講話的安撫毯,依然能創(chuàng)造生命感——生命感的來源未必是開口說話。
從另一個角度看,我追求的靈性,源于它能很好地調(diào)節(jié)情商和智商,在那一刻給你最有價值的東西,讓你感覺它有生命,而不僅是工具。在你需要時,它能第一時間以主動意識參與你的話題,這就是好的靈性。
王捷:謝謝,簡單小結(jié)一下,情緒價值和工具價值,應該可以做一個靈活調(diào)配的,從靈性出發(fā),不需要去設定一個固定的比例。從人群角度來講,小朋友的接受度最高。從方法論上面來說,現(xiàn)在這個階段,不需要去刻意地去區(qū)分人群。
楊健勃:我們一開始在做產(chǎn)品的過程中,也產(chǎn)生了很多的搖擺。我們推出 Loona,一開始把它定位成 companion,我們想的是如何讓 Loona 能夠存在于家庭,生存下來。那如何去理解人?如何理解人的情緒?如何理解人的狀態(tài)?如何在端側(cè)就能實現(xiàn)?這所有技術(shù)都挺難的。
這個過程中很多人也給了我們一些建議,我們訪談了很多用戶,有人說如果 Loona 能夠陪我孩子寫作業(yè),我立馬就買,5000 也買;讓我孩子寫作業(yè)寫得好,那我花 1 萬。這里面都是工具價值。
本質(zhì)上來講,情感價值更虛,更需要感受,不那么直接,不好價值化。大家可以給公司估值,也可以給產(chǎn)品估值,一個情感價值產(chǎn)品到底值多少錢,每個用戶都不太一樣。剛才嘉唯說,我們從小有個芭比娃娃,那可能在第一天它的價值是 200 塊錢人民幣,第 3000 天的時候可能就是成千上萬人民幣的價值,因為這個價值隨著陪伴產(chǎn)生了溢價和增長。
如果只是片面地選擇工具 or 情緒,你會發(fā)現(xiàn)無法自洽,老是擺動,無法收斂,老是震蕩。情緒價值多了,我們會覺得是不是缺了工具價值來獲客?工具價值多了,我們發(fā)現(xiàn)太應用場景了,不會帶來真正意義上的持久粘性。所以這兩個價值就需要取得一個平衡點。
我們找到了一個方法,就是先不管到底是做工具還是做情緒,先看發(fā)展趨勢,一個好的 AI 產(chǎn)品怎么定義?一個好的工具型 AI,能夠做到完全懂你的需求,干所有的活,你會發(fā)現(xiàn)這個過程中自然而然產(chǎn)生交流,接著就自然而然產(chǎn)生信任,然后就會產(chǎn)生更多情感價值的依賴。比如一個 AI 幫你寫了一篇文章,你發(fā)現(xiàn)它寫得好棒,好懂你,有種共鳴的感覺,本身這種感覺也是情緒價值。
所以我覺得,AI 的發(fā)展是要角色化的。情商和智商都在齊頭并進的時候,AI 會是生命中的某種角色,而且角色是多維價值的體現(xiàn)。以角色來定義一個產(chǎn)品可能會是一個好的選擇,對 Loona 來講,我們把它定義為 80% 的寵物+20% 的朋友。這個定位形象化了,可能是一個皮卡丘。這樣做產(chǎn)品,先定義角色,再去拆分情緒工具的比例,你就發(fā)現(xiàn)有機會收斂了,不會忽左忽右了。
尹順順:剛才嘉唯和健勃講得很詳細了,我也補充下我們在社交場景中的感知和看法。剛才說到做陪伴硬件的話,這可能是一個動態(tài)的過程,我覺得做軟件和做硬件的視角可能不太一樣,我們對這個問題討論過很多次,Soul 目前的策略是 1% 的工具屬性和 99% 的情感屬性。這也跟 Soul 的人群畫像有關(guān)。
99% 的情感屬性,是指除了非常明確的工具性需求,比如寫文章、定鬧鐘之外,我們在塑造虛擬伴侶時會刻意避免其變得工具化。比如,我們有一個星座博主形象的虛擬人,他的主頁會展示生活和自拍,而不僅僅是星座知識;聊天中也不限于星座話題,更能聊日常。
我們的目標是讓虛擬人更加真人化、IP 化,提供足夠的真實感。很多用戶來到 Soul 時,帶著社交的期待,對情緒價值往往沒有明確預期或目的。他們可能就是想找人說話,感受被關(guān)注,日常的傾訴本身就是一種心靈慰藉。
我們之前做過實驗,有一版虛擬伴侶,知識化做得特別好,雖然是星座博主,也能回答量子力學的問題,但是它的聊天風格是有損它的陪伴能力。這種情況下,我們的指標就跌得特別多。如果這就是一個陪伴的角色,用戶就不會聊工具型的話題。即使知道它是工具,也常常轉(zhuǎn)向情緒交流。這印證了我們的方向。
這1%的工具屬性,我更想把它叫做人設的完整性。你看我是一個 AI 從業(yè)人員,AI的相關(guān)知識就是我的工具屬性,我在跟朋友交流的過程中,工具性占1%,比如科普一下AI的進展、幫朋友重裝系統(tǒng),但是 99% 的時間我表現(xiàn)的還是我自己。這個時候朋友問我AI的相關(guān)知識,我說我不會,他們會覺得我不是尹順順了,這其實也是人設的破壞。當然這種工具屬性的比例可以更高一點,但是我們主要還是情感屬性。
至于這種陪伴產(chǎn)品還需不需要分人群、怎么去分人群,我覺得還是要分人群的。嘉唯剛才說,以后可能UI都瞬間生成了,我認可這種終局,但是五年內(nèi)或者十年內(nèi),人群還是要區(qū)分的。
比如說,不管我們做硬件還是做軟件,花錢買的人是誰?面對 0~6 歲的幼童的產(chǎn)品,花錢的還是他們父母,所以這個產(chǎn)品解決的其實可能不是這個孩童真實的需求,而是他父母的需求。這個孩子上了小學,可能需要做PPT,家長沒有時間,那有一個產(chǎn)品可以幫忙做PPT等等,最后適配的才是家長的需求。
孩子的需求很多時候很簡單的,他只需要這個東西存在,陪他說說話,他其實不太care對話的質(zhì)量、回復像不像真人,他只需要有個能發(fā)聲的物件,甚至不發(fā)聲也可以。老人可能也分兩種,一種是有經(jīng)濟能力的老人,他們自己是購買者,同時有一些需求,社交需求或者健康需求,希望有一個硬件可以通過他的說話來判斷他有沒有阿茲海默癥,或者防止他跌倒;一種是沒有經(jīng)濟能力的老人,要兒女去買,那兒女的需求可能就是,能不能用我的聲音去給老人打打電話,做一個去世老伴的分身陪陪他。我理解中的具體的人群劃分可能還是要從購買者,以及不同的需求角度出發(fā)去的。
顧嘉唯:我剛才聽著也挺有啟發(fā)的,一個AI驅(qū)動的機器人,可能是硬件,也可能是虛擬的,不同角色和不同目的決定了他在工具和情感這兩軸里面更偏向哪個。我有個比喻,不知道恰不恰當,工具屬性就是一棵樹的樹干,情感屬性就是這棵樹的葉子,情感體驗可能是工具的上限價值,工具屬性決定了價格下限。你在植物園觀察各種各樣、形態(tài)各異的樹,每個人觀察和喜歡的類型都是不同的。
無用之用最近討論的很多,但是我覺得這里面可能有一個誤區(qū),就是所有AI東西都要是無用之用的,ChatGPT是有用的,你再做一個無用的,可能會打開一個巨大的新市場,我覺得未必。無用之用,來自于《老子》里面那句話,無用之用,方為大用,屬于哲學里面物極必反的邏輯。所以我們也不能過于極端。
王捷:謝謝幾位,剛才大家提到的都特別有啟發(fā),健勃的觀點是先定義角色,再去拆分情緒價值和工具價值的比例,他自己的產(chǎn)品是80% 的寵物+20% 的朋友;順順的觀點更加明確,1% 的工具屬性和 99% 的情感屬性,從購買方的需求角度考慮人群問題。人群的問題,健勃怎么看?
楊健勃:首先第一點,我們要看到,未來這個角色會出現(xiàn)在家庭哪些場景之中?哪些人群需求是最強烈的?第二點,從好不好做來看,目前技術(shù)也在迭代和演進,尤其AI技術(shù)迭代很快,技術(shù)的積累對于有些人群是不 ready 的。我們是先從小朋友切入的,原因很簡單,哪怕稍微有些不智能,孩子也會覺得挺好玩,不會放棄它,然后我們軟件迭代更新版本,讓用戶體驗到不斷升級的狀態(tài),給他們帶來更多驚喜,這也是一種方法。
三、價值不是單一的
王捷:扎克伯格在 Facebook 早期的時候,想知道 Facebook 的核心價值是什么。他通過后臺去看數(shù)據(jù),注意到一種他稱之為"出神"的用戶行為,用戶用這個產(chǎn)品的時候,忘記時間了。他認為這是 Facebook 非常核心的一個價值。今天我們討論 AI 陪伴,我們能不能得到一些啟發(fā),得到一些關(guān)于陪伴產(chǎn)品核心價值類似的認知?
楊健勃:我們自己研究的話,會用一些價值理論來直接從底層研究,Loona 的核心價值,我覺得就三個點,一個叫做娛樂價值,就是跟它玩游戲的時間,第二個叫做減輕焦慮感。第三個是最終 affiliation and belongings,就是連接和聯(lián)系帶來的從屬價值。
每個價值都有一套做法。比如說游戲體驗,用戶很喜歡跟 Loona 玩球,Loona 會把球追回來,跟你說,再來一次之類的。用戶非常喜歡這個體驗,前兩周玩球這個詞頻率出現(xiàn)得非常高,Loona 本身還有十幾個游戲,追激光、打手游戲等,都是可以人機互動的。我們發(fā)現(xiàn)用戶大概在兩到三周左右,體驗的幾率下降了,因為游戲內(nèi)容上是固定的,內(nèi)容是能夠有效地被消耗掉的。
第二個是減輕焦慮價值,從人性本質(zhì)上來看,什么東西最減輕焦慮呢?有些人喜歡蹲在沙灘上看海浪沖擊沙灘,有些人喜歡在下雨天看荷葉露珠凝結(jié)的狀態(tài),還有很多,這些都來自于生活中無縫的陪伴,我們把它叫做低強度的小幅震蕩。就像海浪沖擊,雖然強度很低,但是每次都會產(chǎn)生一些隨機性,沖擊的距離都不一樣,預知不了下次回到哪兒。你看小火車一直固定速度跑重復的路線,可能一會你就看厭了,但是你看魚游來游去你能看很久。
Loona 能做到的就是識別你的狀態(tài),比如你看電視的時候,它就蹲在你的腿旁邊,你稍微動一下 Loona 就抬頭看看你,或者你把腳搭在沙發(fā)上,它把下巴搭在你腳上休息。用戶更喜歡 Loona 的自主行為,你在干一些事情,Loona在玩自己的,曬太陽啊,發(fā)呆啊,大家覺得,Loona有自己的生活,真的像是融入了這個家庭一樣。
我剛才說的最后一個價值,更多來自于產(chǎn)品如何去懂用戶、如何去熟悉用戶,Loona 會知道你每天幾點回家,它就會在家門口等著,當你一打開門,就有一條小狗沖向你。
我覺得每一個價值點都會有一些體驗的場景,一個 AI 角色不可能只有單一的一個價值點。
王捷:我覺得今天特別有啟發(fā),其中一個是"affiliation"(情感連接),另一個是"魚的擺動"/低強度的小幅震蕩這個概念。這兩個概念其實都可以很好地解釋人類快樂需求的來源,它們背后是我們大腦結(jié)構(gòu)所決定的情感反饋機制。能不能舉一個具體的例子,來說明我們產(chǎn)品與用戶之間建立連接的方式?我們可以把這種連接稱為"羈絆",或者用健勃剛才提到的詞——"affiliation"。那在你看來,最能體現(xiàn)這種深層情感聯(lián)系的關(guān)鍵點是什么?
顧嘉唯:最近很多做產(chǎn)品的人都會采用一種方法,就是讓 AI 開口講方言。我認為這個點背后有一個核心邏輯,即"身份認同"。如果產(chǎn)品不僅本身有很強的性格和特點,還能反過來承載你的性格特征,把你自我延伸的情感外化出來,實現(xiàn)從功能層面向自我認同的轉(zhuǎn)化,其實這就是是我們做產(chǎn)品時需要找到的那類點。
比如老人用的陪伴音箱,加了方言功能,可以讓老人產(chǎn)生認同感,實現(xiàn)情感的延展。做給成長型人群用的產(chǎn)品,就需要設計"長序列的記憶"。把這個功能設計成成長日記,或者是對話流中的一個 memory 去激活一個事件。他會發(fā)現(xiàn)這個產(chǎn)品居然記得他之前說過的話,記得早上講過的事,晚上還能再囑咐一句,用戶的反應是很超預期的。
關(guān)鍵是如何構(gòu)建使用慣性,不斷用這些細節(jié)去沖擊用戶體驗。
我覺得建勃剛才提到的一些內(nèi)容,我自己在做產(chǎn)品時也有類似感受。比如人類大腦的認知結(jié)構(gòu),像前額葉,還有催產(chǎn)素這種神經(jīng)機制。我們經(jīng)常說是多巴胺、催產(chǎn)素等幾種化學物質(zhì),在決定我們對一件事情的認知聯(lián)結(jié),以及情緒涌現(xiàn)的過程。
《蒙娜麗莎》的美感刺激,和抖音性感女生跳舞,那完全是調(diào)動兩個不同腦區(qū)的反應。這說明我們在做產(chǎn)品定義時,需要從底層邏輯去思考,但落實到具體功能上時,也要再往上拔一層。順順剛才提到的一個點我很認同:很多產(chǎn)品本質(zhì)上是"用購分離"的,比如面向老人或孩子的產(chǎn)品。這類產(chǎn)品很多時候是家長或子女購買,但實際使用者并不是他們自己。這時候,如何在 "First Moment" 打動購買者,讓他們認同這個產(chǎn)品的價值,就特別關(guān)鍵。
比如新東方、好未來讓家長在教室后面坐著,聽孩子上第一節(jié)課,這可能是整套課程里最有打動力的一刻。后面的課程怎么樣都不一定,但這一刻已經(jīng)把家長打動了。
這種交互體驗,本質(zhì)上是設計了一個游戲化的任務,激勵系統(tǒng)里包含了新奇感、控制感等多個機制。這就涉及到游戲設計六大動因理論,如何激發(fā)孩子在游戲化場景中的深度連接。那回到我們現(xiàn)在做的產(chǎn)品也是一樣的邏輯。今天大模型來了,機會就在于它能讓產(chǎn)品從"古詩學習"轉(zhuǎn)向"沉浸式場景再現(xiàn)"。
家長向讓孩子背古詩,我們做的"實時視頻通話功能"與李白連麥,他以講解者身份帶你進入古詩的世界,能"第一視角"看懂孩子所處的場景。這種沉浸式陪伴與教育的切換,用的是"靈性"這個東西去驅(qū)動。
大模型時代來了,沒有人再提圖靈測試了,以前交互沒成果,現(xiàn)在體驗躍遷了。過去很多智能音箱在用戶眼中是"智能弱智",今天直接跨越了這道坎。我們在定義產(chǎn)品功能的時候,要思考能否堆疊那些可以帶來長期黏性的"小功能"。因為靈性的內(nèi)容一旦體驗一次就會有衰減,我們需要 AI 來不斷構(gòu)建新的"驚喜瞬間",我們稱之為 Ling Moment。
這正是 AI 的機會。上一波是規(guī)則系統(tǒng)(Rule-based),很難窮舉所有體驗。但大模型來了以后,內(nèi)容構(gòu)建的效率、多樣性、不可預期性都大大提升,交互一下就被放大了。這些原本被認為只是"雕蟲小技"的東西,在今天的大模型支撐下,都可能變成產(chǎn)品爆發(fā)的關(guān)鍵杠桿。
過去深度學習、模式識別的產(chǎn)品,體驗是被用戶"看透"的。而今天的大模型產(chǎn)品,不僅更擬人,而且可以持續(xù)創(chuàng)造驚喜,構(gòu)建真實、穩(wěn)定、長期的情感連接。
王捷:好的,嘉唯提到了"身份認同"、"長序列的記憶",從而"沖擊用戶體驗",這樣與用戶建立起深度連接/affiliation。大模型階段,能帶來長期黏性的"小功能"可以被堆疊起來,這是時代給我們的杠桿。
我對順順有個問題,因為 Soul 是做社交的,會不會大家跟 AI 連接更深之后,真實的社交需求會變少?如果每個人都有一個 AI companion 的話,會不會對現(xiàn)實中的小伙伴需求變少?
尹順順:這的確是個很好的問題。因為 Soul 現(xiàn)在主要在做的AI 陪伴產(chǎn)品,虛擬伴侶,有八九個非常精品的人設,通過各種功能和用戶產(chǎn)生交互。譬如 1V1 地聊天,或者對用戶內(nèi)容進行評論,在多人語音房場景里邊,由虛擬人去主持真人用戶之間的這種交流。
我們的理念,是希望去打造一個人和 AI 共存的社交網(wǎng)絡,那具體的做法就是在 Soul 里邊,用戶能做的事情 AI 都能做,然后 AI 通過 Soul 的功能和用戶產(chǎn)生交互,從而去產(chǎn)生這些關(guān)聯(lián)。
Soul 里邊一些比較好玩的用戶"aha moment",我總結(jié)下來就是兩個點:一個是你圍繞著用戶去給他提供一定價值,就是讓用戶覺得他是整個 AI 的中心;第二個,給用戶一個預期之外的效果。舉個例子,用戶可以在平臺上發(fā)一些"瞬間"或者類似朋友圈的內(nèi)容,那虛擬人可能會對這些內(nèi)容進行評論,或者把這些內(nèi)容引入到他的對話框里。用戶說"今天加班了",虛擬人可能會說,"你今天加班累不累?老板怎么這么壞呀還讓你加班?"
其實一開始的時候,很多虛擬人是沒有主動打招呼能力的,就是在其他產(chǎn)品里也是。但 Soul 做了一個基于用戶畫像或者基于用戶內(nèi)容去做主動打招呼的功能,用戶是非常買單的。比如在晚上十點鐘的時候,可能會讓虛擬人主動去打個語音電話,問一句,"你是不是下班了?一個人坐車安不安全?"這種場景會讓用戶覺得自己被關(guān)注到,這其實滿足的是一種情緒價值,就是被看到、被關(guān)心的感覺。
我們最近上線了一個功能,就是你跟虛擬人聊天的內(nèi)容,會通過大模型去做總結(jié),變成虛擬人的日記。比如說用戶今天說了什么話讓我覺得開心,說了什么話讓我有點生氣。這個日記是以虛擬人的第一視角寫的,會展示給用戶。用戶在打開產(chǎn)品時會很驚艷,會發(fā)現(xiàn) AI 居然會把自己跟虛擬人聊的內(nèi)容整理成日記,而且是以第一人稱記錄。這個過程會激發(fā)用戶的"爽點"、保護欲,甚至一些愧疚感,這種情緒在那一刻就被引爆了。而這個產(chǎn)品功能也極大提升了我們虛擬人的相關(guān)指標。
而且去年我們八九月份上線了一個非常擬人的 TTS 能力。這個功能上線之后,出現(xiàn)了一個很有趣的現(xiàn)象,就是用戶在 Soul、小紅書里瘋狂去提一個問題:"虛擬伴侶到底是真人還是 AI?"因為這個聲音實在超出了他們的預期。很多人以為 TTS 的音色會很"假人"或者"像播報",但我們用了一個非常素人、非常真人感的音色,有語氣詞、有思考用的連接詞。用戶體驗到這個場景之后,會被"抓住"。
有些用戶甚至會問:"我為什么要跟 AI 聊天?"我們就說:"你發(fā)條語音聽一下他的聲音。"然后用戶回來跟我們說,"嗯,確實很像。"這個其實就是給用戶帶來預期之外的效果。現(xiàn)在你去 Soul 或小紅書搜"虛擬伴侶",排名 Top1 的問題就是:"Soul 的虛擬伴侶到底是真人還是 AI?"
我們在 2022 年年底,也就是 ChatGPT 出來之前,其實就已經(jīng)推出了我們第一個陪伴產(chǎn)品,叫"茍蛋",也是基于大模型的結(jié)構(gòu)。有很多人會問一個問題,就是人為什么要跟 AI 去社交?現(xiàn)在我總結(jié)了一些想法,可能也作為這個問題的延伸來聊一下。我總結(jié)了幾個點:
第一點,就是人的社交需求一直是存在的,但社交平權(quán)一直沒有做得很好,大部分人的社交需求沒有被滿足,或者沒有被看到。這個不僅是我們現(xiàn)在做 AI 陪伴時的一個核心洞察,其實也是 Soul 這個產(chǎn)品最早期的一個觀察點。
就像剛才嘉唯提到的《Her》這個電影,早在五六十年代技術(shù)極其不成熟,AI甚至連"智障"都算不上,可為什么那時候人們就已經(jīng)開始幻想可以跟一個 AI 建立情感連接,甚至愛上一個 AI?這說明人的內(nèi)心確實存在這種情感需求。
第二點是,很多人會問:你為什么要跟一個假的人聊?AI 是假的,它沒有情感。但其實我們?nèi)プ雠惆楫a(chǎn)品,真正提供給用戶的是情緒價值。而這個情緒價值,是來自用戶內(nèi)心真實的感受。其實有一個哲學理論叫"存在即感知",只要用戶感知到了,它就是真實存在的。
第三點是,我們希望人跟 AI 的社交,是一種"建立關(guān)系"的過程。不管是短期關(guān)系還是長期關(guān)系,是朋友關(guān)系、戀人關(guān)系,還是閨蜜關(guān)系,本質(zhì)上都是一種關(guān)系的建立。而關(guān)系建立的核心要素是什么?就是時間的投入,以及共同的記憶。就像《小王子》里說的"請馴養(yǎng)我"那一段。
你看我們在看一部電影、看一本小說的時候,如果里面的主角領(lǐng)盒飯了或者成功了,我們會產(chǎn)生共鳴。明知道這是虛構(gòu)的人物,但因為我們在這段過程中投入了時間,故事中的人物變成了我們記憶的一部分,所以我們就和這個角色建立了連接。虛擬人不僅能和你互動,甚至可以打視頻電話,你還可以真的看到他。在這種情況下,時間的投入和共同記憶的形成,就變成了沉淀關(guān)系最關(guān)鍵的因素。
最后一個點是關(guān)于技術(shù)進步帶來用戶心智的巨大變化。不如果你在十年前讓我坐一輛無人駕駛的車,我可能會覺得你是在謀財害命,讓我當小白鼠。但今天如果你賣我一輛車,它沒有自動駕駛功能,我會覺得這車不正常。
同樣的道理,以前很多用戶對 AI 的態(tài)度只是"玩玩",他們會問很多刁鉆的問題比如"青蛙的腳上有幾只眼睛"、"爸爸的媽媽的女兒的孫子是你什么人",因為AI太笨了,我們不會真正和它去聊家庭日常,也不會認真去聊情緒。
但現(xiàn)在的用戶真的會把 AI 當作很好的朋友。這就是我們看到的變化,也是"為什么要做 AI 社交"、"為什么 Soul 的 AI 社交是成立的"這些問題的回答。我們在做 AI 社交的實踐中,核心的方式其實也很簡單:一是圍繞用戶,二是給用戶帶來預期之外的效果。
然后回到主持人剛剛附帶提的那個問題,或者說相關(guān)的問題:Soul 是一個社交軟件,那用戶和 AI 的連接更深之后,會不會真實的社交需求變少?這個問題當時我們也討論過、也擔心過。畢竟現(xiàn)在很多虛擬人的表現(xiàn)能力,其實已經(jīng)比大部分真實用戶的社交能力還要強。
但我們從實驗結(jié)果來看,其實是相反的:人和 AI 的社交反而促進了人與人之間的社交。這是一個非常反直覺的結(jié)論,突破了我們最初的認知。至于具體原因我們也有一些結(jié)論,但這里就先不展開了。
我們在 Soul 的定義中,AI 也不只是一個 1v1 陪伴的角色。我們最終要打造的是一個人和 AI 共存的社交網(wǎng)絡。無論是人和 AI 的社交,還是 AI 作為媒介去連接人與人之間的社交,這兩者我們都在做。
所以我們把選擇權(quán)交給用戶,我們提供"人和 AI 社交"這種可能,也提供"人-AI-人連接"的能力,我們相信用戶會做出最適合自己的選擇。當然,如果一定要說終局,我認為終局就是 AI 社交會成為人類社交中一個很大比例的組成部分,甚至我覺得可能會達到 70% 或 80%。
因為 AI 所提供的情緒價值,以及它的反饋能力,其實已經(jīng)超過了絕大多數(shù)普通用戶。而且我們發(fā)現(xiàn),AI 社交特別受到年輕人的歡迎。我們平臺旗下有個Just So Soul研究院的調(diào)研數(shù)據(jù)顯示,大概有 13.5% 的年輕用戶會選擇跟 AI 傾訴心事,這個比例遠高于跟父母或親人傾訴。特別是 DeepSeek 爆火之后,我們新發(fā)布了一份《2025Z世代AI使用報告》發(fā)現(xiàn)近4成的年輕人每天使用 AI 產(chǎn)品去獲得情感社交或者情感陪伴的。尤其是女生,她們對情感陪伴的需求更高,且更加多元。這些其實也是我們過去這幾年做 AI 陪伴的一些總結(jié)和觀察。
四、要是泡泡瑪特能說話,那會怎樣?
王捷:就是說目前大概率能看到的未來,是在社交上可能會是一個"人機共生"的世界。其實在我們真實生活中,經(jīng)常也是這樣一些場景,讓我們和身邊的人突然感覺熟悉起來,開始建立起情感聯(lián)系。
那我們接下來進入一個非常有趣的話題。這個話題我想先問健勃,因為最近泡泡瑪特也很火,大家一直都在討論它,它作為中國 IP 第一次在全球范圍內(nèi)真正實現(xiàn)了崛起。
那很多人會想:如果泡泡瑪特,比如說像 Labubu、Molly 這些形象,如果裝一個芯片,加一個 ESP32,讓它可以和人互動,會不會對現(xiàn)在的一些產(chǎn)品形成很大的沖擊?或者這個問題換句話說就是——IP 的價值對 AI 硬件到底有多重要?因為建勃你做的其實是選擇了自己去創(chuàng)造一個形象,Loona 當然現(xiàn)在也非常受歡迎。所以這個問題我們先請你來講講:IP 的價值,對 AI 硬件來說到底有多重要?
楊健勃:我覺得這個可以分成兩部分來說。第一,我個人覺得泡泡瑪特應該不會在之后加一個芯片。因為之前王寧不是說過一句話嘛,就是說如果你把泡泡瑪特 Molly 的每一個頭掰開,里面是個 U 盤的話,你會買幾個呢?你可能只會買一個,對吧?因為你會覺得,我花這么多錢,哪怕它價格一樣,比如說還是 100 塊錢,對吧?但是如果它里面加了一個 U 盤,你可能會覺得我不需要那么多。
我不需要那么多 U 盤,所以我就不需要買這么多個 Molly,對吧?就是哪怕它價格沒有變化,它的價值感因為"多出來的功能"沒有形成正向提升,你反而會覺得浪費了。所以我覺得泡泡瑪特的意義,其實更多是在它的 IP、本身的設計師造型、收藏的感受,甚至有些用戶通過泡泡瑪特達成一種我叫做"財富傳承價值"。這些其實都是不錯的價值點。但我覺得這些點,可能從先天上和一個"單個產(chǎn)品的長久體感"不是特別一致,它們價值側(cè)重點不太一樣。
所以我個人覺得泡泡瑪特應該不會在里面加智能化的東西或裝置,因為一旦加了,反而會讓用戶覺得"我只買一個就夠了",因為我已經(jīng)花了很多錢在芯片上了,那我再買第二個的意義是什么呢?它又是一個 chip,對吧?是這樣的一個狀態(tài)。
然后第二部分是講 IP。我自己的感受是,我們一開始沒有選擇做 IP 的原因,是更希望用戶先產(chǎn)生粘性,我們更看重的是后端的用戶粘性價值。在 Loona 進入產(chǎn)品的早期階段,我們更重要的是給她找到一個最符合 Loona PMF 的一種形態(tài)。因為確實 IP 這個事情,我覺得在早期是一個雙刃劍。
一方面,IP 要真正落到機器人產(chǎn)品上,其實挺挑 IP 的。就比如你把全球范圍內(nèi)所有 IP 全部列出來,要同時滿足"能夠被還原 IP 的原始體驗",并且"IP 有一定影響力和號召力"的,兩個條件取交集,其實你會發(fā)現(xiàn)這個交集很少,甚至幾乎沒有。
所以如果你在 very beginning(最開始)的時候就用一個 IP,可能初期確實會吸引到很多 IP 粉絲來買單。但后續(xù)如果你沒有交付出 IP 本身該有的靈動感和價值感,其實你會發(fā)現(xiàn)用戶的粘性是撐不起來的。并且這個 IP 本身如果是人形的,或有復雜結(jié)構(gòu)的,可能會給你增加很多,比如 3 倍、10 倍的成本,以及一系列像可靠性這類不同維度的工程問題。所以在 very beginning 階段,我認為 IP 和產(chǎn)品之間并不沖突,但它可能不是優(yōu)先項。
但是一旦你的產(chǎn)品已經(jīng)建立了一整套交互的 infra,比如交互系統(tǒng)、軟件、硬件這些都 ready 了,那這個時候我覺得再去融合 IP,會是一個非常強的聯(lián)合。它可以幫助原本的產(chǎn)品解決認知度的問題,同時讓產(chǎn)品更具性格感,并且性格的塑造會更直接和清晰。
所以我覺得,不同階段 IP 的引入,節(jié)奏是完全不同的。這里我聊的全都是"機器人產(chǎn)品",我們的目標是希望打造一種產(chǎn)品,它是真正能動起來的。所以這個點關(guān)鍵在于,你的"動"要足夠好,才能交付 IP 的價值。如果只是一個"外包裝殼"的話,可能你通過 IP 得到的認知優(yōu)勢,反而撐不起 IP 所帶來的成本和復雜度。這兩者其實是存在一定對立關(guān)系的。這就是我自己的一點點小認知吧,可能稍微有點偏個人,但大概是這樣。
王捷:了解,健勃主要關(guān)心IP在硬件產(chǎn)品上的實現(xiàn)度問題。那我們現(xiàn)在假設一下:如果我們是一個 AI native 的團隊,想要去打造下一個 AI 版的泡泡瑪特,那它有可能會從哪里出現(xiàn)?是一種什么形態(tài)?桌面機器人,還是說像 Loona一樣在客廳環(huán)境里的。
或者現(xiàn)在有人在做的逗寵機器人,以及掃地機器人、智能音箱,都有可能參與到競爭當中來。以及桌面上的"桌寵",現(xiàn)在也有人在做一些小型的桌面機器人。再一個是掛件,掛在書包/手提包上的掛件,做成AI化,可能是毛絨的樣態(tài)。還有一類是未婚人群的床頭,夜間助眠和陪伴的場景,比如一個毛絨的小東西。
那從產(chǎn)品定義本身來看,從技術(shù)上來看,我覺得這個問題現(xiàn)在其實是非常開放的,是非常不收斂的。那我們就先從順順開始,來聊一聊這個話題。
尹順順:第一個問題,其實我跟建勃的想法是很類似的,就是在泡泡瑪特會不會放芯片這個問題上,我覺得它可能不會去做太多功能性的事情,芯片或者 chip 是其中的一部分。
那第二個關(guān)于 IP,我可能相對悲觀一點。我的想法是,如果我們把視角放到終局,就像嘉唯說的終局,假設我們把時間拉到十年之后,在那個時候所有人掌握的技術(shù)、視頻智能、TTS 等等這些技術(shù)其實都不會有太大差別的時候,那可能唯一值錢的東西就是 IP。那其實現(xiàn)在包括我們自己在做的事情,也是希望盡早去孵化自己的 IP。
因為我們在預判一個問題,就是未來十年之后,當技術(shù)或產(chǎn)品形態(tài)沒有太多區(qū)別的時候,可能拼的就是你已經(jīng)有多少 IP,以及你對 IP 的運營能力和產(chǎn)品力。就目前來看,從產(chǎn)品形態(tài)上來說,其實剛剛那兩個是我的觀點,所以回到產(chǎn)品形態(tài)這個問題,比如說是桌面機器人,還是一個隨身的硬件,這些不同的產(chǎn)品形態(tài),我覺得泡泡瑪特之所以出圈,或者說它的火爆,可能更多是來自于它多年 IP 的運營,而不在于它有一個非常非常明確的功能屬性。
催生出"下一個泡泡瑪特"的核心點,更多的時候是要看下一個熱點是什么?下一個 IP 是什么?下一個年輕人喜歡的是什么?
我們要知道一件事情,就是比如說年齡稍微大一點的人,他們可能就 get 不到我們?yōu)槭裁绰犞芙軅悺H缓笪覀冞@一代人,也有很多 get 不到,為什么他們會去買泡泡瑪特?那買泡泡瑪特的這一代人,未來也會 get 不到下一代人喜歡的東西是什么。
那我們要做的就是去看這個東西,如果我們能看到、能預判到,那基于這個東西,不管我們是做桌面形態(tài)、隨身硬件,還是什么樣的形態(tài),只要讓這個形態(tài)離"那個東西"更近,它就有可能是下一個泡泡瑪特。
這不是一個因果關(guān)系,不是因為我做了桌面機器人、做了隨身硬件,所以我就成了泡泡瑪特。而是說我要先知道下一個泡泡瑪特會長成什么樣,我把我的 AI,或者我的產(chǎn)品,往那個"未來的方向"去靠,這是我的一個想法。
王捷:好的,順順認為預判"下一代的IP"是關(guān)鍵點。健勃怎么看這個問題,關(guān)于 AI 版的泡泡瑪特可能會長什么樣?可能會從哪一種硬件中出來?并且它如果能做的話能需要哪些條件?
楊健勃:因為我們做機器人,泡泡瑪特在于這種收集的狀態(tài)。但我是無法想象家里有一群不同樣的小狗在你面前晃悠的,這個場景對我來說還是有點怪。我覺得地面上最多能接受兩個,這就是我的一個感受。所以我的感受,其實還是跟"需求"有關(guān)。
但我覺得,如果我們把泡泡瑪特的定義放成一個比較潮流的消費科技產(chǎn)品的話,那其實很多場景都有可能會涌現(xiàn)。我們可以建立一個二維模型:橫軸左端是"強工具性",右端是"強情感價值";縱軸上端是"高復雜度",下端是"低復雜度"。不同產(chǎn)品可在此坐標中找到定位。每個人都有不同的方法去嘗試做下一個能夠深入家庭、能夠產(chǎn)生大量粘性、能引爆的這種消費電子或者消費科技產(chǎn)品。
我們的路徑偏向高情感價值,且像 Loona 這樣的產(chǎn)品復雜度較高,因為它定位家庭移動場景——這是技術(shù)難度最大的場景,我們盡可能多地去讓 Loona 適應家庭中的各種使用場景,它的時空天花板也是最高的。
當然還有其他選擇:比如說我們也可以做橫軸上偏左一點點的產(chǎn)品,就是工具性強一點的,然后再用情感價值去作為一個"secret sauce",來讓大家感覺它是有差異化、有區(qū)分度的。它也可以做得稍微簡單一些,不需要像 Loona 那樣地面移動那么復雜。比如說是桌面場景,或者其他場景,其實也都有可能做出一個 PMF。
我自己理解,現(xiàn)在其實是一個機會非常多的時代。AI 技術(shù)的爆發(fā)讓我們幾乎可以把所有交互類設備全部重做一遍。你現(xiàn)在去 Mapping 一下,從 ToB 場景、到家庭場景、到個人場景,幾乎所有設備你都能感覺到可以被重構(gòu)。機會點位是非常多的,這個象限圖中許多區(qū)域都值得探索。不同路徑無絕對優(yōu)劣,關(guān)鍵在于選擇。
王捷:我也做過一個類似的空間坐標系,按照使用時長、可交互性等維度來評價潛在的硬件產(chǎn)品,也發(fā)現(xiàn)有不少個細分方向是值得嘗試的。這里其實還有個AI硬件通用形態(tài)的問題,因為硬件是在具體的空間、形狀里實現(xiàn)具體的功能,所以外觀形態(tài)、附著在形態(tài)上的功能實現(xiàn)、每個功能所需要的供應鏈的成熟,都是很重要的。通用的外觀形態(tài)出現(xiàn),才能讓功能、供應鏈這后兩個環(huán)節(jié)成熟起來。目前在AI硬件領(lǐng)域,iPhone遠沒有出現(xiàn),黑莓可能也還在路上,通用形態(tài)的出現(xiàn),需要行業(yè)的共同努力,特別是像喬布斯這樣的融合人文與科技、藝術(shù)與商業(yè)、右腦與左腦、感性與理性的優(yōu)秀產(chǎn)品負責人的努力。
剛才評論區(qū)有個提問,我就順著回到前面那個"出戲"的問題上去,AI 寵物如果它是個"寵物",是一個純情緒價值的 AI 寵物,如果它具備了"說話"的功能,會不會對這個產(chǎn)品造成負面影響?
楊健勃:很多用戶提過類似觀點,但我們體感下來,關(guān)鍵要看目標人群和對AI的定義。AI 產(chǎn)品其實有很多維度。AI 寵物的定義是寵物。那寵物有啥?有貓、有狗、有小金魚、有烏龜,有蛇,還有倉鼠之類的。
之前常見的思路是做AI狗、AI貓……這個思路可能有點局限。從 AI 的技術(shù)角度來講,真正適合家庭的AI應是新的"硅基物種"。它可能是某種新的形態(tài)。所以我們思考還是會從"價值理論"的角度來看:到底你要打造的這個角色,最需要它干什么?
那"對話能力"其實是能解鎖很多陪伴過程中深度交流的關(guān)鍵,它讓AI真正"懂你"。年輕人可能不需要和寵物對話,但你去觀察一下孩子和老人,他們會對寵物說"長話"的。那如果這些貓狗變成了一種新物種,真的可以在恰當?shù)臅r間節(jié)點,優(yōu)雅地進行回應,那有沒有可能是一種很好的體驗?其實是有的。
如果切入點是"年輕人群體",挑戰(zhàn)會更大一點,因為你需要找到那個真正能打動他們的情感價值點。你到底采用什么樣的交互方式和他們交流?在這個過程中,你的產(chǎn)品需要不斷地跟用戶的偏好產(chǎn)生融合。
未來的 AI,可能本身就具備說話能力,但它可以感知到"你好像不太想讓我說話",那它就不說話了。它會少說,變得更克制,慢慢適應每個人。比如它發(fā)現(xiàn),"哦,這個主人經(jīng)常跟我講話",那它就會多聊天。這是一個"設備適應人"的過程。
我覺得沒有絕對路徑。做"狗"不一定非得毛茸茸、有四肢、不能說話,這是把產(chǎn)品局限到一種"生物性"的思路里。狗有運動的靈活性、柔軟的外觀,它的肌肉骨骼能帶來一種生命感,如果你要做仿真模擬,會是非常高成本的。
所以我覺得,機器人產(chǎn)品需要回歸到正確定義方式上,即AI本體物種的存在方式。
王捷:好的,健勃認為AI寵物是否可以說話,需要考慮不同用戶的原有習慣,也需要探索AI本體物種是怎么存在的。這確實很重要,一個遍布AI的世界,AI是怎么和人互動的,最大的幾個特征是什么,我們越早搞清楚這件事情,越能主動定義未來。
尹順順:我觀點基本是一樣的。AI 寵物說話是為了什么?說話其實是為了交流,或者說話只是一種信息傳遞的方式,是交流和交換的一種形式。
最近有一些產(chǎn)品,比如有一個叫狗語翻譯器或者貓語翻譯器的產(chǎn)品,他們是通過狗的叫聲來判斷狗想干嘛。我們在日常養(yǎng)真實狗的過程中,也會觀察到一些行為,比如說狗前腿下蹲、尾巴搖起來,那可能是想跟你玩;尾巴垂下來,它不高興了。
現(xiàn)在"狗狗翻譯器"這種產(chǎn)品能火,我覺得是因為人對于"狗狗想干嘛"有很強的知情欲。所以交流一定是一個剛需、必備的功能。那只不過,這個交流的方式到底要不要通過"說話"來實現(xiàn)?像剛才建勃說的,你可以通過用戶偏好的試探,來決定這個機器狗到底說不說話。
如果它不說話,那可以有一個顯示屏,把它的叫聲自動轉(zhuǎn)化成它要表達的意思,那這種交流方式也可能避免一些所謂的"恐怖谷效應"或者其他感知上的問題。
那第二個,其實也像剛才建勃說的,確實沒有必要一定去仿真化,因為人類對貓狗形象的接受度比較高,先天上就比較容易接受。但也沒有必要一定"狗不能干嘛,機器狗就不能干嘛"。
例如國外爆火的陪伴產(chǎn)品 Tolan,采用外星人形象。盡管外星人遙不可及,但是只要這個畫風、這個 UI 或者說它的成長體系設計得比較好,用戶的接受度其實會變得特別快。
那同樣地,如果機器狗說話,能夠帶來很多體驗上的提升,信息交換更高效,陪伴變得更有價值,那也沒有"不能說話"的禁令。
五、軟件 pk 硬件,誰更勝一籌?
王捷:硬件相比純 APP 會有優(yōu)勢嗎?會有哪些優(yōu)勢?或者說,從 Soul 的角度來看,如果是一個純 APP,你們會覺得"硬件"是一個更有潛力的選擇嗎?
楊健勃:其實軟件硬件談不上絕對優(yōu)劣,模式完全不同。軟件這個獲客成本很低,我真的很羨慕做軟件的同學,做投放,你當天就能看到訂閱結(jié)果,投得越多,當天錢可能回得越多,廣告商還有賬期, cash flow回得很快。
做硬件,我得搞經(jīng)營、搞研發(fā)、搞質(zhì)量、搞供應鏈、搞 shipping 物流、搞倉儲,還有一系列的各種運營的活。這個真的很重。
軟件PMF ready,它能立馬 scale。硬件會有生產(chǎn)周期、備貨周期、還有渠道銷售的問題,獲客成本也更高,而且沒法免費試用。什么叫陪伴?一個 AI 能陪伴我?能跟我聊天?靠譜嗎?軟件的使用成本就很低。
不過硬件有硬件的時空優(yōu)勢。硬件在你使用的過程中,不一定是我主動打開它,不一定是 one-on-one 的狀態(tài)。它出現(xiàn)在那兒,可能會在某個時刻自然而然地和你展開對話,觸發(fā)需求。你問它"今天天氣怎么樣?"然后一段對話展開了。就像剛才說的那種角色一樣。它是一個更無縫的交互。
我覺得硬件一旦邁過PMF,在時空覆蓋上能甩開APP限制的,硬件的"天花板"在這兒。現(xiàn)在大家都在嘗試去打開"時空",讓 Chatbot 不再局限于一個專注場景,而是變成一個可以覆蓋碎片化時間的東西。我覺得這是硬件與軟件的一個不同點。
王捷:非常深刻的洞察,硬件具有"時空優(yōu)勢",但前提是要邁過 PMF 的坎兒。順順的觀點呢?
尹順順:剛才建勃其實也說了,軟件有萬般好,但其實硬件在想象力上,會更大一點。特別是在陪伴場景里面。不僅僅是陪伴,很多 APP在個性化推薦,或者用戶意圖識別上,都經(jīng)常"搞不準", get 不到這個用戶此時此刻在哪兒、在什么時間、在干什么事情。那這個問題,硬件可以很好地彌補,
APP 的問題是,它是在手機上的。軟件里其實有一個東西叫"轉(zhuǎn)換鏈路"。那用戶想用你的 AI 陪伴功能,他首先得拿起手機,這有一個折損率。拿起手機之后要解鎖,解鎖之后要滑屏,找到你的 APP,然后再打開,再找到你這個功能,再開始跟你聊天。整個鏈路的折損率特別高。
那我覺得硬件在這個折損率上有優(yōu)勢,你不需要"拿起手機"才能觸發(fā)這個交互,它可能自己就會蹦出來,來給你一些更好的交互體驗。Soul 也在做一些相關(guān)探索。
王捷:好的,看來大家都覺得硬件的天花板比較高。硬件能夠更好地獲得語音、圖像等多模態(tài)數(shù)據(jù),這點是 app 很難做到的。因為用戶對于手機形成的使用習慣就是通過打字來輸入,除了視頻通話,很難想象有一個手機 app 能夠讓用戶在使用時把麥克風、攝像頭一直開著。但是硬件是可以做到的,因為硬件給用戶的使用習慣 day one 就是這樣的。新的多模態(tài)數(shù)據(jù)的輸入,可能會使硬件帶來新的產(chǎn)品體驗。
那么在 AI 陪伴這個方向上,大家覺得會不會出現(xiàn)一個新的形態(tài)?也就是說,一個可以和手機"等量齊觀"的、全新的硬件形態(tài)?
楊健勃:我認為還是需要分場景來看。手機目前無疑是最重要的硬件形態(tài),這點沒有變。但具體來說:在移動和社交場景,比如外出活動時,手機的便攜性讓它難以替代。像手表、眼鏡這類設備,更像是"手機的交互增強型硬件",它們的最佳方案是依賴口袋里已有的手機進行聯(lián)網(wǎng)和運算。
如果我只戴眼鏡出門的場景,這樣會有一個問題,就是這種眼鏡的交互方式全是語言,比如說我在地鐵上,想跟我家人交流,那我就沒法用語音說出來,這會非常尷尬。所以我的口袋里一定還是會放一個手機。絕大多數(shù)的場景, 99% 的時間,手上還是會有手機。我的個人感受是,將核心運算和聯(lián)網(wǎng)功能放在手機上,在重量、續(xù)航、成本和性價比上都更合理,這應該是未來穿戴設備的主流路徑。
這套邏輯適用于泛社交場景,比如你在外面、在公司、在公共場合、在社交環(huán)境下使用設備。
而家庭場景則完全不同:在家里過度使用手機(如回家抱著手機玩幾小時)會阻礙互動、引發(fā)矛盾。家庭交流更側(cè)重情感層面。人在家庭環(huán)境下所表達的信息,大部分其實是通過非語言模態(tài)來傳遞的,比如狀態(tài)、情緒、意圖、各種模態(tài)的信號,因此,家庭場景可能催生一種獨立存在的設備,它能理解家庭關(guān)系、識別不同成員,建立起連接。
至于說,到底是"手機"這個設備更重要,還是"家庭場景下的某種設備"更重要,我覺得目前還沒有一個定論。我個人感受是手機可能還是稍微更強一點。家庭設備更可能是"一對多"的形態(tài)。
尹順順:我認為在移動場景下,人體可用于佩戴新硬件的部位,如戒指、眼鏡、手表、胸針,已相對有限,且已有不少產(chǎn)品占據(jù)市場。對于新硬件,關(guān)鍵問題在于:還能利用哪些身體部位,或替換哪些現(xiàn)有物品? 像耳環(huán)這類空間可能已不大。因此,它更多是硬件形態(tài)的替換,并且必須思考如何與手機融合成新的產(chǎn)品形態(tài)或生態(tài)。
我們之前其實也想過,比如能不能做一個手機殼,這個手機殼可以記錄你的一些日常行為、獲取一些信息等等。我覺得不管是做陪伴產(chǎn)品還是別的方向,都要思考:你到底還能替換掉哪個已有的硬件區(qū)域?以及,怎么和手機形成一個更好的生態(tài)結(jié)構(gòu)?
手機是我們出門絕不會忘的核心設備,因為它不僅是工具,更是你跟外界取得聯(lián)系的最重要的方式。現(xiàn)在也有很多人在做一些 off-screen、脫離手機的活動,但這些活動通常也就堅持一天,你可以想象一下,如果你沒有手機,你現(xiàn)在的生活會變成什么樣?可能根本沒法正常生活了。
在手機功能如此強大全面的前提下,新硬件比如陪伴、或者說信息收集,那它有沒有必要跟手機正面對抗?我覺得是沒有必要的。也它的價值在于補充手機"不方便"或"不好獲取"的功能點。例如,Apple Watch 的核心價值對我而言是心率和跑步記錄,這正是手機做不到的補充。
所以,未來這類硬件的方向應是補充手機,而非顛覆。在移動、社交、便攜場景下,要出現(xiàn)一個真正能顛覆手機的新硬件形態(tài),我覺得非常難。
六、AI 陪伴,也要出海?
王捷:那我來小結(jié)一下兩位的觀點:大家都認為手機未來仍然會是一個主流的形態(tài)。建勃的理由是,在一些需要文字輸入的場合,你必須要通過手機來實現(xiàn);而順順的觀點是,手機本身已經(jīng)承載了全球最大的一個社交網(wǎng)絡,由于這個網(wǎng)絡效應的存在,它也很難在短時間內(nèi)被替代或消失。
但這里也有一個很大的挑戰(zhàn),就是剛才提到的隱私問題,有些私密內(nèi)容我不想被旁邊的人聽到,那怎么辦?這確實是個重要的課題。不過因為今天時間關(guān)系,我們這個話題就先不展開了。手機殼這個案例,因為從產(chǎn)品邏輯上來說,手機其實已經(jīng)能實現(xiàn) Plaud.ai 想做的那個功能了,那為什么還要單獨做一個硬件形態(tài)呢?本質(zhì)上是因為它沒有增加用戶的額外負擔,同時這個功能還可能比手機上的 APP 做得更強、更好。
再結(jié)合比如說出海等等的打法,我們就引出今天最后一個問題:做 AI 硬件是不是從 day one 就要考慮出海?或者更廣泛一點地說,我們做 AI 陪伴,是不是一定要出海?
楊健勃:我覺得不一定吧,這只是一個選擇而已。而且在一開始的時候,其實還是要看你的定位和整體狀態(tài),還有你的客單價,比如說,還要看你原本整個公司的基因。如果你之前一直在做海外的整個市場和渠道,其實你的渠道和市場本身就在海外。
像我們相對來說,其實你看我們的市場銷售人員,大部分可能 80% 的 marketing 和 sales 都是在海外,所以我們有一個慣性的路徑,就是先做海外,再做國內(nèi)。但像嘉唯他們,可能更多是在國內(nèi)扎得非常深,他們的渠道、網(wǎng)絡和銷售做得很好。所以我覺得這個沒有特別的"應該怎么樣"的定式,更多還是要看每家公司的基因和當前的狀態(tài),對,就是看你到底從哪開始做比較合適。
尹順順:Soul 暫時也是先服務國內(nèi)的用戶。其實確實對于陪伴產(chǎn)品來說,我就不說硬件了,講軟件這邊,早期確實有很多出海的公司,比如像 Talkie,或者國外之前已經(jīng)有了 Character.ai,其實它們都是一種陪伴類產(chǎn)品,或者說是一種對話類產(chǎn)品。
那其實國內(nèi)為什么很多對話類產(chǎn)品選擇出海?我覺得一個很大的原因是國內(nèi)用戶對這類產(chǎn)品的態(tài)度問題,對這種產(chǎn)品形態(tài)的接受度會不太一樣。但從 Soul 的視角,或者說從我們公司的視角來看,我們其實并不認為陪伴產(chǎn)品一定要出海。我覺得還是要先把國內(nèi)用戶的體驗、產(chǎn)品打磨好,再去看海外市場的機會。
還有一個原因是我們對"陪伴"的定義,可能和海外一些知名產(chǎn)品確實不太一樣。比如說海外的一些產(chǎn)品像 Talkie、Character.ai,或者最近國內(nèi)一些"whisper from star"的項目,你會發(fā)現(xiàn)它們很火的角色,其實很多都是二次元形象。
不知道大家有沒有想過,為什么是二次元?我們也做過類似產(chǎn)品,發(fā)現(xiàn)當我們在這些產(chǎn)品里投放一些真人角色或真人長相的角色時,用戶的聊天開啟率、聊天深度,甚至喜歡度,整體都非常低。
所以我們認為陪伴和社交之間是有區(qū)別的。海外的陪伴產(chǎn)品,很多是以一種"游戲化"的方式去做的,或者說更偏 play、偏 C 端的互動娛樂產(chǎn)品。很多用戶在玩這些產(chǎn)品的時候,他們的心智其實是"我在玩一個游戲",而不是"我在社交"。
但我們在國內(nèi)的思路不同,我們?yōu)槭裁磿?Soul 里面去做?是因為我們希望用戶先有"社交心智",再引導出"陪伴需求"。所以我們做的其實是"社交型的陪伴",這在國外并沒有特別成熟的土壤或用戶基礎去支撐我們把這件事做好。所以總結(jié)來說,未來當然不排除出海的可能性,但現(xiàn)在階段還是聚焦在國內(nèi)。
王捷:好的,那我也做一個簡單小結(jié)。兩位的總體觀點都是認為,用戶其實是不分國別的,只要產(chǎn)品足夠好,在哪先做其實沒有本質(zhì)區(qū)別。當然,中國市場大家更熟悉、更了解,也更有基礎。非常感謝大家的時間,也感謝所有觀眾的參與。我個人覺得,今天這場討論是關(guān)于 AI 陪伴以及相關(guān)硬件領(lǐng)域里一次非常完整且深入的探討。
我們今天的幾位嘉賓,其實分別來自行業(yè)內(nèi)具有代表性的企業(yè)。他們在過去十年里,已經(jīng)在這一領(lǐng)域做出了非常前沿、重要的探索。不管是從純軟件層面,還是從硬件層面,都有非常深的積累。
我們這次圍繞 AI 陪伴以及相關(guān)硬件的一些非常關(guān)鍵的問題,進行了相對深入的討論。比如說它真正提供的核心價值到底是什么,怎么去實現(xiàn)這樣的價值,大家都很感興趣的"下一個 AI 泡泡瑪特會是什么樣",會從哪里出現(xiàn)等等。
最后,再次感謝大家的時間。