微軟將 Sora 免費了,但卻已經(jīng)晚了。
前天,微軟 Bing 宣布在其應用程序中推出 Bing 視頻創(chuàng)作器(Bing Video Creator),該功能基于 OpenAI 的 Sora 模型,允許用戶通過文本提示詞生成視頻。這也是 Sora 首次面向用戶免費開放。
就在昨天,Manus 推出原生文生視頻,嵌入進了自家 Agent 的工作流中。
一個是默默關(guān)注 Sora、OpenAI 背后的 " 大東家 ",另一個則是 AI Agent 里的 " 新秀 ",兩方在自家產(chǎn)品生態(tài)中上馬文生視頻的時間點幾乎是一樣的。可見,微軟這一步棋到底慢了多久。
為什么說它是 Sora 的副產(chǎn)品?因為微軟上線的 Bing 視頻創(chuàng)作器從產(chǎn)品力和宣傳上來講,很難說得上是個完整的產(chǎn)品。
當微軟終于宣布將它免費向用戶開放時,這個消息并未掀起預期中的熱潮,反而透著一股尷尬的遲到感。網(wǎng)友對這款產(chǎn)品的 " 自來水 " 評價很差,甚至直言:我們已經(jīng)有了可靈和 Veo,為何還用 Sora?
下面讓我們來看看,在微軟與 OpenAI 的復雜博弈中上線的 Bing 視頻創(chuàng)作器,到底體驗如何?
一、微軟的 Sora,這回表現(xiàn)如何?
當 OpenAI 首次官宣 Sora 時,"Sora 的誕生是牛頓時刻 " 的說法迅速刷屏網(wǎng)絡,甚至激發(fā)了諸多科技大廠的產(chǎn)品靈感與探索方向。當時的 OpenAI 用實際宣發(fā)告訴所有人:AI 得這么玩。
盡管如今文本生成視頻已經(jīng)成了 " 爛大街 " 的常規(guī)功能,但在當時幾乎只有 Sora 成功出圈了。
不過,免費歸免費,微軟的 Bing 視頻生成器目前仍存在明顯局限:視頻長度僅限 5 秒,畫面比例只有 9:16 可選,且同時最多只能排隊生成三個視頻。更尷尬的是,其生成速度也頗為感人,F(xiàn)ast 模式尚需幾分鐘,Standard 模式甚至要耗費數(shù)小時,難免讓人懷疑微軟究竟獲得了 OpenAI 多少的資源支持。
沒錯,這個 " 產(chǎn)品 " 只有下面這 4 個可選項:
(1)羊駝穿西裝在冰上跳舞
提示詞:
一只羊駝穿著藍色的西裝,像人一樣雙腿直立,在中央公園的冰面上跳著動感舞曲
An alpaca wearing a blue suit and standing upright on its legs like a human being, dances a dynamic dance on the ice in Central Park
Bing 視頻生成器:
畫面主體羊駝辨識度低,背景 AI 感強烈,動作雖流暢,但整體質(zhì)感回到了一年前。如果我不提誰能看得出來這是只羊駝?
緊接著,我同樣用 OpenAI 的 Sora 試了下一模一樣的提示詞。畫面的視覺效果明顯上了一個層次,無論是顏色的層次感、畫面主體的動作流暢度,甚至是冰面的陰影的顯示都很真實。
接下來就是可靈 2.1 大師版了。雖然用最新出的模型去對比 Sora 有點欺負人,但是 2.1 的普通模式無法文生圖,也就只能出出血,拿大師版試一下了。
可以看得出來,運鏡設計創(chuàng)意比較好,畫面連貫且風格統(tǒng)一,動作復雜性和自然程度也很高。
相比之下,即夢的效果就比較抽象了。風格略顯割裂,背景像是綠幕效果,動作重復且表情僵硬,整體表現(xiàn)不佳。我很懷疑是否是我的提示詞給錯了。
谷歌的 Veo3 效果依舊耐打,視頻整體視覺效果流暢,畫面連貫性比較好。色彩正常偏明亮,動作和表情也比較自然不僵硬。但是沒有運鏡,鏡頭語言比較單一。Veo 3 的真實感和流暢度確實都很好。
一個空的玻璃茶杯內(nèi)有旋轉(zhuǎn)的彩色光芒,杯身放置在木桌上,木桌上映出茶杯明亮的倒影。鏡頭緩緩向茶杯靠近。
An empty glass teacup with a swirling colored glow inside is placed on a wooden table, which reflects the bright reflection of the teacup. The camera slowly moves closer to the teacup.
茶杯這個例子是我從 Bing 視頻生成器的官方推薦靈感庫里找到的,效果只能說勉強貼合提示詞,但色彩生硬,整體視覺感受奇怪。
我還放了幾個官方 Case,大家可以自行評判效果:
如今,圍繞 AI 下半場的討論熱火朝天,但無論爭論的焦點如何變化,"AI 下半場比拼的是產(chǎn)品能力 " 已經(jīng)成為行業(yè)共識。然而,OpenAI 旗下的 Sora 產(chǎn)品因價格高昂和發(fā)布延期,幾乎已從主流 "AI 視頻工具 " 的競賽中 Out 了。
從 2024 年初開始,現(xiàn)象級別的 Sora 帶給所有關(guān)注者的不是驚喜,而是不斷的懵圈:不斷延期的同時,每隔一段時間就釋放一些新的令人驚艷的 " 小道消息 ",展示自身的強大能力。終于,在年末時,Sora 終于發(fā)布了,奧特曼甚至稱它為 " 視頻版的 GPT-1"。
媒體 VentureBeat 在一篇評論中直言:"Sora 上市時萬眾矚目,但不到一年,其光環(huán)已經(jīng)大幅褪色。"Sora 的發(fā)布頻繁跳票,錯過了 AI 視頻產(chǎn)品的黃金發(fā)展期,其背后離不開大東家微軟與 OpenAI 之間錯綜復雜的博弈。
微軟與 OpenAI 在 AI 領(lǐng)域的合作關(guān)系,從一開始發(fā)展得非常要好到 " 心生嫌隙 ",幾乎貫穿了這款產(chǎn)品的研發(fā)周期。從 2023 年下半年開始,自 OpenAI 推出自有企業(yè)版產(chǎn)品之后,微軟就不再 " 完全相信 "OpenAI 了。
在那場圍繞 OpenAI CEO 奧特曼的宮斗風波中,微軟深度介入?yún)f(xié)調(diào),但雙方管理層之間仍舊出現(xiàn)了很多矛盾:員工之間互相不爽,OpenAI 團隊依靠自有技術(shù)高人一等,微軟團隊也對分享前沿技術(shù)持保守態(tài)度。這個時候,微軟內(nèi)部就已經(jīng)有呼聲希望盡快將 Sora 整合進產(chǎn)品線了。
在 2024 年,微軟招攬 Mustafa Suleyman 負責自家 AI 業(yè)務,更加明確了 " 擺脫對 OpenAI 依賴 " 的意圖。Salesforce CEO Marc Benioff 更是爆料稱,奧特曼與 Mustafa Suleyman 的關(guān)系不睦。
此外,Sora 自身在安全性上的問題遲遲未能有效解決。YouTube 曾公開指責 Sora 侵犯其數(shù)據(jù)版權(quán)。雖然一番風波中,有槍打出頭鳥的嫌疑,但是自從 Sora 代號公布以來,麻煩確實不斷。總結(jié)成一句話:微軟想用 Sora 當王牌拯救產(chǎn)品線,OpenAI 則礙于一系列考慮不斷推遲。
微軟這回圍繞免費版 "Sora" 推出的一系列市場推廣動作,卻讓用戶好感度驟降。比如,微軟選擇在 Bing 平臺上線 Sora 而非旗艦 AI 平臺 Copilot,這是否是微軟游移不定的最佳證明?再有,Bing 上利用 Sora 視頻生成時還需要賺積分操作,生硬的推廣也讓大家 " 愣神一秒 "。
與此同時,市場上涌現(xiàn)了如 Kling、Vidu AI、即夢、PixVerse、WanX、谷歌 Veo、Luma 和 Runway 等一大批優(yōu)秀的 AI 視頻生成工具。Kling 早在 2.0 版本時便宣稱在物理引擎和敘事連貫性上超過了 Sora;谷歌的 Veo 系列甚至支持了高品質(zhì) AI 配樂和音效。
反觀 Sora,承諾的單次 60 秒視頻生成至今未完全兌現(xiàn),用戶實際最多只能體驗 20 秒的輸出效果。可以說,如今的 Sora 雖然免費,但在技術(shù)表現(xiàn)和用戶體驗方面已很難與競品保持競爭力。更何況,這一年中,中國廠商紛紛將成本壓到什么等級,所有用戶有目共睹 。
可以說,微軟這回搞的免費版 Sora,真的有點晚了。
三、中國廠商后來者居上,優(yōu)勢能保持多久?
Sora 剛問世時,曾給國內(nèi) AI 視頻行業(yè)帶來了巨大壓力。如今,盡管微軟將 Sora 免費開放,但在文本生成視頻領(lǐng)域,黃金窗口期似乎已被錯過。不過,微軟畢竟是微軟,龐大的 Windows 和 Office 用戶生態(tài),加上必應這一強大的入口渠道,能迅速放大 Sora 的影響力,觸達到數(shù)量巨大的普通消費者。
過去的一段時間中,中國的 Kling、Vidu AI、即夢、PixVerse、WanX 等一眾產(chǎn)品已經(jīng)經(jīng)過了無數(shù)次的迭代,其中像是 Kling 等產(chǎn)品都已經(jīng)成功跑通商業(yè)化。
Sora 就像達摩克利斯之劍,一直懸在國內(nèi)外眾廠商的頭頂上。沒人知道,Sora 的到來,是否會瞬間變革一切。Sora 本身的性能可以說仍在第一梯隊,其流暢性一直被人津津樂道。這回有了微軟這家 " 橫跨 PC 時代,移動互聯(lián)時代,云計算時代,并且在每一個時代都引領(lǐng)潮頭的超級巨廠 " 在產(chǎn)品端的下場,Sora 得到的助力將會遠超以往。
" 已經(jīng)晚了 " 并不意味著沒有機會了。
可以預計,微軟開放 Sora 將迫使競爭對手們加速創(chuàng)新,推出更優(yōu)服務。國內(nèi) AI 視頻廠商想必都感受到了一些沖擊。之前,他們通過快速迭代,從而在 AI 視頻效果的各個領(lǐng)域積累起來的優(yōu)勢,儼然無法讓大家繼續(xù)安心前行。
AI 視頻生成領(lǐng)域可以說是一個 " 強技術(shù)、高變動 " 的賽道,這條路有多難走,國內(nèi)大廠有話說。比如,百度 CEO 李彥宏就曾在 2024 年第三季度內(nèi)部會上明確表示:" 百度不碰 Sora 類的視頻生成。" 他認為 To B 業(yè)務應盡量避免那種 " 吃力不討好 " 的定制項目,而應推出標準化產(chǎn)品。
阿里巴巴通義團隊的 AI 視頻生成模型 WanX2.1 的開源策略,也走出了一條獨特的道路,在開源的領(lǐng)域蠶食關(guān)注力。
Sora 會跑的多快?我們無法預測,但是中國廠商仍需提速。過去一年,谷歌 Veo2、Veo3 在性能上的領(lǐng)先幅度非常大,但高昂的成本令市場反應平淡;反而是價格適中、性能更均衡的 Kling 等產(chǎn)品大受歡迎,迅速積累了 2200 萬用戶。
" 免費 " 策略對用戶的心理沖擊是巨大的。盡管微軟的免費行動更像是被動追趕,而非主動創(chuàng)新,但在巨頭資源的加持下,Sora 仍可能引發(fā)新一輪行業(yè)競爭。
Sora 能否憑借免費重回巔峰?國產(chǎn)廠商們還能保持多久的領(lǐng)先優(yōu)勢?或許答案并不遙遠。畢竟在 AI 時代," 誰跑得更快 " 比 " 誰先起跑 " 更為關(guān)鍵,先行者需要不斷提速,追趕者則希望彎道超車。
本文來自微信公眾號:直面 AI,作者:涯角,編輯:肖陽