Manus 的 " 上帝之手 " 稱號近日被一個新的 AI 智能體—— Flowith 旗下的 Neo 奪走了。這款智能體背后的團隊不僅異常年輕,還在社交媒體上宣稱在 0 營銷投入的情況下,實現了 130 萬美元的 ARR 收入。
在 GAIA 智能體評測標準的三個等級中,Neo 不僅超越了 Manus,還創下了新的評分記錄。其中 Level1 和 Level3 更是突破了 " 整數級 " 評分。
各類產品紛紛打著 "AI 智能體 " 的旗號,但正如一些網友所說:許多所謂的智能體,不過是在 Manus 的框架上又疊加了一層 LLM 而已,萬物皆可套殼。
今天,讓我們深入分析下這款標榜自己是 " 下一代 AI 生成力 " 的產品,看看它是不是 " 穿新鞋,走老路 "。
一、Flowith Neo:無限步驟、無限上下文、無限工具
在 Flowith 產品官網中,如果點開輸入框右上角的 Agent Mode,則會自動啟用 Agent Neo,在此模式下,Neo 可以智能調控各種大模型,完成長序列的復雜任務。
它們集成了市場上幾乎所有主流的大模型,涵蓋了幾乎所有模態,例如 Claude 3.7 Sonnet、Grok3、GPT Image1、Gemini 2.5 Pro preview、o3、o4 mini、DALLE 3、Flux、Recraft 和 Kling 等。
我們通過一系列測試來逐一展示這些特點。
1. 無限步驟
Neo 由于將任務的執行搬到了云端,現在的它幾乎可以在任務中一直工作,即便用戶關閉了網頁,它對于用戶本身網絡環境的依賴已經不再是必需的了。
一個最明顯的樣本是:它可以幫你訂閱大量平臺的所有關鍵 KOL 或新聞媒體,并調用推理和相關模型撰寫報告,發送到你的郵箱。用戶還可以規定發送的頻率,Neo 幾乎會無限制地在云端跑流程,不斷地重復工作步驟。
如果想要 Neo 完成此類任務,可以直接輸入一段非常簡單的 Prompt:
請你幫我找到 10 家最主流 AI 新聞媒體,并將它們最新更新的消息做成簡報,每兩小時更新一次,發送到我的郵箱。
從實際體驗來看,Neo 的上下文非常之長,常常能達到數萬甚至數十萬字的地步。
這種超長的上下文能力使得 Neo 能夠記住之前的對話內容,保持上下文連貫性,避免了頻繁重復之前的敘述或信息,從而提升了交互的效率和質量。
在實際應用中,這意味著我們可以與 Neo 進行長時間、多輪次的深入對話,而無需擔心它會 " 忘記 " 之前的討論內容。
比如,我試著讓它做了一個全球文科倒閉潮的可視化報道切片,提示詞比較簡略:
收集 2024 年至今中國大陸、新加坡、英國、美國、韓國、日本所有大學裁撤文科的情況,并在一張世界地圖上進行可視化呈現。
拿到提示詞后,Neo 會先在左側的 workflow 面板里自行規劃出一整套清晰的工作流程,然后按步驟一項項執行任務。
考慮到最終生成的內容可能過多導致混亂,它貼心地設置了一個 Files 面板,將所有生成的文件整理歸類,便于隨時查閱。
" 無限上下文 " 的 Neo 究竟能產生多少個文檔?這是一個無法給出確切數字的問題。
在這一項任務中,它就累計了如此多的信息內容:
Neo 的操作流程兼容多種外部工具,并整合了 Flwith 自推出以來就廣受好評的知識花園功能。知識花園其實就是我們一般所說的 " 知識庫 ",但Flowith 會在你上傳知識內容后,以 "Seed" 作為最小單元識別其中的知識。
為了增強 Neo 的檢索能力,我會外掛知識花園中與 AI 相關的知識庫,以增強 Neo 的檢索能力,其中包含與人工智能相關的豐富信息。
然后輸入 Prompt:
幫我找到 20 個非常專業的 AI 科技 X(原 Twitter)博主,做成網頁。
然后,我又讓 AI 模型自動豐富這些提示詞,規定好了顏色顯示等條件。
Neo 開始調用外掛工具,進行大量的相關信息搜索:
在進行 HTML 網頁任務的前期,Neo 會先進行知識積攢,這也是為何思維流程中體現出 " 兩邊細,中間寬 " 的形態。
在這個網頁中,它將奧特曼、楊立坤、吳恩達等一眾 X 上的 AI 科學家和博主匯集在一起,為每個人貼上了標簽,并實現了交互功能。每個名字下方還附有該博主在 X 上的鏈接,用戶可以一鍵直接訪問。
您目前設備暫不支持播放
可以看得出來,Neo 非常適合這類 " 需要調用多種工具并且高度復雜的任務 ",它對于大模型的調控和整體流程的把控都非常嚴謹。
比如,Neo 與其他 AI 智能體最大的一個區別就是:它會在工作流程中大量地嵌入審查機制,比如在每一個結果產出之前和之后都會進行自我反思。即便在所有項目結束后,也會給出好幾份審查報告、項目總結報告等。
這樣將用戶也視作參與者的操作,雖然有放權的嫌疑,但也能夠讓其后續的生成效果更好。
這可能是 Neo 區別于傳統 Agent 的關鍵能力:不是 " 從頭再來 ",而是 " 就地優化 "。
二、Flowith,一家在 OpenAI o1 發布之前就早已深耕 Agent 賽道的選手
Flowith 最初在全網嶄露頭角的名稱還只是 " 畫布式 AI 創作平臺 ",但卻一直在探索智能體方向,第一代產品 Oracle 于 2024 年 8 月就已發布,甚至早于 OpenAI 的推理模型 o1 的發布。這款產品在各個社區都有一定的熱度。當時的 Flowith 憑借 Oracle 甚至被譽為 " 讓 Chatbot 式 AI 成為歷史的下一代工具 "。
這家初創企業背后的團隊也異常年輕,Flowith 由倪正民(Derek Nee)團隊于 2024 年正式推出。這位 96 后 CEO 在 20 歲前就曾創立 X Academy、項目超過千萬人民幣 ARR 的 Realm 項目,都曾風動一時。
據 " 觀察者網 " 心智觀察,Flowith 的全體團隊都是 95 后,市場負責人郭梓溢本人則是 00 后。這家團隊在架構體系中幾乎將任務導向做到了新高度:每周團隊可能會有 100 個任務,而每個人只需摘取自己最適合的任務。他們在團隊構建中拋棄了傳統的任務分配機制,轉而采用鼓勵極致創新的開放式思路。
在這樣的團隊中孕育出來的 Oracle 顯然也帶有創新基因,這款產品最大的特色在于交互范式的創新。它沒有沿用傳統聊天框 + 黑箱執行的模式,而是開創性地引入了畫布多線程交互理念。Flowith 沒有自己訓練大模型,而是專注于上層架構和交互創新:通過可視化工作流編排,把 LLM 的推理能力、搜索工具、插件能力組合起來。
這一理念的背后,其實代表了兩種 AI 使用觀念的差異:Manus 等追求的是 AI 完全自主行動,用戶給出指令后 AI 自主完成一切;而 Flowith 則強調 " 用戶 " 角色,等同于坦誠了一個事實:現在還不存在通用 AI 智能體,但是有了用戶的參與,Flowith 能夠表現得更好。
比如,在上面的操作演示中,我們可以清楚地看到,Flowith 為用戶提供了微調和干預流程的能力,確保 AI 輸出更精準地滿足特定需求。例如,用戶可以在 Flowith 畫布的特定節點添加自定義數據源,使最終報告的關鍵信息往往能超越 Manus。
三、與大廠截然不同的思路
百度 Q1 財報的公眾號文章中就把 AI 智能體放在了很重要的位置,不斷地強化自家平臺已經接入 " 幾千 +MCP 組件 ",在未來更是會將通用 AI 智能體的任務類型擴展到數十萬的水平。然而,Flowith 卻走了條不同的路:研發了個 " 模擬人類大腦思維流程 " 的 AI 智能體工作流。
這或許僅是一種噱頭,實際上更多地取決于使用者的個人偏好,這也反映了當前智能體市場所呈現的世界參差感:熱愛者視之為真愛,可能是通向 AGI 的必由之路,而不喜歡者則覺得這玩意就是個噱頭。
不過,不得不說的是,Flowith 仍然使用行業主流的 LLM,在智能能力上沒有顯著突破。它的優勢在于速度更快、操作更流暢以及更強的反思能力。盡管如此,Flowith 還是成功地將智能體產品投入市場,因此建立了獨特的競爭優勢。
Flowith 所塑造的競爭壁壘主要在于用戶社區和創新速度。前一代 Oracle 自發布以來,到今年 Neo 推出之前,一直在小眾社區中保持了一定的熱度,但也受到不少批評,比如多線程工作容易卡死、非云端導致用戶過于依賴網絡環境。
不過,Neo 的上線很大程度上解決了這些問題。
Flowith 的另一個潛在壁壘是團隊一直想要構造的 " 社區 "。各網絡平臺上其實一直都有這么一句笑言:少玩產品,多搞社區。比如 Flowith 很早就搞了個 " 知識花園 " 功能模塊,每個人跑完自己的工作流程還可以繼續分享 Recipe 到社區里。這就會形成獨特的知識共享網絡,這會吸引新用戶的加入。
總的來說,Manus、Lovart、字節的扣子空間、百度的心響,以及一些將 AI 智能體應用于自家搜索產品的公司,構成了整個智能體賽道。
但目前來看,與行業熱度一起到來的還有些許亂象。
從 Manus 在 GAIA 上的綜合成功率顯著超過 OpenAI 的 DeepResearch 等系統,刷新了該基準的 SOTA 性能紀錄開始,幾乎所有大廠全部下場搞智能體。然而,沒過多久,這些產品的宣傳重點從智能體的能力轉向了產品本身的能力,接著又開始宣傳 MCP 工具的接入。
整個行業好像已經從 AI 能力優先,轉化為生態優先。先將產品做出來,搶奪完用戶,再煮酒論英雄。像 Flowith 這樣的智能體在整體工作流程中幾乎將自己的 " 腸子 " 都挖出來,向各位看官證明一下自己吃了幾碗粉,仿佛成了一股清流。
前 OpenAI 副總裁 Lilian Weng 曾在博文中將智能體的標配總結為:Agent = LLM + Memory + Planning + Tool Use。
而在預訓練大模型幻覺率仍居高不下的當今,我們將會看到這樣一個局面:想要靠純粹的 LLM 能力突圍已經不再現實,從基礎模型上挖掘不到更多的寶藏。各家廠商都在產品側,以產品經理的思維尋找突破口。
本文來自微信公眾號:直面 AI,作者:涯角,編輯:肖陽