国产一级色_蜜桃αv_伊人www_99久久婷婷国产综合精品电影_大陆毛片_国产精品久久久久久久久久免费看

關于ZAKER 合作
虎嗅APP 11小時前

新 Agent 玩起了“無限流”

本文來自微信公眾號:直面 AI,作者:涯角,編輯:肖陽,題圖來自:AI 生成

Manus 的 " 上帝之手 " 稱號近日被一個新的 AI 智能體—— Flowith 旗下的 Neo 奪走了。這款智能體背后的團隊不僅異常年輕,還在社交媒體上宣稱在 0 營銷投入的情況下,實現了 130 萬美元的 ARR 收入。

在 GAIA 智能體評測標準的三個等級中,Neo 不僅超越了 Manus,還創下了新的評分記錄。其中 Level1 和 Level3 更是突破了 " 整數級 " 評分。

目前的智能體市場可謂 " 大風起兮云飛揚 ",新玩家不斷涌入這一賽道。從傳統互聯網巨頭到專注產品研發的初創團隊皆有涉足。

各類產品紛紛打著 "AI 智能體 " 的旗號,但正如一些網友所說:許多所謂的智能體,不過是在 Manus 的框架上又疊加了一層 LLM 而已,萬物皆可套殼。

今天,讓我們深入分析下這款標榜自己是 " 下一代 AI 生成力 " 的產品,看看它是不是 " 穿新鞋,走老路 "。

一、Flowith Neo:無限步驟、無限上下文、無限工具

在 Flowith 產品官網中,如果點開輸入框右上角的 Agent Mode,則會自動啟用 Agent Neo,在此模式下,Neo 可以智能調控各種大模型,完成長序列的復雜任務。

在非智能體模式下,Flowith 則提供了諸如常規模式、聯網搜索、圖片 / 視頻生成等 " 垂類功能模式 "。每一個模式里都集成了數量非常多的市場主流 LLM。

Flowith 將它們能夠提供的所有存貨幾乎都擺了出來,并分成 T1/T2 兩個陣營,我稍微數了下,一共近 30 個模型。

它們集成了市場上幾乎所有主流的大模型,涵蓋了幾乎所有模態,例如 Claude 3.7 Sonnet、Grok3、GPT Image1、Gemini 2.5 Pro preview、o3、o4 mini、DALLE 3、Flux、Recraft 和 Kling 等。

相對于 Flowith 的上一代智能體 Oracle,Neo 最大的提升在于,它將任務搬到了云端執行,智能體嵌套、上下文、工作步驟都得到了大幅的性能和穩定性提升。

這款新晉智能體產品主要有三個亮點:無限步驟、無限上下文和無限工具。

我們通過一系列測試來逐一展示這些特點。

1. 無限步驟

Neo 由于將任務的執行搬到了云端,現在的它幾乎可以在任務中一直工作,即便用戶關閉了網頁,它對于用戶本身網絡環境的依賴已經不再是必需的了。

一個最明顯的樣本是:它可以幫你訂閱大量平臺的所有關鍵 KOL 或新聞媒體,并調用推理和相關模型撰寫報告,發送到你的郵箱。用戶還可以規定發送的頻率,Neo 幾乎會無限制地在云端跑流程,不斷地重復工作步驟。

如果想要 Neo 完成此類任務,可以直接輸入一段非常簡單的 Prompt:

請你幫我找到 10 家最主流 AI 新聞媒體,并將它們最新更新的消息做成簡報,每兩小時更新一次,發送到我的郵箱。

Neo 會以非常快的速度處理用戶的 Prompt,它此時的第一步就是在工作流程中與用戶交互,確認我的電子郵件地址。

Neo 制定了一個非常詳細的流程圖,明確每個步驟的任務,為自己做出了一個清晰的整體視圖。

Neo 會按步驟執行工作,收集所需知識和信息。信息來源十分廣泛,并且會不斷地檢查信息內容是否與用戶需求相一致。

以下就是 Neo 所找到的 10 家 AI 新聞信息源:

Neo 會從先前確定的 10 家 AI 新聞媒體的官方網站分別獲取各自最新的 3~5 篇 AI 相關新聞報道的詳細內容,并使用 browser 從每個網站上獨立抓取信息。

Neo 會多線程同時處理 10 家媒體的信息抓取任務,并將所有信息整合做出一份簡報:

第一份結構化的 AI 行業最新簡報順利地發到了我的郵箱,內容幾乎占用了 12 頁的 Word 文檔。

后續,我的郵箱中陸續收到了幾份來自 Flowith 在云端執行定時任務的稿件。

2. 無限上下文

從實際體驗來看,Neo 的上下文非常之長,常常能達到數萬甚至數十萬字的地步。

這種超長的上下文能力使得 Neo 能夠記住之前的對話內容,保持上下文連貫性,避免了頻繁重復之前的敘述或信息,從而提升了交互的效率和質量。

在實際應用中,這意味著我們可以與 Neo 進行長時間、多輪次的深入對話,而無需擔心它會 " 忘記 " 之前的討論內容。

比如,我試著讓它做了一個全球文科倒閉潮的可視化報道切片,提示詞比較簡略:

收集 2024 年至今中國大陸、新加坡、英國、美國、韓國、日本所有大學裁撤文科的情況,并在一張世界地圖上進行可視化呈現。

拿到提示詞后,Neo 會先在左側的 workflow 面板里自行規劃出一整套清晰的工作流程,然后按步驟一項項執行任務。

考慮到最終生成的內容可能過多導致混亂,它貼心地設置了一個 Files 面板,將所有生成的文件整理歸類,便于隨時查閱。

不到十分鐘,它就收集好了九個地區的數據,并自動整合成了一篇結構完整的報道。內容不僅詳實、分析有理,而且自帶思辨性,與用戶的意圖進行了對齊。

Neo 設計的交互界面幾乎是一步到位,呈現效果也非常流暢自然。

" 無限上下文 " 的 Neo 究竟能產生多少個文檔?這是一個無法給出確切數字的問題。

在這一項任務中,它就累計了如此多的信息內容:

3. 無限工具

Neo 的操作流程兼容多種外部工具,并整合了 Flwith 自推出以來就廣受好評的知識花園功能。知識花園其實就是我們一般所說的 " 知識庫 ",但Flowith 會在你上傳知識內容后,以 "Seed" 作為最小單元識別其中的知識。

為了增強 Neo 的檢索能力,我會外掛知識花園中與 AI 相關的知識庫,以增強 Neo 的檢索能力,其中包含與人工智能相關的豐富信息。

然后輸入 Prompt:

幫我找到 20 個非常專業的 AI 科技 X(原 Twitter)博主,做成網頁。

然后,我又讓 AI 模型自動豐富這些提示詞,規定好了顏色顯示等條件。

Neo 開始調用外掛工具,進行大量的相關信息搜索:

在 Neo 實際的工作步驟中,Flowith 將所有工作流搬到了 " 無限畫布 " 中,很直觀地顯示出了一個 " 紡錘形 " 的思考樣態。

在進行 HTML 網頁任務的前期,Neo 會先進行知識積攢,這也是為何思維流程中體現出 " 兩邊細,中間寬 " 的形態。

經過三個版本的迭代,Neo 成功制作了一個 HTML 網頁項目。

在這個網頁中,它將奧特曼、楊立坤、吳恩達等一眾 X 上的 AI 科學家和博主匯集在一起,為每個人貼上了標簽,并實現了交互功能。每個名字下方還附有該博主在 X 上的鏈接,用戶可以一鍵直接訪問。

您目前設備暫不支持播放

可以看得出來,Neo 非常適合這類 " 需要調用多種工具并且高度復雜的任務 ",它對于大模型的調控和整體流程的把控都非常嚴謹。

比如,Neo 與其他 AI 智能體最大的一個區別就是:它會在工作流程中大量地嵌入審查機制,比如在每一個結果產出之前和之后都會進行自我反思。即便在所有項目結束后,也會給出好幾份審查報告、項目總結報告等。

在每一個節點中,Flowith 都允許使用者進行單一節點的微調工具。

在文檔文件中,Flowith 則允許用戶使用文本編輯器,實時手動更改文件內容甚至是代碼。無論是在編寫程序代碼還是修改文檔內容方面,Flowith 都提供了一個直觀且友好的操作界面。

這樣將用戶也視作參與者的操作,雖然有放權的嫌疑,但也能夠讓其后續的生成效果更好。

Neo 能將整個創作流程以可視化流程圖的方式展示出來,我可以對其中任意節點 " 點選修改 "" 局部重啟 ",真正實現模塊化調用 " 無限工具 " 創作的自由調度。

這可能是 Neo 區別于傳統 Agent 的關鍵能力:不是 " 從頭再來 ",而是 " 就地優化 "。

二、Flowith,一家在 OpenAI o1 發布之前就早已深耕 Agent 賽道的選手

Flowith 最初在全網嶄露頭角的名稱還只是 " 畫布式 AI 創作平臺 ",但卻一直在探索智能體方向,第一代產品 Oracle 于 2024 年 8 月就已發布,甚至早于 OpenAI 的推理模型 o1 的發布。這款產品在各個社區都有一定的熱度。當時的 Flowith 憑借 Oracle 甚至被譽為 " 讓 Chatbot 式 AI 成為歷史的下一代工具 "。

這家初創企業背后的團隊也異常年輕,Flowith 由倪正民(Derek Nee)團隊于 2024 年正式推出。這位 96 后 CEO 在 20 歲前就曾創立 X Academy、項目超過千萬人民幣 ARR 的 Realm 項目,都曾風動一時。

據 " 觀察者網 " 心智觀察,Flowith 的全體團隊都是 95 后,市場負責人郭梓溢本人則是 00 后。這家團隊在架構體系中幾乎將任務導向做到了新高度:每周團隊可能會有 100 個任務,而每個人只需摘取自己最適合的任務。他們在團隊構建中拋棄了傳統的任務分配機制,轉而采用鼓勵極致創新的開放式思路。

在這樣的團隊中孕育出來的 Oracle 顯然也帶有創新基因,這款產品最大的特色在于交互范式的創新。它沒有沿用傳統聊天框 + 黑箱執行的模式,而是開創性地引入了畫布多線程交互理念。Flowith 沒有自己訓練大模型,而是專注于上層架構和交互創新:通過可視化工作流編排,把 LLM 的推理能力、搜索工具、插件能力組合起來。

這一理念的背后,其實代表了兩種 AI 使用觀念的差異:Manus 等追求的是 AI 完全自主行動,用戶給出指令后 AI 自主完成一切;而 Flowith 則強調 " 用戶 " 角色,等同于坦誠了一個事實:現在還不存在通用 AI 智能體,但是有了用戶的參與,Flowith 能夠表現得更好。

比如,在上面的操作演示中,我們可以清楚地看到,Flowith 為用戶提供了微調和干預流程的能力,確保 AI 輸出更精準地滿足特定需求。例如,用戶可以在 Flowith 畫布的特定節點添加自定義數據源,使最終報告的關鍵信息往往能超越 Manus。

三、與大廠截然不同的思路

百度 Q1 財報的公眾號文章中就把 AI 智能體放在了很重要的位置,不斷地強化自家平臺已經接入 " 幾千 +MCP 組件 ",在未來更是會將通用 AI 智能體的任務類型擴展到數十萬的水平。然而,Flowith 卻走了條不同的路:研發了個 " 模擬人類大腦思維流程 " 的 AI 智能體工作流。

這或許僅是一種噱頭,實際上更多地取決于使用者的個人偏好,這也反映了當前智能體市場所呈現的世界參差感:熱愛者視之為真愛,可能是通向 AGI 的必由之路,而不喜歡者則覺得這玩意就是個噱頭。

不過,不得不說的是,Flowith 仍然使用行業主流的 LLM,在智能能力上沒有顯著突破。它的優勢在于速度更快、操作更流暢以及更強的反思能力。盡管如此,Flowith 還是成功地將智能體產品投入市場,因此建立了獨特的競爭優勢。

Flowith 所塑造的競爭壁壘主要在于用戶社區和創新速度。前一代 Oracle 自發布以來,到今年 Neo 推出之前,一直在小眾社區中保持了一定的熱度,但也受到不少批評,比如多線程工作容易卡死、非云端導致用戶過于依賴網絡環境。

不過,Neo 的上線很大程度上解決了這些問題。

Flowith 的另一個潛在壁壘是團隊一直想要構造的 " 社區 "。各網絡平臺上其實一直都有這么一句笑言:少玩產品,多搞社區。比如 Flowith 很早就搞了個 " 知識花園 " 功能模塊,每個人跑完自己的工作流程還可以繼續分享 Recipe 到社區里。這就會形成獨特的知識共享網絡,這會吸引新用戶的加入。

總的來說,Manus、Lovart、字節的扣子空間、百度的心響,以及一些將 AI 智能體應用于自家搜索產品的公司,構成了整個智能體賽道。

但目前來看,與行業熱度一起到來的還有些許亂象。

從 Manus 在 GAIA 上的綜合成功率顯著超過 OpenAI 的 DeepResearch 等系統,刷新了該基準的 SOTA 性能紀錄開始,幾乎所有大廠全部下場搞智能體。然而,沒過多久,這些產品的宣傳重點從智能體的能力轉向了產品本身的能力,接著又開始宣傳 MCP 工具的接入。

整個行業好像已經從 AI 能力優先,轉化為生態優先。先將產品做出來,搶奪完用戶,再煮酒論英雄。像 Flowith 這樣的智能體在整體工作流程中幾乎將自己的 " 腸子 " 都挖出來,向各位看官證明一下自己吃了幾碗粉,仿佛成了一股清流。

前 OpenAI 副總裁 Lilian Weng 曾在博文中將智能體的標配總結為:Agent = LLM + Memory + Planning + Tool Use。

而在預訓練大模型幻覺率仍居高不下的當今,我們將會看到這樣一個局面:想要靠純粹的 LLM 能力突圍已經不再現實,從基礎模型上挖掘不到更多的寶藏。各家廠商都在產品側,以產品經理的思維尋找突破口。

本文來自微信公眾號:直面 AI,作者:涯角,編輯:肖陽

相關標簽
ai
虎嗅APP

虎嗅APP

有視角的商業資訊與交流平臺

訂閱

覺得文章不錯,微信掃描分享好友

掃碼分享
主站蜘蛛池模板: 欧美.com| 嫩草视频入口 | 国产激情在线观看视频 | 国产成人精品999在线观看 | 麻豆av免费观看 | 欧美看片 | 久久aⅴ乱码一区二区三区 亚洲国产成人精品久久久国产成人一区 | 欧美日在线 | 99热精品久久 | 干出白浆视频 | 国产91黄色 | av电影一区 | 99热热 | 久久9精品 | 天天干天天爱天天操 | 精品国产一区二区三区久久久蜜月 | 国产美女久久 | 国产精品欧美一区二区 | 国产成人在线视频 | av黄色在线 | 日韩精品免费视频 | 一级毛片大全免费播放 | 国产一区二区三区在线 | 国产精品久久久久久久7777 | 成人免费小视频 | 99精品热视频 | 91久久精品一区二区二区 | 国产99久久精品 | 亚洲欧美久久 | 在线区| 久草欧美| av一区二区三区四区 | 久久国产精品视频 | 丁香婷婷综合激情五月色 | 精品二三区 | 国产精品一区一区三区 | 久久久爽爽爽美女图片 | 人人做人人澡人人爽欧美 | 91国语清晰打电话对白 | 国产精品一区二区三区久久久 | 美女视频黄色片 |