二区在线观看,黄色欧美一级片,久久一二区

本文來自微信公眾號：直面 AI，作者：涯角，編輯：肖陽，題圖來自：AI 生成

目睹完今天 Claude 4 的發布會全程，我只看到了一句話 ——大模型正在范式轉變， AI 智能體時代真的來了。

AI 編程的唯一真神 Claude 3.7 Sonnet，終于被 Antrhopic 的下一代 AI 大模型—— Claude Opus 4 和 Claude Sonnet 4 徹底淘汰掉了。各國網友對此有非常直觀的感受，比如有人在一手實測中瘋狂夸贊 Claude 4：" 它一下子就能寫出 8000 行代碼 "。

除了 Claude 4 的推出之外，他們還順手給了幾個新智能體時代的功能拓展。

我們先從大模型講起。

一、Claude 4 瞄準了 AI 智能體編程

這次，他們推出的 Claude Opus 4 和 Claude Sonnet 4 這兩款模型都是混合模型：及時響應與深度思考并重。

可見，混合思考架構已然成為未來大模型的趨勢，用戶需要在簡單的需求下獲得更快的回復，在復雜要求中獲得更好的生成結果。兩款模型在性能、功能和應用場景上有了顯著提升，價格卻與之前的 Opus 和 Sonnet 模型保持一致，內部優化做得很好。

先從評分開始看起。Claude 4 模型在用于評估真實軟件工程任務性能的 SWE-bench Verified 基準上堪稱 " 遙遙領先 "。值得一提的是，在本次評分對比中，Claude 4 特意被拉來與 OpenAI 前幾天剛剛高調發布的 " 最強 AI 編程智能體 Codex-1" 進行正面較量。

Claude Opus 4 在編碼、研究、寫作和科學發現等人類復雜性高的任務方向，拓展了邊界。比如，在編碼領域它被 Cursor 稱為頂尖技術，顯著提升復雜代碼庫的理解能力，適合處理復雜的編程任務。Cognition 則強調 Opus 4 已經能夠解決其他模型無法應對的復雜任務。

Claude Sonnet 4 將 " 天賦 " 融入日常使用場景，這款均衡型模型在內部和外部應用中兼顧了性能與效率，雖在多數領域不及 Opus 4，但提供了能力與實用性的最佳結合。它非常適合需要自主性的場景。iGent 的報告指出，Sonnet 4 在自主開發多功能應用方面表現驚艷，錯誤率從 20% 驟降至幾乎為零。

在下面這張綜合基準測試評分表中，Claude 4 與其他市場主流大模型在編程、推理、多模態能力、智能體任務方面都拉開了一定差距。

有趣的一點是，Anthropic 將最左側的數個基準測試名稱中都加入了 "Agentic"。

2025 是 AI 智能體時代這一說法，再次被確認。

在 Anthropic 的官方發布中，有很大的篇幅著重介紹了 Claude 4 系列在 " 復雜項目 " 構建中的震撼級能力。其中，官方著重引用了 Github Copilot、iGent，甚至是 Manus 等平臺的反饋。日本一家名叫樂天得企業，甚至讓 Claude Opus 4 獨立編程 7h，團隊自己都有些驚訝。

前段時間剛一問世就被網絡平臺譽為 " 上帝之手 " 的 Manus 則在報告中大贊 Claude Sonnet 4，稱它復雜指令遵循能力和輸出的美觀度非常高。

可以預見的是，目前智能體賽道的各個選手將會第一時間集成 Claude 4，因為它相對于之前的 Claude 模型在智能體任務中有了太多的改進。

比如：

1. Opus 4 和 Sonnet 4 不再像 Sonnet 3.7 那樣愛走捷徑和漏洞了，這種不正常的行為發生率直接降低了 65%。

2. Opus 4 也迅速跟進了 " 記憶增強 "，現在它可以更好地執行長期任務了。

3. 使用小型模型壓縮冗長的思考過程，自己去做思考摘要。

圖注：Claude Opus 4 在玩《寶可夢時》自主記錄筆記。

二、Claude 4 其實是 LLM + Agent 的混合體？

除了 Claude 4 發布之外，整場發布會的另一個側重點是：Claude 代碼已經發布。用戶已經能夠通過終端、IDE （VS Code 和 JetBrains）及通過 Claude 代碼 SDK 后臺將 Claude 融入開發流程。用戶可以在終端中直接利用 Claude，瞬間搜索百萬行代碼庫。

在官方介紹中，Claude Code 搭載 Claude Opus 4，可以通過智能體搜索全面理解代碼庫，無需手動選擇上下文即可協調多個文件更改，無縫融入工作流，直接運行于終端。

只需在 IDE 終端運行 Claude 代碼即可安裝，可擴展的 Claude 代碼 SDK 還能讓用戶輕松 " 打造自定義智能體和應用 "。Anthropic 給想要構建智能體的用戶們又打上了一劑強心針。

Anthropic 還發布了幾個面向智能體的新功能：代碼執行工具、MCP 連接器、文件 API，以及最多可緩存一小時提示詞的能力，讓 Claude 4 幾乎成為了智能體專精模型。在我看來，這就是 Anthropic 在 AI 下半程 " 智能體入口爭奪戰 " 中的大動作。允許模型將推理與外部資源結合的設計，使 Claude 4 架構更像是一個 LLM+Agent 的混合體。

可以這么說，整場發布會看下來，Claude 4 幾乎是將自己確立為 "AI 智能體時代 " 最能用也是最好用的大模型。

除了技術側內容，Anthropic 在安全上的操作一直都非常令人 " 印象深刻 "，封號封的各個社區怨聲載道。官方這回依舊強調了這些模型都經過了廣泛的測試和評估，比如他們用了 ASL-3 安全分類，在這個風險標準下："AI 系統具有顯著增加災難性濫用風險 "。

他們還是沿襲了 Anthropic 的標志性安全策略—— " 憲法 AI"（Constitutional AI）。該方法為模型嵌入了一套 " 憲法 " 原則，通過額外的 AI 模型對用戶的輸入和模型的輸出進行再度掃描，檢查是否有 " 壞 " 的內容，決定是否放行。這回，Anthropic 放出來的模型卡 PDF 中足足有 123 頁，其中大部分仍然是在專注于 AI 安全的測試。

比如，Anthropic 決定根據 AI 安全級別 3 標準發布 Claude Opus 4，根據 AI 安全級別 2 標準發布 Claude Sonnet 4，分級分的非常精準。

但是，現在的外網針對 Claude 4" 過于高 " 的安全措施的討論，幾乎亂成了一鍋粥。因為有網友似乎基于 Claude 給出的系統卡文件爆料：Claude 4 會檢測用戶內容，并自主 " 報警 " ……

雖然暫無法確定這些爆料是否真實，但也確實反映了大家認為 Claude 4 的安全措施真的太過于嚴格了，甚至到了可能影響用戶體驗或功能性的地步。畢竟，國內的 Claude 使用者已經流行起了 " 打一槍，換一個地 " 的使用策略。

三、Claude 4 在實測中全面提升

目前各個社區、各個國家的網友全部在瘋狂測試這款即將取代 Claude 3.7 Sonnet 的大模型。為了支撐智能體中常常需要的長序列復雜處理任務，具有美感輸出能力且超強的 AI 編程能力的大模型仍然是極度稀缺的。Claude 4 系列只是看前方無人在，順勢補缺而已。

那么說到底，Claude 4 面對復雜性任務，表現到底有多超綱？

下面來看看全網實測案例：

Claude 4 與 Blender MCP 的連接，讓產品 3D 模型設計幾乎有了質的飛躍。像是有網友使用 Claude 4 和 Blender 通過 MCP 聯動制作了日本清水寺的 3D 模型。這回的 Claude 4 相比于前代 Claude 3.7，編程時間大幅減少，全程無需 " 人類陪伴 "，AI 的幻覺發生率也下降了很多。

甚至還有網友使用 Claude Opus 4 制作了類似 Bemani 2DX 風格的游戲。不僅重現了經典的音樂游戲體驗，還融入了許多創新元素，提升了游戲的可玩性和趣味性。

您目前設備暫不支持播放

Claude 4 在面對復雜任務的處理上十分得心應手。比如有網友輸入提示詞：用立體相機拍攝物體，推測 3D 空間坐標，并通過交互式可視化展示，并支持拖動。

除了硬核編程能力的提升之外，Claude 4 在設計感上正如 Manus 所說，有了很大的美學提升。很多網友曾在各個社區評論下笑稱：各個智能體什么小游戲都能做，但是沒見過做 PPT 的。

一位外網網友就試著讓 Claude 4 制作說明幻燈片，呈現出來的效果非常具有設計感，整體要素也更加簡潔。

在美學的提升方面，這有個更直觀的 Case。一位網友只給了 laude Opus 4 一小段提示詞：" 將書籍《Piranesi》作為 p5js 3d 空間，do it for me"，沒有摻雜任何其他元素。

Claude Opus 4 甚至在初版原型中加入鳥、光照、水面等元素，雖然效果還比較基礎，但仍能反映這款旗艦模型的性能。

目前，大量的 AI 編程平臺（像是 Cursor、Trae、WindsurfVapi、Codegen）、智能體產品（像是 Flowith）內幾乎都迅速接入了 Claude 4 系列，畢竟它可能是能進一步提升智能體表現的重要模型。

Anthropic 由于一直以來專注于安全頂層設計，而常常被認為 "他們還沒有找到一個合適的 AI 入口，只能當個掃地神僧，甚至沒有辦法參加到最高級別的公開賽場之中"。

當 Claude 4 系列模型發布，以及其他像是代碼執行器、MCP 連接器、Claude 代碼等等面向智能體產品的功能模塊推出，Anthropic 可以說已經拿到了一個非常好的 " 智能體入口 "，正式站到了頂級賽場。

從 Anthropic 去年推出 MCP 協議以來，再到 Claude 4 的出現，他們已經在事實上為 AI 智能體時代按下了 " 加速鍵 "。Anthropic 的 CEO —— Dario Amodei 為整個 AI 大模型賽道明確了一個未來的方向：真正優秀的 AI 大模型，一定是 " 大模型 " 與 " 智能體 " 的深度融合 —— 它能編程、能思考，還能自主解決復雜問題，甚至具備了美學與設計感。

AI 的下半場早已經開啟，Claude 4 正在引領一場新的 " AI 大模型 + 智能體 " 范式轉變。

本文來自微信公眾號：直面 AI，作者：涯角，編輯：肖陽

国产一级色_蜜桃αv_伊人www_99久久婷婷国产综合精品电影_大陆毛片_国产精品久久久久久久久久免费看

宙世代元宇宙

元宇宙黨建解決方案

元宇宙文旅解決方案

元宇宙展廳解決方案

元宇宙行業峰會解決方案

元宇宙營銷解決方案

元宇宙會展解決方案

元宇宙演藝節目解決方案

元宇宙博物館解決方案

元宇宙圖書館解決方案

元宇宙校園解決方案

元宇宙企業展廳解決方案

元宇宙藝術展解決方案

元宇宙電商解決方案

融媒體解決方案

ZAKER智慧云

媒體解決方案

黨建解決方案

公檢法解決方案

智慧交通解決方案

高校解決方案

AI視頻剪輯

AI視頻剪輯

AI智能客服

AI工具箱

AI寫稿助手

AI口語陪練

我的訂閱

Manus 都點贊的 Claude 4，究竟好在哪兒？

宙世代

一起剪

相關閱讀

微信盜用好友資料給朋友圈廣告寫評論？騰訊員工回應

美國法官暫時叫停哈佛招收外國學生禁令 漫長法律斗爭才剛開始

文和友異地擴張失效：一場曲折的商業冒險

啤酒、飲料攻防戰：互相進入對方的賽道

特朗普公開怒斥歐盟貿易不公，威脅下月對其征收50%關稅

文和友異地擴張失效：一場注定失敗的商業冒險

十五運會期間城市交通如何保障？按“大小流線”規劃賽時路線，日均超250輛運輸車提供服務

“原來咁有型”！從Molly到Labubu，香港潮玩IP在文博會大放異彩

How “guzi economy” may change the game for Guangdong’s cultural industry

南財數據周報（49期）：北京探索產品“一地上架、地方互認”；江蘇省數據產業基金出資額達15億

東方甄選回應被造謠文旅直播收天價宣傳費：已勝訴 對方判賠3.6萬

女子甘孜海拔4000多米遇車禍救助四人，交警：車后溜致側翻，一人去世

以文博會為媒 激活荔枝文化基因

金粉世家 白小姐報復燕西為哪般？主要她做了件丟份兒的事

彥祖有這張臉，干什么都會成功的

最新評論

讀覽精華

熱門推薦

美國法官暫時叫停哈佛招收外國學生禁令漫長法律斗爭才剛開始

東方甄選回應被造謠文旅直播收天價宣傳費：已勝訴對方判賠3.6萬

以文博會為媒激活荔枝文化基因

金粉世家白小姐報復燕西為哪般？主要她做了件丟份兒的事