Main Brief

当日重点整理

01 模型

MiniMax M2.7 开源发布,SWE-Pro与Terminal Bench双榜登顶,生态迅速铺开

MiniMax正式推出M2.7模型,权重上线Hugging Face,在SWE-Pro和Terminal Bench 2两项评测中均取得SOTA。发布当日Ollama、vLLM、SGLang即提供Day-0支持,NVIDIA GPU加速端点同步上线,Unsloth上传Q1至BF16多种GGUF量化版本。不过社区对许可证提出质疑——该模型限制商业和军事用途,并非严格意义上的开源。Mac用户已实测63GB量化版本的MMLU表现。 From ↗

02 产品

Cursor 3 上线:界面全面改版,Composer 2 额度翻倍

Cursor发布第3版大更新,面向AI编程代理时代重新设计界面,同时将Composer 2的使用量配额翻倍。对于重度依赖AI辅助编码的开发者而言,这是一个直接影响日常工作流的产品升级,也意味着AI IDE赛道的竞争正在从模型能力转向使用量和体验的综合博弈。 From ↗

03 模型

百度Famou-Agent 2.0在MLE-Bench再破纪录,多智能体框架持续领跑

百度AI云开发的通用多智能体框架Famou-Agent 2.0在MLE-Bench评测中再次排名第一,刷新SOTA。新版本在进化策略优化、长程记忆机制和基础设施层面均有显著升级,显示出百度在多智能体系统方向的持续投入正在转化为可量化的评测优势。 From ↗

04 产品

即梦推出视频生成Agent Octo,用自然语言驱动无限画布创作

字节跳动旗下即梦发布视频生成Agent产品Octo。用户可在无线画布中通过自然语言控制组件和生成流程,随时呼出Agent对话框进行交互式调整。该产品试图将视频创作的技术门槛降到与文字对话相当的水平,是AI视频工具从辅助剪辑走向全流程代理的重要一步。 From ↗

05 产业

SaaS板块遭遇2万亿美元市值蒸发,AI冲击下的软件股全面溃败

一份行业报告显示SaaS板块正经历剧烈调整,总市值蒸发约2万亿美元。Figma、Duolingo等知名软件公司股价从52周高点下跌30%至86%不等,JP Morgan将此描述为'软件崩盘全面扩散'。市场普遍认为AI对传统SaaS商业模式的替代威胁是核心驱动因素之一,软件行业的估值逻辑正在被重写。 From ↗

06 安全

社区质疑Claude Mythos零日漏洞发现能力:仅198次人工审查支撑的宣传疑云

Anthropic此前声称Claude Mythos发现了数千个严重零日漏洞,但社区审查后发现该结论仅基于198次人工验证。批评者认为这一宣传存在明显的统计夸大嫌疑,质疑以如此小样本量得出大规模结论的科学严谨性。该事件引发了对AI安全能力宣传边界的广泛讨论。 From ↗