当日重点整理
Qwen3.6-Plus登顶OpenRouter三榜,性价比推理模型正式转正
阿里Qwen3.6-Plus在OpenRouter日榜、周榜、趋势榜全面夺魁后结束试用期正式上线。官方强调该模型在延迟和推理能力上均达顶尖水平,定价极具竞争力。继开源模型在LMArena同分厮杀之后,商业API端的价格战也正式开打——中小开发者的选择余地进一步扩大。 From ↗
Meta发布Muse Spark:首个原生多模态推理模型,支持视觉思维链与多智能体编排
Meta发布全新推理模型Muse Spark,主打原生多模态架构——不走拼接路线,而是从底层统一处理文本与视觉输入。该模型支持工具调用、视觉思维链推理和多智能体编排,被定位为Meta在Llama之后的第二条主线产品线。这意味着Meta正式从开源基座模型切入推理模型赛道,与OpenAI和Anthropic展开正面竞争。 From ↗
Anthropic推出Claude托管智能体服务,接管90%基础设施让Agent快速上生产
Anthropic正式发布Claude Managed Agents托管服务并进入公测。该服务将容器编排、沙箱隔离、状态持久化和错误恢复等基础设施工作全面接管,开发者只需定义Agent目标和权限即可部署。这实质上是把Agent从「能跑」到「能上线」之间的工程鸿沟填平——过去需要专职DevOps团队维护的复杂运维,现在一条配置就能搞定。 From ↗
字节Seedance 2.0视频生成评测断层领先,拉开Veo近80分
字节跳动Dreamina Seedance 2.0在LMArena视频生成竞技场中取得压倒性领先,总分高出第二名Veo-3.1-1080p近80分,较自家四个月前的v1.5 Pro版本提升近200分。视频生成赛道此前各家差距不大,Seedance 2.0的断崖式领先打破了均势格局,意味着字节在AI视频生成领域已建立起阶段性技术壁垒。 From ↗
微软开源MarkItDown:PDF/Word/Excel/PPT一键转Markdown,支持MCP直连AI客户端
微软开源命令行工具MarkItDown,可将PDF、Word、Excel、PPT、图片、音视频、网页等多种格式统一转换为干净的Markdown文本。该工具内置MCP Server支持,可直接接入Claude Desktop等AI客户端作为文档处理后端,并提供插件系统供社区扩展。对于需要将异构文档喂给大模型的开发者而言,这是一个缺失已久的基础设施工具。 From ↗
Anthropic Mythos发现大量零日漏洞触发限发,OpenAI新模型也走分阶段发布路线
Anthropic旗舰模型Mythos在红队测试中意外发现多个软件栈零日漏洞,Anthropic随即仅与苹果、微软等少数机构启动Project Glasswing防御计划,拒绝全面开放。OpenAI同期也宣布对代号Spud的新模型采取分阶段发布策略,限制仅向部分企业开放。Marc Andreessen警告称Mythos级别的安全能力可能在6-9个月内扩散至恶意行为者手中。前沿AI模型的双重用途风险已从理论讨论进入实际约束阶段。 From ↗