Main Brief

当日重点整理

01 产品

Cursor自研编程模型在TerminalBench击败Claude Opus,成本大幅降低

Cursor自研的Composer 2模型在TerminalBench代码基准测试中超越Claude Opus 4.6,且推理成本仅为后者的一小部分。Fireworks AI作为底层推理服务商披露了这一成绩,量子位也确认该模型采用了新的强化学习训练方法。这标志着AI编程助手赛道从依赖第三方模型向自研模型的关键转变,性能与成本的双重突破可能重塑开发者工具的竞争格局。 From ↗

02 模型

阿里Qwen 3.5 Max Preview登顶国内模型,LMArena数学能力进前五

阿里通义千问发布Qwen 3.5 Max Preview预览版,在LMArena排行榜中进入专家榜前10和文本榜前15,数学类别排名第5。与上一代相比,文本、创意写作和数学等类别提升幅度高达57个百分点。量子位报道称该模型已登顶国内最强、全球前五。这是阿里在大模型竞赛中的一次重要卡位,表明国产模型在国际评测中的竞争力正在快速追赶。 From ↗

03 产品

Claude Code推出Channels远程控制功能,手机可接管电脑端编程会话

Claude Code在v2.1.80版本中新增Channels功能,支持绑定Telegram和Discord实现远程会话控制。用户可在手机端向电脑上的Claude Code发送消息、图片和文件,实现跨设备编程协作。多位开发者已分享详细的配置教程,包括创建机器人、安装插件、配置Token和配对等步骤。这一功能打破了AI编程助手必须坐在电脑前的使用限制,使开发者可以在移动场景下继续推进编程任务。 From ↗

04 产品

飞书发布Aily企业AI Agent,打通内部全流程并开放技能市场

飞书将Aily助手升级为正式的AI Agent同事,可打通消息、日历、文档等全部飞书内部功能,实现跨应用自动化工作流。产品主打无需调教、开箱即用,直接集成到对话列表并能基于用户上下文提供主动服务。官方推出技能市场保障企业安全,同时支持导入外部自定义Skills,大幅降低了企业创建Agent的技术门槛。这是国内企业协作平台向AI Agent化转型的标志性动作。 From ↗

05 产业

GPU供应危机加剧,多家提供商8xH100节点全面售罄

行业人士警告称,已有5家GPU提供商的8xH100节点完全售罄,当前的推理容量争夺战可能比2022年的GPU短缺危机更为严重。与此同时,阿里平头哥自研GPU芯片已累计交付47万片,覆盖互联网、金融、自动驾驶等行业,展示了国产替代的商业化进展。全球AI算力供需矛盾正在从训练侧蔓延至推理侧,算力基础设施的竞争已成为制约AI产业发展的关键瓶颈。 From ↗

06 产业

谷歌AI设计工具冲击行业生态,Figma等合作伙伴受波及

谷歌推出自研AI设计工具,直接对标Figma等设计软件的核心功能,对长期合作伙伴造成冲击。这一事件反映了AI能力正在从辅助工具升级为替代方案,传统SaaS厂商面临被上游平台降维打击的风险。与此同时,Marc Andreessen推荐的世界模型深度文章也引发关注,指出多家实验室已融资超10亿美元,世界模型被视为通往具身AI的关键路径。AI工具对传统软件生态的侵蚀正在加速。 From ↗