Main Brief

当日重点整理

01 模型

OpenAI押注小模型赛道:GPT-5.4 mini速度翻倍,nano版本将成本压到新低

OpenAI同时发布GPT-5.4 mini和GPT-5.4 nano两款小型模型。mini版针对编码和多模态理解优化,推理速度达到GPT-5 mini的两倍,性能逼近完整版GPT-5.4;nano版则定位更低成本场景。这是OpenAI首次在一个版本号下同步推出两个不同规格的小模型,暗示其产品线正从单一旗舰模式向多层级覆盖转型。 From ↗

02 产品

Midjourney V8登场:生成提速5倍,支持2K高清与多种长宽比

Midjourney正式发布V8模型,带来三大核心升级:图像生成速度提升至V7的5倍;复杂提示词遵循能力和画面连贯性显著增强;新增多种长宽比支持和2K HD输出模式。这是Midjourney自V6以来最大幅度的版本迭代,速度指标尤为突出,有望大幅降低批量创作和商业应用的时间成本。 From ↗

03 产品

Gemini「个人智能」向美国全量免费开放:AI助手开始读懂你的生活

Google将Gemini的Personal Intelligence功能结束内测,正式向美国所有免费用户开放。该功能通过上下文打包技术打通Gmail、Google相册、搜索历史等个人数据,提供跨服务的关联推理和个性化规划。此前仅对付费用户开放的功能如今免费普及,意味着AI助手正从通用问答工具进化为真正了解用户日常的个人助理。 From ↗

04 研究

DeepMind发布AGI认知评估框架,20万美元Kaggle黑客松全球征集基准方案

Google DeepMind发布了一套用于衡量AI向通用智能进展的认知评估框架,并同步在Kaggle发起全球黑客松,悬赏20万美元征集社区构建的能力基准测试方案。这是迄今最系统的AGI评估尝试之一——不再仅依赖单一考试分数,而是从认知维度拆解智能水平,力图为「AI离AGI还有多远」建立可量化的度量体系。 From ↗

05 产品

LibTV:首个同时面向人类与Agent的AI视频平台,接入Claude Code实现一句话成片

LiblibAI发布AI视频产品LibTV,采用双入口架构——人类用户通过传统UI操作,AI Agent则通过专用Skill接口调用。平台支持拖放节点组合多种视频模型进行创作,亮点在于其Skill可接入Claude Code等编码智能体,自动编排从剧本构思到剪辑输出的全流程,实现「一句话成片」。这是AI视频工具首次在产品设计层面将Agent作为一等公民。 From ↗

06 产业

阿里发布钉钉内置企业AI平台「悟空」,对标企业级Agent工作流

阿里巴巴正式发布名为「悟空」的企业级AI原生工作平台,将深度集成进钉钉生态。该平台面向企业提供行业定制化的AI解决方案,目标是将钉钉从协作工具升级为AI驱动的工作操作系统。这是继CoPaw开源个人Agent框架之后,阿里在AI Agent赛道的又一重要落子——从个人场景到企业场景全线布局。 From ↗