AI 日报｜2026-03-18

Main Brief

当日重点整理

01 模型

OpenAI押注小模型赛道：GPT-5.4 mini速度翻倍，nano版本将成本压到新低

OpenAI同时发布GPT-5.4 mini和GPT-5.4 nano两款小型模型。mini版针对编码和多模态理解优化，推理速度达到GPT-5 mini的两倍，性能逼近完整版GPT-5.4；nano版则定位更低成本场景。这是OpenAI首次在一个版本号下同步推出两个不同规格的小模型，暗示其产品线正从单一旗舰模式向多层级覆盖转型。 From ↗

02 产品

Midjourney V8登场：生成提速5倍，支持2K高清与多种长宽比

Midjourney正式发布V8模型，带来三大核心升级：图像生成速度提升至V7的5倍；复杂提示词遵循能力和画面连贯性显著增强；新增多种长宽比支持和2K HD输出模式。这是Midjourney自V6以来最大幅度的版本迭代，速度指标尤为突出，有望大幅降低批量创作和商业应用的时间成本。 From ↗

03 产品

Gemini「个人智能」向美国全量免费开放：AI助手开始读懂你的生活

Google将Gemini的Personal Intelligence功能结束内测，正式向美国所有免费用户开放。该功能通过上下文打包技术打通Gmail、Google相册、搜索历史等个人数据，提供跨服务的关联推理和个性化规划。此前仅对付费用户开放的功能如今免费普及，意味着AI助手正从通用问答工具进化为真正了解用户日常的个人助理。 From ↗

04 研究

DeepMind发布AGI认知评估框架，20万美元Kaggle黑客松全球征集基准方案

Google DeepMind发布了一套用于衡量AI向通用智能进展的认知评估框架，并同步在Kaggle发起全球黑客松，悬赏20万美元征集社区构建的能力基准测试方案。这是迄今最系统的AGI评估尝试之一——不再仅依赖单一考试分数，而是从认知维度拆解智能水平，力图为「AI离AGI还有多远」建立可量化的度量体系。 From ↗

05 产品

LibTV：首个同时面向人类与Agent的AI视频平台，接入Claude Code实现一句话成片

LiblibAI发布AI视频产品LibTV，采用双入口架构——人类用户通过传统UI操作，AI Agent则通过专用Skill接口调用。平台支持拖放节点组合多种视频模型进行创作，亮点在于其Skill可接入Claude Code等编码智能体，自动编排从剧本构思到剪辑输出的全流程，实现「一句话成片」。这是AI视频工具首次在产品设计层面将Agent作为一等公民。 From ↗

06 产业

阿里发布钉钉内置企业AI平台「悟空」，对标企业级Agent工作流

阿里巴巴正式发布名为「悟空」的企业级AI原生工作平台，将深度集成进钉钉生态。该平台面向企业提供行业定制化的AI解决方案，目标是将钉钉从协作工具升级为AI驱动的工作操作系统。这是继CoPaw开源个人Agent框架之后，阿里在AI Agent赛道的又一重要落子——从个人场景到企业场景全线布局。 From ↗