当日重点整理
Google发布Gemini 3.1 Flash Live语音模型,实时对话延迟大幅降低
Google正式推出Gemini 3.1 Flash Live语音模型,集成至Gemini Live和Search Live。该模型针对低延迟实时对话场景优化,具备语气感知能力,对话记忆容量翻倍,在嘈杂环境下指令理解能力显著提升。开发者可通过Google AI Studio的Live API进行构建,标志着语音AI从"能用"向"好用"的关键跨越。 From ↗
OpenAI Codex推出插件生态,原生对接Slack、Figma、Notion等主流工具
OpenAI为Codex正式推出插件功能,内置Slack、Figma、Notion、Gmail等常用工具集成,支持代码编写前后的规划、研究和协调工作。插件在Codex应用、CLI和IDE扩展三端通用,用户还可通过对话直接创建自定义插件。这使Codex从纯编码助手进化为覆盖开发全流程的智能体工作台。 From ↗
苹果据报计划在iOS 27中允许第三方AI接入Siri
据彭博社报道,苹果计划在iOS 27中开放Siri的第三方AI接入能力,用户可在设置中将Siri请求路由至ChatGPT、Gemini、Claude等外部AI服务。此举被视为苹果在AI助手领域从封闭走向开放的战略转向,可能通过App Store抽成机制开辟新的收入来源,同时为第三方AI厂商打开iOS生态的流量入口。 From ↗
Chroma开源200亿参数搜索代理模型Context-1,Apache 2.0许可
Chroma发布并开源了200亿参数的搜索代理模型Context-1,采用Apache 2.0许可证。官方称该模型在代理搜索的帕累托前沿、推理速度和成本效率上均实现了数量级提升。作为专为检索增强生成(RAG)场景设计的搜索代理,Context-1的开源为开发者提供了构建高质量搜索系统的强大基座。 From ↗
OpenAI ChatGPT广告试点六周年化收入破1亿美元,已有600+广告主
ChatGPT的广告变现实验交出了惊人成绩单:上线仅六周便实现超1亿美元的年化营收。目前广告仅触达不到五分之一的日活用户,却已吸引600多家品牌方参与,准入门槛设在20万美元。OpenAI正酝酿在未来几周内将这一模式推广到更大范围,为AI对话产品开辟了一条全新的商业化路径。 From ↗
Google Translate实时翻译功能解除耳机限制,覆盖70+语言并扩展至12国
Google Translate的同声传译能力迎来重大升级:现在任何品牌的耳机都能直接使用,不再局限于特定硬件。借助Gemini模型的加持,系统能识别并还原说话者的声调风格,覆盖70余种语言,服务范围也从原先的少数市场扩展到了12个国家。 From ↗