当日重点整理
Sora 2视频API全面升级:角色一致性、20秒时长与横竖屏双版本同步上线
OpenAI为Sora 2 Video API推出五项核心更新:跨片段角色一致性功能可在多个镜头间保持人物外观稳定;视频最大时长从10秒翻倍至20秒;新增16:9和9:16双比例同步导出;支持视频延续扩展场景;以及批量生成任务。更新随后向所有开发者开放,面向工作室、品牌和UGC平台等场景。 From ↗
DeepMind AlphaEvolve攻克5个经典拉姆齐数边界,部分为十余年来首次推进
DeepMind联合创始人Demis Hassabis宣布,AlphaEvolve在组合数学领域取得突破,改进了5个经典拉姆齐数的上界或下界,其中多个结果是该领域十多年来首次实质性进展。拉姆齐数是图论与组合数学中最难计算的数值之一,AlphaEvolve通过自动搜索程序发现了新的构造方案,标志着AI在纯数学发现中的又一里程碑。 From ↗
Google Maps正式接入Gemini,推出Ask Maps对话搜索与沉浸式导航
Google Maps完成与Gemini大模型的深度集成,正式上线Ask Maps功能——用户可用自然语言提问获取地点推荐和路线建议,同时推出Immersive Navigation沉浸式导航体验。这是大语言模型首次嵌入全球用户量最大的地图产品,将传统搜索框交互升级为对话式交互。 From ↗
百度AI云发布移动端AI助手Operator,可跨应用自动执行打车外卖等任务
百度AI云推出移动应用Operator,底层由OpenClaw驱动,用户通过自然语言描述需求即可让AI助手跨应用自动完成打车、点外卖、订票等操作。与传统语音助手仅能调用单一API不同,Operator可在多个App之间协调执行完整任务链,代表了移动端AI Agent从指令响应向自主执行的演进。 From ↗
英伟达拟五年投260亿美元开发开源大模型,从芯片商转型全栈AI实验室
据报道,英伟达计划在未来五年内投入260亿美元用于开发开源AI大模型,标志其从GPU芯片供应商向全栈AI研究实验室的战略转型。与此同时,原阿里千问大模型负责人郁博文已加入字节跳动。英伟达近期在开源领域动作频繁,包括发布Agent推理模型和在LM Studio上线120B参数Nemotron MoE模型。 From ↗
匿名图像模型Nano Banana在Arena创投票纪录,后被证实基于Gemini构建
一款代号为Nano Banana的匿名图像生成模型在Arena竞技平台创下历史最高投票数纪录,引发社区广泛猜测其真实身份。随后该模型被证实基于Google Gemini架构构建并已公开发布。匿名盲测模式下能获得如此高的用户偏好投票,表明其在图像质量或风格上具备显著竞争力。 From ↗