当日重点整理
Anthropic联合研究发现LLM存在潜意识学习机制,论文登上《自然》
Anthropic与多所机构合作的研究揭示了一个令人不安的现象:大语言模型可以通过训练数据中的隐藏信号,潜移默化地吸收偏好、不对齐行为等特质,即使这些信号从未被显式标注。这种被称为“潜意识学习”的机制意味着,恶意注入的微弱数据模式可能在模型中悄然扎根,且难以通过常规评估检测。论文已在《自然》期刊正式发表,为AI安全领域敲响了新的警钟。 From ↗
OpenAI Agents SDK密集更新:沙盒执行、开源可定制、多平台集成全面铺开
OpenAI在一天内为Agents SDK推送了多项关键能力升级。开发者现在可以在沙盒环境中安全运行智能体,查看并自定义开源框架代码,还能精确控制记忆的创建与存储位置。此外,SDK正式支持与Cloudflare、Vercel等主流云平台的深度集成。这一系列更新表明OpenAI正从模型提供商加速转向Agent基础设施平台,试图在智能体开发工具链上建立标准。 From ↗
Google发布Gemini 3.1 Flash TTS:用文本指令精细控制语音风格
Google DeepMind推出Gemini 3.1 Flash TTS文本转语音模型,最大亮点是新增Audio Tags功能——用户可以通过自然语言文本指令直接控制语音的风格、语速、情绪和表达方式,无需专业音频编辑技能。该模型支持70种语言,面向开发者和企业开放预览。相比传统TTS需要繁琐参数调校,这种“用文字指挥声音”的交互方式大幅降低了语音内容创作门槛。 From ↗
Windsurf 2.0将Devin云代理引入本地IDE,云端协同编程成为现实
AI编程IDE Windsurf发布2.0版本,正式集成Devin云代理能力。用户可以在本地IDE界面中统一管理所有代理任务,并将复杂或耗时的编程任务委托至云端执行——即使关闭本地终端,云端代理也会持续工作。这打破了本地IDE与云端Agent之间的壁垒,开发者无需在两种工作模式间切换,实现“本地指挥、云端执行”的无缝协同。 From ↗
代号duct-tape的神秘图像模型曝光,被推测为GPT Image 2,中文生成零错字惊艳社区
一个代号为duct-tape的图像生成模型正在小范围测试,社区普遍推测其为OpenAI的GPT Image 2。多位用户实测反馈该模型在细节准确度上远超前代,能够根据GitHub仓库链接自动生成信息正确的宣传海报,且中文文字生成几乎零错字——这在图像生成领域一直是公认的难点。模型的高保真信息提取能力和多语言文字渲染表现引发了社区广泛关注。 From ↗
Cal.com以AI安全为由将核心代码闭源,开源社区激烈反弹
知名开源日程管理工具Cal.com宣布将核心代码闭源,理由是AI时代下开源代码面临的安全风险。这一决定在开发者社区引发激烈争议:支持者认为AI降低了恶意利用开源代码的门槛,闭源是合理自保;反对者则指出此举是商业考量的遮羞布,且AI时代开源的价值反而更大。事件折射出AI能力提升正在重新定义企业对开源边界的认知。 From ↗