当日重点整理
通义千问3.6 Plus单日Token调用量破1.4万亿,刷新全球模型调用纪录
阿里云旗下通义千问3.6 Plus模型单日Token处理量突破1.4万亿,创下全球大模型调用量的历史新高。这一数据不仅体现了Qwen系列在企业级场景中的大规模落地能力,也标志着国产大模型在实际部署规模上已进入与国际一线模型正面竞争的阶段。对于关注大模型商业化进程的从业者而言,这是一个值得关注的里程碑式节点。 From ↗
GPT-realtime-1.5展示语音实时操控PPT能力,多语言与工具调用全面升级
OpenAI最新的GPT-realtime-1.5模型在演示中实现了通过语音实时操控PPT的功能,包括翻页、内容纠错、页面跳转和即时添加新内容。相比上一代,核心改进集中在指令遵循精度、工具调用可靠性和多语言覆盖三个维度。这意味着实时语音交互正在从“能听懂”向“能执行复杂操作”跃迁,为语音优先的AI应用场景打开了更大想象空间。 From ↗
MiniMax M2.7智能体任务评测追平闭源前沿,成本降至二十分之一
独立评测数据显示,MiniMax M2.7在核心智能体基准任务上的表现已与闭源前沿模型持平,但API调用成本降低约20倍,推理速度提升2至4倍。对于需要大量Agent交互的产品团队而言,这意味着在不牺牲质量的前提下可以大幅降低运营成本。MiniMax正试图以开源+低成本的组合拳撬动智能体应用市场。 From ↗
Gemma 4系列引爆本地部署热潮:16GB Mac可跑26B,多智能体架构追平Gemini Pro
Google Gemma 4系列在社区引发密集评测与讨论。26B A4B MoE版本被证实在16GB内存的Mac上即可流畅运行,打破了中等规模模型的部署门槛;31B版本通过多智能体群组架构达到Gemini 3.1 Pro级别的推理表现;社区还发现Gemma 4具备主动承认知识边界的特质,被评价为当前最佳全能本地模型。从量化方案到VRAM适配,围绕Gemma 4的本地部署生态正在快速成型。 From ↗
OpenAI疑似曝光代号“土豆”的新预训练模型,正面回应与Anthropic竞争态势
量子位报道,OpenAI疑似曝光一款代号为“土豆”的全新预训练模型。OpenAI方面罕见地正面回应了与Anthropic之间的竞争关系,同时暗示Sora项目被搁置可能与资源重新分配至新模型有关。如果消息属实,这将意味着OpenAI正在底层预训练架构层面进行重大战略调整,可能对整个大模型竞争格局产生深远影响。 From ↗
AI自动提交漏洞报告泛滥,Linux内核维护者不堪重负
有报道称,AI工具每天自动生成大量漏洞扫描报告并提交给Linux内核维护团队,导致维护者工作量激增。这些报告质量参差不齐,大量为误报或低价值信息,反而消耗了本就稀缺的维护者精力。这一现象暴露了AI自动化在开源治理中的副作用——当AI的产出速度远超人类审核能力时,“帮助”反而可能变成负担。 From ↗