当日重点整理
通义千问上线Qwen3.5-Omni API:原生多模态理解直指视频内容处理
阿里通义实验室正式开放Qwen3.5-Omni API,该模型具备原生多模态理解能力,可直接解析视频场景中的视觉、语音与文本信息。不同于传统的分模块拼接方案,Qwen3.5-Omni以端到端方式处理视频输入,目标是让AI像专业剪辑师一样理解画面语义。这一API的开放意味着开发者可以在视频审核、内容摘要、字幕生成等场景中以更低延迟调用多模态能力。 From ↗
DFlash推测解码登陆Apple Silicon:Qwen3.5-9B推理速度飙升4.1倍
社区开发者开源了DFlash推测解码方案的Apple Silicon适配版本,在M5 Max上实测Qwen3.5-9B可达4.1倍推理加速且输出无损。推测解码通过小模型草稿加大模型验证的并行策略减少自回归延迟,DFlash在此基础上针对Apple Silicon的统一内存架构做了专项优化。该项目已在GitHub公开,供本地推理用户直接部署。 From ↗
MiniMax牵手戛纳AI电影节,巩俐出任主席
MiniMax(海螺AI)宣布成为戛纳世界AI电影节全球合作伙伴,并由巩俐担任电影节主席。这是AI生成内容首次在国际顶级电影节获得官方合作伙伴地位,标志着AI影视创作从技术实验走向行业认可。MiniMax同时开源了三项音乐技能——一键作曲、角色演唱和智能歌单,进一步扩展其在创意AI领域的生态布局。 From ↗
LM Studio成为OpenClaw官方本地模型提供商
本地模型工具LM Studio宣布正式成为OpenClaw的官方提供商。用户通过命令行即可将本地运行的模型接入OpenClaw生态,实现完全离线、零成本的AI助手部署,支持Mac、Windows和Linux三大平台。这意味着OpenClaw用户不再依赖云端API,可以在本地完成所有推理任务,隐私敏感场景下的使用门槛大幅降低。 From ↗
Cursor 3.1上线分屏多任务,大文件编辑丢帧率直降87%
AI编程工具Cursor发布3.1版本,新增多任务分屏功能——用户可像终端分屏一样同时运行多个AI智能体并行处理不同任务。性能方面,大文件流式编辑的丢帧率降低了87%,工作区搜索新增文件包含/排除过滤器。这些改进直指大型代码库场景下的效率瓶颈,让AI编程助手在复杂项目中的可用性进一步提升。 From ↗
LlamaIndex发布ParseBench:首个面向Agent时代的文档解析基准
LlamaIndex开源了文档OCR基准ParseBench,包含约2000页企业文档,覆盖表格、图表、多栏排版等五个维度,对14种主流解析器进行了系统评估。结果显示LlamaParse以84.9%的综合得分领先,但不同解析器在特定维度上各有优劣。该基准填补了Agent场景下文档解析质量缺乏标准化评测的空白,为RAG和文档智能应用的选型提供了量化参考。 From ↗