AI 日报｜2026-04-14

Main Brief

当日重点整理

01 产品

通义千问上线Qwen3.5-Omni API：原生多模态理解直指视频内容处理

阿里通义实验室正式开放Qwen3.5-Omni API，该模型具备原生多模态理解能力，可直接解析视频场景中的视觉、语音与文本信息。不同于传统的分模块拼接方案，Qwen3.5-Omni以端到端方式处理视频输入，目标是让AI像专业剪辑师一样理解画面语义。这一API的开放意味着开发者可以在视频审核、内容摘要、字幕生成等场景中以更低延迟调用多模态能力。 From ↗

02 开源

DFlash推测解码登陆Apple Silicon：Qwen3.5-9B推理速度飙升4.1倍

社区开发者开源了DFlash推测解码方案的Apple Silicon适配版本，在M5 Max上实测Qwen3.5-9B可达4.1倍推理加速且输出无损。推测解码通过小模型草稿加大模型验证的并行策略减少自回归延迟，DFlash在此基础上针对Apple Silicon的统一内存架构做了专项优化。该项目已在GitHub公开，供本地推理用户直接部署。 From ↗

03 产业

MiniMax牵手戛纳AI电影节，巩俐出任主席

MiniMax（海螺AI）宣布成为戛纳世界AI电影节全球合作伙伴，并由巩俐担任电影节主席。这是AI生成内容首次在国际顶级电影节获得官方合作伙伴地位，标志着AI影视创作从技术实验走向行业认可。MiniMax同时开源了三项音乐技能——一键作曲、角色演唱和智能歌单，进一步扩展其在创意AI领域的生态布局。 From ↗

04 产品

LM Studio成为OpenClaw官方本地模型提供商

本地模型工具LM Studio宣布正式成为OpenClaw的官方提供商。用户通过命令行即可将本地运行的模型接入OpenClaw生态，实现完全离线、零成本的AI助手部署，支持Mac、Windows和Linux三大平台。这意味着OpenClaw用户不再依赖云端API，可以在本地完成所有推理任务，隐私敏感场景下的使用门槛大幅降低。 From ↗

05 产品

Cursor 3.1上线分屏多任务，大文件编辑丢帧率直降87%

AI编程工具Cursor发布3.1版本，新增多任务分屏功能——用户可像终端分屏一样同时运行多个AI智能体并行处理不同任务。性能方面，大文件流式编辑的丢帧率降低了87%，工作区搜索新增文件包含/排除过滤器。这些改进直指大型代码库场景下的效率瓶颈，让AI编程助手在复杂项目中的可用性进一步提升。 From ↗

06 开源

LlamaIndex发布ParseBench：首个面向Agent时代的文档解析基准

LlamaIndex开源了文档OCR基准ParseBench，包含约2000页企业文档，覆盖表格、图表、多栏排版等五个维度，对14种主流解析器进行了系统评估。结果显示LlamaParse以84.9%的综合得分领先，但不同解析器在特定维度上各有优劣。该基准填补了Agent场景下文档解析质量缺乏标准化评测的空白，为RAG和文档智能应用的选型提供了量化参考。 From ↗