AI 日报｜2026-03-04

Main Brief

当日重点整理

01 产品

OpenAI全量推送GPT-5.3 Instant：砍掉"爹味"说教，联网搜索体验大幅改善

OpenAI正式向所有用户推送GPT-5.3 Instant。本次更新的核心改进是显著减少模型的说教式拒绝和不必要的免责声明——社区长期反馈的"爹味"问题终于被正面回应。同时，联网搜索场景下的上下文理解能力和回复一致性也获得提升，旨在提供更准确、更自然的对话体验。 From ↗

02 产业

Qwen核心成员Junyang Lin宣布离职，MiniMax公开致谢引发人才流向讨论

Qwen团队核心成员Junyang Lin正式宣布离职，MiniMax官方随后发文感谢其对开源社区的长期贡献，这一互动引发社区对阿里海外AI人才战略的广泛讨论。作为Qwen开源生态的重要推动者，Lin的离开被视为国内大模型团队人才流动加速的一个缩影。 From ↗

03 产业

MiniMax上市后首份财报：年营收7900万美元暴涨159%，宣布向AI平台转型

MiniMax交出港股上市后的首份成绩单：2025年营收7900万美元，同比激增159%，其中国际收入占比超过70%。用户规模突破2.36亿，企业客户达21.4万家。公司同时宣布战略转型——从纯粹的模型公司转向聚焦编码、办公效率和多模态创作的AI平台。 From ↗

04 模型

Qwen3.5系列密集部署量化与本地生态：GPTQ-Int4权重发布，9B模型登陆三大推理平台

Qwen团队同日发布Qwen 3.5系列的GPTQ-Int4量化权重，原生支持vLLM和SGLang推理框架，显著降低显存占用。同时，Qwen3.5-9B等小模型正式登陆LM Studio、Ollama和MLX三大本地运行平台——仅需约7GB显存即可在消费级GPU上跑起来，支持图像输入、思维链和工具调用。从量化到本地部署的全链路打通，意味着Qwen3.5小模型系列的可用性门槛已降至历史最低。 From ↗

05 模型

Arena上线文档推理排行榜：Claude Opus 4.6以1525分登顶，GPT-5.2仅列第九

Arena发布基于真实PDF用例的文档推理排行榜，Claude Opus 4.6以1525分排名第一，领先第二名51分。值得注意的是，最新发布的GPT-5.2仅排在第九位——在长文档理解这一高频实用场景中，Claude系模型展现出明显优势。 From ↗

06 模型

Google推出Gemini 3.1 Flash-Lite：Pro版八分之一价格，蒸馏模型主打极致性价比

Google发布Gemini 3.1 Flash-Lite，定价约为Pro版的八分之一。该模型从Gemini Pro蒸馏而来，支持多档思考级别调整，在Arena评测中文本和代码能力与Grok-4.1-fast、Qwen3-coder相当——用极低成本换来接近旗舰级的表现，瞄准的是对价格敏感但不愿牺牲太多质量的开发者群体。 From ↗