AI 日报｜2026-05-22

Main Brief

当日重点整理

01 模型

阿里发布 Qwen3.7-Max：面向 Agent 时代的旗舰模型

阿里巴巴正式发布 Qwen3.7-Max，专为 Agent 时代设计，支持端到端编码 Agent、办公助手和 MCP 集成，在 AI Intelligence Index 得分 56.6（提升 4.8 分），API 已上线。该模型在 35 小时连续执行中自主完成 432 次核评估、1158 次工具调用，实现对 Extend Attention Kernel 的 10.0x 加速。 From ↗

02 产品工具

OpenAI Codex 发布多项新功能：Appshots、远程 Mac、/goal 模式正式版

OpenAI Codex 发布重大更新：Appshots 可附加应用窗口到 Codex 线程；支持手机远程使用 Mac；/goal 模式正式版可跨小时/天持续执行；高级注释直接调整页面元素；团队可共享自定义插件；新增企业分析面板。 From ↗

03 模型

OpenAI 内部通用推理模型自主解决 80 年数学难题

据报道，OpenAI 未公布的内部通用推理模型自主解决了 Erdős 1946 年提出的平面单位距离问题，推理过程长达 125 页，展示了足够强推理能力下创造性自然涌现。 From ↗

04 行业资讯

GPT-4 级别质量成本暴跌 500 倍：Arena.ai 价格-性能 Pareto 分析

Arena.ai 发布价格-性能 Pareto 前沿分析：GPT-4 级质量成本从 2023 年约 $50/百万 token 降至约 $0.10；低价端（<$0.20）模型得分从 1000 升至 1440，与顶尖差距从 350 缩小到 60 分。 From ↗

05 产品工具

YC 孵化两款 AI 新工具：Pentagon（人机协调层）与 Netter.ai（全栈数据科学 Agent）

Y Combinator 孵化发布两款 AI 新产品：Pentagon 是人与 Agent 的协调层，支持跨工具通信协作；Netter.ai 提供全栈数据科学 Agent，帮助无数据工程师团队处理复杂数据。 From ↗

06 行业资讯

MiniMax 美国行：参与 Vercel、Notion 黑客马拉松及 AWS AI Agent 研讨

MiniMax 在美国参与多项 AI 生态活动，包括与 Vercel 联合举办模型黑客马拉松、与 Notion 及 OpenAI/Anthropic 合作的平台黑客松，以及 AWS 的 AI Agent 实战分享，推动从 POC 到生产落地。 From ↗

07 技巧教程

实操教程：用 Codex/Claude Code 自动配置海外 VPS 并部署网站

向阳乔木分享用 Codex/Claude Code 自动配置海外 VPS 的实操方法，无需宝塔，只需提供 SSH 账号密码和 Cloudflare DNS API 权限，AI 即可完成 VPS 配置、域名绑定、免费 HTTPS 证书申请和自动续期。 From ↗

08 行业资讯

Orange AI：产品只是交付物，商业能力才是 AI 时代核心

Orange AI 认为做产品是工程问题，赚钱是商业问题。AI 已大幅降低工程门槛，但商业能力（营销、销售）仍非 AI 所能解决，提醒避免陷入"有产品=能赚钱"的思维钢印。 From ↗

09 技巧教程

腾讯 Hy-MT2 翻译模型实测：可本地部署，指令遵循超越 DeepSeek-V4-Pro

用户实测 Hy-MT2-30B-A3B 在翻译测试中全面超越 DeepSeek-V4-Pro，支持 33 种语言（含粤语）。1.8B 量化版本仅需不到 1G 内存，可搭配 LunaTranslator 本地部署用于网页、游戏、PDF 翻译。 From ↗

10 模型

智谱 GLM-5.1 highspeed 上线，输出速度达 400 TPS

智谱发布 glm-5.1-highspeed，实测输出速度 300-400 tps，首 token 延迟稳定 1s，是普通 GLM-5.1 接口的 10 倍。官方与 TileRT 团队合作从底层优化推理链路，使用 GLM-5.1 编程的用户可直接切换。 From ↗