当日重点整理
阿里发布 Qwen3.7-Max:面向 Agent 时代的旗舰模型
阿里巴巴正式发布 Qwen3.7-Max,专为 Agent 时代设计,支持端到端编码 Agent、办公助手和 MCP 集成,在 AI Intelligence Index 得分 56.6(提升 4.8 分),API 已上线。该模型在 35 小时连续执行中自主完成 432 次核评估、1158 次工具调用,实现对 Extend Attention Kernel 的 10.0x 加速。 From ↗
OpenAI Codex 发布多项新功能:Appshots、远程 Mac、/goal 模式正式版
OpenAI Codex 发布重大更新:Appshots 可附加应用窗口到 Codex 线程;支持手机远程使用 Mac;/goal 模式正式版可跨小时/天持续执行;高级注释直接调整页面元素;团队可共享自定义插件;新增企业分析面板。 From ↗
OpenAI 内部通用推理模型自主解决 80 年数学难题
据报道,OpenAI 未公布的内部通用推理模型自主解决了 Erdős 1946 年提出的平面单位距离问题,推理过程长达 125 页,展示了足够强推理能力下创造性自然涌现。 From ↗
GPT-4 级别质量成本暴跌 500 倍:Arena.ai 价格-性能 Pareto 分析
Arena.ai 发布价格-性能 Pareto 前沿分析:GPT-4 级质量成本从 2023 年约 $50/百万 token 降至约 $0.10;低价端(<$0.20)模型得分从 1000 升至 1440,与顶尖差距从 350 缩小到 60 分。 From ↗
YC 孵化两款 AI 新工具:Pentagon(人机协调层)与 Netter.ai(全栈数据科学 Agent)
Y Combinator 孵化发布两款 AI 新产品:Pentagon 是人与 Agent 的协调层,支持跨工具通信协作;Netter.ai 提供全栈数据科学 Agent,帮助无数据工程师团队处理复杂数据。 From ↗
MiniMax 美国行:参与 Vercel、Notion 黑客马拉松及 AWS AI Agent 研讨
MiniMax 在美国参与多项 AI 生态活动,包括与 Vercel 联合举办模型黑客马拉松、与 Notion 及 OpenAI/Anthropic 合作的平台黑客松,以及 AWS 的 AI Agent 实战分享,推动从 POC 到生产落地。 From ↗
实操教程:用 Codex/Claude Code 自动配置海外 VPS 并部署网站
向阳乔木分享用 Codex/Claude Code 自动配置海外 VPS 的实操方法,无需宝塔,只需提供 SSH 账号密码和 Cloudflare DNS API 权限,AI 即可完成 VPS 配置、域名绑定、免费 HTTPS 证书申请和自动续期。 From ↗
Orange AI:产品只是交付物,商业能力才是 AI 时代核心
Orange AI 认为做产品是工程问题,赚钱是商业问题。AI 已大幅降低工程门槛,但商业能力(营销、销售)仍非 AI 所能解决,提醒避免陷入"有产品=能赚钱"的思维钢印。 From ↗
腾讯 Hy-MT2 翻译模型实测:可本地部署,指令遵循超越 DeepSeek-V4-Pro
用户实测 Hy-MT2-30B-A3B 在翻译测试中全面超越 DeepSeek-V4-Pro,支持 33 种语言(含粤语)。1.8B 量化版本仅需不到 1G 内存,可搭配 LunaTranslator 本地部署用于网页、游戏、PDF 翻译。 From ↗
智谱 GLM-5.1 highspeed 上线,输出速度达 400 TPS
智谱发布 glm-5.1-highspeed,实测输出速度 300-400 tps,首 token 延迟稳定 1s,是普通 GLM-5.1 接口的 10 倍。官方与 TileRT 团队合作从底层优化推理链路,使用 GLM-5.1 编程的用户可直接切换。 From ↗