AI 日报｜2026-05-18

Main Brief

当日重点整理

01 模型

Reddit 用户实测显示，在混合 GPU 集群（RTX PRO 6000/5090/4090）上，vLLM 的预填速度比 llama.cpp 快 4–6 倍；SGLang 在纯 Blackwell 上表现接近，但在混合配置下崩溃。vLLM 支持手动分区以消除瓶颈。 From ↗

02 技巧教程

Anthropic 官方发布 Skill 构建指南，歸藏翻译并发布双语版本。该指南介绍如何利用 AI Agent 构建自定义 Skill，适合开发者快速上手。 From ↗

03 模型

PwC 论文《Is Grep All You Need?》指出，在 agentic 搜索场景中 Grep 普遍优于向量语义搜索。但该测试基于对话记忆而非企业文档，适用范围仍有局限。 From ↗

04 硬件

前 Apple/Meta/OpenAI 硬件负责人 Caitlin Kalinowski 在播客中表示，AI 前沿正从数字转向物理；人形机器人仍处于原型阶段；并警告内存价格即将大幅上涨，建议初创企业提前囤货。 From ↗

05 产品工具

微信读书上线 Skills 功能，支持查看笔记和划线、推荐书籍、阅读数据统计，用户可通过 Codepilot 调用分析个人读书数据。 From ↗

06 行业资讯

因 Project Glasswing 漏洞报告，英国 NHS 关闭开源仓库。政府数字服务（GDS）随后发布指南强调默认开放，公开批评 NHS 的闭源决策，引发英国开源政策重大争议。 From ↗

07 产品工具

开源项目 AIPointer 正在添加 Ollama 本地模型支持，实现光标附近快速问答。开发者招募 M 系列 Mac 及 RTX 3090/4090 用户测试 TTFT 和工具调用性能。 From ↗

08 产品工具

Chrome 扩展 Claude Pulse 在聊天框上方显示缓存剩余时间，帮助用户利用 5 分钟缓存窗口降低延迟和 token 消耗。 From ↗

09 技巧教程

用户演示用 PPT Skill 负责美学版式、Codex 预览视频、HyperFrames 渲染字幕、即梦 CLI 补拍实景，组合实现一键生成产品更新介绍视频，效果出色。 From ↗

10 行业资讯

HUD 宣布举办 RL 训练环境黑客马拉松，由 Fireworks AI 赞助，6 月 20–21 日在旧金山举行，提供超 10 万美元奖金和计算积分，参赛者需构建并测试强化学习智能体。 From ↗