当日重点整理
vLLM 在混合 Blackwell/Ada GPU 集群上大幅领先 SGLang 和 llama.cpp
Reddit 用户实测显示,在混合 GPU 集群(RTX PRO 6000/5090/4090)上,vLLM 的预填速度比 llama.cpp 快 4–6 倍;SGLang 在纯 Blackwell 上表现接近,但在混合配置下崩溃。vLLM 支持手动分区以消除瓶颈。 From ↗
Anthropic 官方发布 Skill 构建指南
Anthropic 官方发布 Skill 构建指南,歸藏翻译并发布双语版本。该指南介绍如何利用 AI Agent 构建自定义 Skill,适合开发者快速上手。 From ↗
论文发现:agentic search 中 Grep 比语义搜索更准确
PwC 论文《Is Grep All You Need?》指出,在 agentic 搜索场景中 Grep 普遍优于向量语义搜索。但该测试基于对话记忆而非企业文档,适用范围仍有局限。 From ↗
前 OpenAI 硬件负责人警告 AI 正从数字转向物理世界,内存价格即将飙升
前 Apple/Meta/OpenAI 硬件负责人 Caitlin Kalinowski 在播客中表示,AI 前沿正从数字转向物理;人形机器人仍处于原型阶段;并警告内存价格即将大幅上涨,建议初创企业提前囤货。 From ↗
微信读书正式上线 Skills 功能,支持笔记查询与阅读统计
微信读书上线 Skills 功能,支持查看笔记和划线、推荐书籍、阅读数据统计,用户可通过 Codepilot 调用分析个人读书数据。 From ↗
英国 NHS 因安全事件关闭开源仓库,遭政府数字服务公开批评
因 Project Glasswing 漏洞报告,英国 NHS 关闭开源仓库。政府数字服务(GDS)随后发布指南强调默认开放,公开批评 NHS 的闭源决策,引发英国开源政策重大争议。 From ↗
开源桌面 AI 助手 AIPointer 接入 Ollama 本地模型支持
开源项目 AIPointer 正在添加 Ollama 本地模型支持,实现光标附近快速问答。开发者招募 M 系列 Mac 及 RTX 3090/4090 用户测试 TTFT 和工具调用性能。 From ↗
Claude Pulse 浏览器扩展实时显示 Prompt Caching 倒计时
Chrome 扩展 Claude Pulse 在聊天框上方显示缓存剩余时间,帮助用户利用 5 分钟缓存窗口降低延迟和 token 消耗。 From ↗
PPT Skill + Codex + HyperFrames 组合实现一键自动生成讲解视频
用户演示用 PPT Skill 负责美学版式、Codex 预览视频、HyperFrames 渲染字幕、即梦 CLI 补拍实景,组合实现一键生成产品更新介绍视频,效果出色。 From ↗
HUD 与 Fireworks AI 合办 RL 环境黑客马拉松,奖金超 10 万美元
HUD 宣布举办 RL 训练环境黑客马拉松,由 Fireworks AI 赞助,6 月 20–21 日在旧金山举行,提供超 10 万美元奖金和计算积分,参赛者需构建并测试强化学习智能体。 From ↗