Main Brief

当日重点整理

01 产品

Anthropic静默缩短Claude缓存TTL至5分钟,用户月成本激增数百美元

多名开发者通过日志分析发现,Anthropic于4月2日将Claude Code默认缓存TTL从1小时静默回退至5分钟,缓存失效频率骤增5倍以上,有用户估算月度API支出因此增加约278美元。官方文档未同步更新,社区对未经公告的静默变更表达了强烈不满。 From ↗

02 模型

MiniMax M2.7模型Day-0上线Fireworks和Together AI,随后主动修正许可为“开放权重”

MiniMax的M2.7模型在发布当天即登陆Fireworks和Together AI两大推理平台供商用,主打软件工程与代码安全场景。随后MiniMax主动发布澄清,因许可协议变更不再使用“开源”标签而改称“开放权重”,引发社区对其MIT式许可真实开放程度的进一步审视。 From ↗

03 本地推理

MacBook M5 Max跑通397B参数Qwen3.5,自适应层量化将807GB压至106GB

开发者在128GB内存的M5 Max MacBook上成功运行Qwen3.5-397B的2-bit量化版本,生成速度达29 tokens/s。核心功臣是Unsloth的自适应层量化技术,将原始807GB模型压缩至106GB。这一实测证明消费级笔记本硬件已具备运行超大参数模型的能力,本地推理的天花板正在被快速抬高。 From ↗

04 研究

18岁独立开发者将脉冲神经网络扩展至10亿参数并实现跨语言涌现

一位18岁开发者成功将纯脉冲神经网络(SNN)规模推至10.88亿参数并从随机初始化收敛,模型展现93%稀疏度。更引人注目的是,该模型在未专门训练俄语的情况下生成了结构正确的俄语文本,呈现跨语言涌现能力。这一成果挑战了SNN难以扩展的传统认知,也为低功耗神经形态计算开辟了新想象空间。 From ↗

05 模型

Llama 4 Maverick工具调用可靠性显著退步,多智能体系统升级后频现格式错乱

开发者将多智能体RAG系统从Llama 3.1 70B升级至Llama 4 Maverick后,工具调用可靠性大幅下降:路由响应变得冗长、JSON输出被错误放入content字段而非tool_calls字段、指令遵循一致性恶化。这一实测与Llama 4发布时的宣传形成反差,表明Meta在Agent场景的模型适配上仍有明显短板。 From ↗

06 工具

开源MCP服务器ResolveMCP让Claude用自然语言控制DaVinci Resolve视频剪辑

开发者构建了开源MCP服务器ResolveMCP,将Claude与专业视频编辑软件DaVinci Resolve Studio打通,用户可通过自然语言指令驱动复杂的视频剪辑流程。继代码编辑、文档处理之后,MCP协议的能力边界正式延伸到专业创意工具领域,展示了AI Agent操控专业软件的又一落地场景。 From ↗