Main Brief

当日重点整理

01 模型

ERNIE 5.1弹性预训练架构亮相:总参数缩减67%、推理成本仅需同类模型6%

百度公开ERNIE 5.1核心训练方法——多维弹性预训练技术。该架构允许模型在运行时从父网络中动态抽取不同规模的子网络:总参数压降至原始的三分之一,活跃参数降至二分之一,预训练总算力消耗仅为同等水平模型的6%。同期ERNIE 5.1 Preview在LMArena文本榜单以1476分位列第13名,在专业写作、逻辑推理和创意生成等子项中多维度进入全球前十。这种嵌套式弹性架构为按需分配推理资源开辟了新路径,有望在端侧部署和弹性扩容场景中发挥优势。 From ↗

02 产业

OpenAI宣布停收微调新任务,Fireworks AI等平台迅速抢位填补空白

OpenAI向开发者发出通知,微调API将分阶段退出:现有客户可继续运行至2027年1月初,此后不再接受新的微调训练请求。已定制的模型在底层基座弃用前仍保持可用。这一决策在社区引发广泛讨论——许多开发者认为RAG检索增强和Prompt工程无法覆盖全部定制化需求,尤其是垂直领域适配和特定风格迁移等场景。Fireworks AI随即高调推出自有训练平台,主打“你应该拥有自己的AI主权”理念,强调用户对数据、领域知识和模型资产的完全掌控权。微调市场的格局正在被重新洗牌。 From ↗

03 模型

NVIDIA发布Star Elastic嵌套模型:单次训练产出30B/23B/12B三档推理规格

NVIDIA推出Star Elastic嵌套架构模型,采用创新的子网络提取方案——从30B参数的父模型中零样本蒸馏出23B和12B两个子模型,无需额外微调。推理阶段可根据任务复杂度在不同规格间动态切换,实现“小模型负责思考、大模型负责回答”的混合推理策略。在AIME-2025数学基准上精度提升16%,响应延迟降低近一半。12B版本可在RTX 5080消费级显卡上流畅运行。模型已在Hugging Face开放下载。 From ↗

04 产业

Trigger.dev获1600万美元A轮,九成以上用量来自AI Agent异步工作流

开源异步任务引擎Trigger.dev完成由Standard Capital领投的1600万美元A轮融资,Y Combinator等老股东继续跟投。该SDK帮助开发者为产品快速集成AI Agent能力,当前超过90%的使用量已来自Agent自动化工作流场景,而非传统的定时任务和队列管理。团队认为异步基础设施正在成为Agent时代的基础能力层——当Agent需要处理长时间运行的子任务、协调多个工具调用并管理复杂的状态流转时,可靠的异步执行引擎是不可或缺的底层支撑。融资将用于扩展Agent原生功能和团队招聘。 From ↗

05 模型

Qwen 3.6 27B手机端实测:本地运行编码能力直追Claude Opus

Hugging Face联合创始人在无网络环境下实测发现,通义千问3.6 27B模型通过AI Desktop 98应用在手机本地运行时,其在Claude Code编码场景中的表现已与最新版Opus高度接近。这意味着27B参数量级的开源模型已能在移动设备上完成此前需要云端旗舰模型才能胜任的编程辅助任务。对于追求数据隐私和离线可用性的开发者而言,本地小模型的可用性正在快速逼近商业闭源方案。 From ↗

06 社区

反蒸馏Skill引爆讨论:员工用AI生成安全阉割版知识文件应对企业提取

一款反蒸馏Skill在开发者社区引发热议。该工具针对企业要求员工将个人经验转化为AI可读知识库的场景:它会将真实技能文件自动清洗为表面专业但核心细节缺失的版本上交公司,同时在本地生成完整的真实经验备份。支持者认为这是在AI时代保护个人职业护城河的必要手段,反对者则质疑其涉及职业道德和契约精神边界。该话题折射出AI知识提取浪潮下劳资关系的新张力。 From ↗