Agent

你不知道的大模型训练:原理、路径与新实践 - AI利器资讯

你不知道的大模型训练:原理、路径与新实践

Agent2个月前
2026 年来看大模型效果真正拉开差距的地方,慢慢不再是预训练本身了,而在它更后面的那一大段:后训练、评测、奖励、Agent 训练、蒸馏,每一个步骤都在影响用户实际感受效果。你发现某个模型……
你不知道的 Agent:原理、架构与工程实践 - AI利器资讯

你不知道的 Agent:原理、架构与工程实践

Agent2个月前
这篇文章主要讲 Agent 架构里几块最影响工程效果的内容,包括控制流、上下文工程、工具设计、记忆、多 Agent 组织、评测、追踪和安全,最后再用 OpenClaw 的实现把这些设计原则串起来看一遍。
Andrej Karpathy 2025 年 LLM 年度回顾:六大范式转变 - AI利器资讯

推荐Andrej Karpathy 2025 年 LLM 年度回顾:六大范式转变

Agent6个月前
Andrej Karpathy 2025 年 LLM 年度回顾:六大范式转变。 第一个大变化:训练方法的范式升级;第二个大变化:我们终于搞懂了 AI 是什么形状的聪明;第三个大变化:LLM 应用层浮出水面;第四个大变……
巨头为何押注?千亿级AI Agent商业赌局 - AI利器资讯

巨头为何押注?千亿级AI Agent商业赌局

Agent6个月前
2024年,OpenAI推出Operator,Google发布Gemini 2.0,Anthropic升级Computer Use,字节让UI-TARS落地手机。这不是巧合,而是一场在同一赛道上的集体冲刺。 当所有科技巨头都在做同一件事……