长期追踪
持续更新 AI 技术新闻与无线感知前沿。
论文阅读
围绕模型、方法和研究趋势整理阅读笔记。
Deliberative Alignment: Reasoning Enables Safer Language Models论文阅读
本文解读 OpenAI 的 Deliberative Alignment 论文。论文提出了基于推理的安全对齐新范式:直接教会模型安全规范文本,让模型在回答前显式回忆并推理安全策略。该方法已应用于 OpenAI o 系列模型,在越狱鲁棒性和过度拒答率上实现了 Pareto 前沿改进。
14 分钟
热门
DeepSeek-V4: Towards Highly Efficient Million-Token Context Intelligence论文阅读本文解读 DeepSeek-V4: Towards Highly Efficient Million-Token Context Intelligence。论文的核心不是单纯扩大参数规模,而是通过混合压缩注意力、mHC 残差连接、Muon 优化器和配套系统工程,把百万 Token 上下文从能力展示推进到可训练、可推理、可部署的模型设计问题。
15 分钟
SkillRouter: Skill Routing for LLM Agents at Scale 论文阅读
本文解读论文 SkillRouter: Skill Routing for LLM Agents at Scale。论文研究大规模 skill registry 下的技能路由问题,指出完整 skill body 是关键检索信号,并提出一个 1.2B 全文 retrieve-and-rerank 路由系统,在准确率、延迟和端到端任务成功率之间取得较好平衡。
13 分钟
技术实践
记录工程经验、工具链实践和项目复盘。
置顶
AI Coding经验总结:从大模型工具到 Agent 工作流从 SDD、TDD、API 契约、特征测试、安全重构、GitHub Workflow 到 Rules/Spec/Skills,整理一套让 AI Coding 从工具使用走向 Agent 工作流的工程方法。
22 分钟
部分场景中可以替代 RAG 的技术
本文讨论长上下文、Agentic Retrieval 和 LLM Wiki 在部分场景中替代传统 RAG 的条件。核心结论是:它们并不是全面取代 RAG,而是在知识规模、更新频率、结构复杂度和任务链路不同的情况下,改变知识进入模型的方式。
14 分钟
