Learning as Approximation:把学习看成受控近似
一篇把 gradient descent、temporal difference learning、stochastic approximation 和 Bellman fixed-point methods 放到同一个 correction pattern 下理解的学习笔记。
AIReinforcement LearningOptimizationStochastic Approximation
较长的文章与反思:当一个想法沉淀到足以被论证,它会先出现在这里。
一篇把 gradient descent、temporal difference learning、stochastic approximation 和 Bellman fixed-point methods 放到同一个 correction pattern 下理解的学习笔记。
一篇偏系统设计的个人记录:我的 AI 工作台里,Codex、Hermes、Obsidian、CC Switch 分别拥有哪些状态,cron 怎么维护它们,以及 Karpathy-style Obsidian second brain 在这里怎么落地。
一篇从词表示走到 attention、self-attention 与 Transformer 的学习复盘。
一篇实践笔记:用自托管 New API gateway 汇总分散的 LLM API key,再通过 Tailscale 暴露给不同设备。
一篇历史阶段的技术笔记:OpenCode 配置让我更清楚地看到 agent role、权限边界、协议接口和跨平台同步的问题。
一篇关于数据抽象的长篇学习笔记:从 Java 接口、C++ concepts,到 TypeScript 联合类型、Kotlin 密封层级和 Haskell 代数数据类型。
一篇历史笔记:我如何用 Nix、Home Manager 和模块化配置,让 NixOS 桌面与 macOS 笔记本保持一致。
一篇说明我为什么需要一个公开 research notebook,而不是把写作、笔记和项目痕迹都散落在不同地方的短文。