xieydd
xieydd

你好,我是 xieydd

xieydd 的个人博客,主要记录 AI Infra、Kubernetes、PostgreSQL、向量数据库、模型推理与云架构实践。

精选文章

Coding at Agent-Speed

记录我高强度使用 Code Agent 构建产品的过程,拆解工作流变化、踩坑、收益与对研发方式的真实影响。

从 KV Cache 到 AI 内存系统:大模型推理架构的演进

为什么这两年围绕大模型推理的系统创新,越来越不像是在“优化一个神经网络”,反而像是在“设计一个内存系统”?本文沿着这条线,把 Mac/UMA、NVIDIA/NVLink、FlashAttention、vLLM、RL rollout、Mooncake、LMCache、CXL,以及 2025–2026 的新论文串成一条完整主线。

全部文章