✦ 大模型 · Agent · AI 工程

把 AI 技术,
写成能落地的工程经验

这里记录我在大语言模型、智能体、检索增强与 AI 应用开发中踩过的坑与总结的方法论。不堆名词,只谈怎么把东西真正做出来、做稳。

开始阅读 → 关于我

最新文章

持续更新中 · 每篇都尽量给出可复用的结论
RAG工程实践

从零理解 RAG:检索增强生成的工程实践

RAG 不是「塞点文档进 prompt」这么简单。从切分、嵌入、召回到重排与评估,拆解一条真正能用的检索增强链路。

2026-06-08阅读 →
Agent工具调用

Agent 不只是套壳:构建可靠的工具调用循环

能调用工具的 Agent 很容易做 demo,难的是稳定。聊聊工具设计、错误恢复、循环终止与可观测性这些让 Agent 真正可靠的细节。

2026-05-29阅读 →
上下文工程提示

上下文工程:把对的信息放进有限的窗口

模型再强,上下文窗口也是有限资源。如何筛选、压缩、排序信息,让模型每次都拿到「刚好够用」的上下文,是应用质量的分水岭。

2026-05-18阅读 →
微调提示工程

微调 vs 提示工程:什么时候该用哪个

不是所有问题都需要微调,也不是所有场景靠提示都能解。一张决策图理清两者的边界、成本与收益。

即将发布敬请期待
评估LLMOps

评估你的 LLM 应用:别只靠「看起来不错」

没有评估的迭代是在碰运气。介绍离线评测集、LLM-as-judge 与线上反馈闭环的搭建思路。

即将发布敬请期待
开源模型部署

本地部署开源大模型的一些坑

量化、显存、并发、推理框架选型……把开源模型跑稳跑快,踩过的坑都在这里。

即将发布敬请期待

我在关注的主题

大语言模型 检索增强 RAG 智能体 Agent 工具调用 上下文工程 模型微调 提示工程 LLM 评估 推理优化 多模态 AI 产品落地

关于

你好,我是这个博客的作者 👋

一名一线 AI 应用开发者,日常和大模型、Agent、检索系统打交道。我相信「能讲清楚的技术才是真懂」,所以把工作中验证过的经验整理成文章,希望对同样在做 AI 落地的你有用。这里没有炫技,只有可复用的思路。

📌 大模型应用工程 ✍️ 不定期更新 💬 欢迎交流