最新文章
持续更新中 · 每篇都尽量给出可复用的结论从零理解 RAG:检索增强生成的工程实践
RAG 不是「塞点文档进 prompt」这么简单。从切分、嵌入、召回到重排与评估,拆解一条真正能用的检索增强链路。
Agent 不只是套壳:构建可靠的工具调用循环
能调用工具的 Agent 很容易做 demo,难的是稳定。聊聊工具设计、错误恢复、循环终止与可观测性这些让 Agent 真正可靠的细节。
上下文工程:把对的信息放进有限的窗口
模型再强,上下文窗口也是有限资源。如何筛选、压缩、排序信息,让模型每次都拿到「刚好够用」的上下文,是应用质量的分水岭。
微调 vs 提示工程:什么时候该用哪个
不是所有问题都需要微调,也不是所有场景靠提示都能解。一张决策图理清两者的边界、成本与收益。
评估你的 LLM 应用:别只靠「看起来不错」
没有评估的迭代是在碰运气。介绍离线评测集、LLM-as-judge 与线上反馈闭环的搭建思路。
本地部署开源大模型的一些坑
量化、显存、并发、推理框架选型……把开源模型跑稳跑快,踩过的坑都在这里。
我在关注的主题
大语言模型
检索增强 RAG
智能体 Agent
工具调用
上下文工程
模型微调
提示工程
LLM 评估
推理优化
多模态
AI 产品落地
关于
李
你好,我是这个博客的作者 👋
一名一线 AI 应用开发者,日常和大模型、Agent、检索系统打交道。我相信「能讲清楚的技术才是真懂」,所以把工作中验证过的经验整理成文章,希望对同样在做 AI 落地的你有用。这里没有炫技,只有可复用的思路。
📌 大模型应用工程
✍️ 不定期更新
💬 欢迎交流