AI 札记 · 个人技术分享

最新文章

持续更新中 · 每篇都尽量给出可复用的结论

RAG 不是「塞点文档进 prompt」这么简单。从切分、嵌入、召回到重排与评估，拆解一条真正能用的检索增强链路。

能调用工具的 Agent 很容易做 demo，难的是稳定。聊聊工具设计、错误恢复、循环终止与可观测性这些让 Agent 真正可靠的细节。

模型再强，上下文窗口也是有限资源。如何筛选、压缩、排序信息，让模型每次都拿到「刚好够用」的上下文，是应用质量的分水岭。

微调提示工程

不是所有问题都需要微调，也不是所有场景靠提示都能解。一张决策图理清两者的边界、成本与收益。

即将发布敬请期待

评估LLMOps

没有评估的迭代是在碰运气。介绍离线评测集、LLM-as-judge 与线上反馈闭环的搭建思路。

即将发布敬请期待

开源模型部署

量化、显存、并发、推理框架选型……把开源模型跑稳跑快，踩过的坑都在这里。

即将发布敬请期待

大语言模型检索增强 RAG 智能体 Agent 工具调用上下文工程模型微调提示工程 LLM 评估推理优化多模态 AI 产品落地

李

一名一线 AI 应用开发者，日常和大模型、Agent、检索系统打交道。我相信「能讲清楚的技术才是真懂」，所以把工作中验证过的经验整理成文章，希望对同样在做 AI 落地的你有用。这里没有炫技，只有可复用的思路。

📌 大模型应用工程 ✍️ 不定期更新 💬 欢迎交流