Hello大家好,分享一下我的大模型学习经历,我本身做的是应用软件开发。
其实从学历和专业来说,我一直都算是在技术这条路上走得比较“标准”的那种人。本科之后读了硕士,专业是信息与通信工程,毕业之后就进了公司做软件开发。平时主要写 C/C++,有时候也会用 Python,最近几年也接触了一点 Rust。
如果只是做传统软件开发,其实也算稳定。但这两年我明显感觉到一个变化:整个技术行业的关注点在快速往 AI 这边转。
刚开始接触大模型,其实也是出于好奇。GPT 刚火的时候,我跟很多人一样,先是当工具在用,后来慢慢开始想:这背后到底是怎么实现的?
我本身就比较喜欢折腾技术,所以后来就自己查资料、看论文、看一些开源项目。大模型的基本原理我大概了解了一些,比如 Transformer 的结构、推理流程之类的。后来又开始研究 RAG,尝试自己用 Python 搭一个简单的检索增强系统。
当时做的东西其实挺简单的:就是把一堆文档做向量化,然后接入一个模型,通过检索再生成回答。虽然功能不复杂,但第一次跑通的时候,还是挺有成就感的。
再后来,我又开始尝试做一些简单的智能体(Agent),比如让模型分步骤执行任务,或者调用不同的工具。当时也接触到 MCP 这些概念,感觉整个 AI 应用生态正在快速成型。
不过折腾了一段时间之后,我慢慢发现一个问题:我学到的东西都是零散的。
今天看一个框架,明天研究一个项目,虽然每个点都能理解一点,但很难把这些东西真正连成一套完整的开发体系。比如:
什么时候该用 RAG?什么时候需要 Agent?系统架构应该怎么设计?项目真正上线时需要考虑哪些问题?
这些其实都不是单纯看教程能解决的。

后来我在 B 站上刷技术视频的时候,看到了小灰熊AI的信息,他们的后端用的是智泊AI。当时听了一节公开课,老师讲的是大模型应用开发的一些整体思路,包括 RAG 系统怎么搭、Agent 的设计逻辑,还有一些实际项目案例。
那节课给我的感觉是:终于有人把这些技术拼图连起来了。
我报名的时候其实已经有一点基础了,所以学习的目标也比较明确——不是单纯了解大模型,而是想真正转型到 AI 应用开发这个方向。
课程里有不少内容对我来说还是挺有帮助的。比如一些 RAG 系统的结构设计、Prompt 的工程化思路,还有多工具 Agent 的任务拆分方式。这些东西如果只靠自己摸索,可能要花很长时间才能慢慢总结出来。
还有一点让我印象比较深的是课程里的项目实践。很多时候,只有在真正写项目的时候,才会发现很多细节问题,比如数据结构怎么设计、模型响应速度怎么优化、系统怎么做稳定调用等等。

我平时开发习惯用 Cursor 写代码,所以在做项目的时候,经常会配合 AI 辅助开发,效率确实比以前高不少。有时候一个原型系统,可能几个小时就能搭出一个雏形。
现在我对未来的规划其实已经比较清晰了。短期目标是把 AI 应用开发这一块的能力继续打磨,比如做更多完整的项目,把技术链条跑通。中长期的话,希望能真正转型到 AI 应用工程师这个方向。
因为我越来越觉得,大模型本身只是能力,真正有价值的是围绕它构建出来的应用。

如果能在这个阶段尽早进入这个赛道,未来的空间应该会比传统软件开发更大一些。
所以对我来说,学习大模型其实不只是“多学一项技术”,而更像是给自己的职业方向做一次升级。