嘿,现在大家可都在积极投身大模型转型浪潮呢!从公司领导想用它提效,到老师用它搞科研,再到普通人抓机会追财富自由——我也是其中之一,正从传统开发往大模型转型。毕竟,传统软件正式微,大模型开发正崛起!
所以啊,我想把自己学习过程中的思考和经验分享出来,希望能帮到大伙儿。今天第一篇,咱们聊聊RAG系统的拆解。
眼下,典型产品比如Cursor的RAG系统:用户上传文件后,它会自动向量化并存入向量数据库;提问时,Cursor直接从库中检索相关信息返回。
<p align=center>cursor codebase Index界面</p>
另一款腾讯出品的ima也类似:你能把微信公众号文章整理成知识库,提问时iMA自动检索回答。
<p align=center>腾讯ima</p>
: 我参加了2021年的研究生入学考试,并在同年9月正式开启了硕士生涯,在导师的指导下学习。
积累期(2021-2023): 这两年里,我系统学习了人工智能与大数据分析相关的多门核心课程,打下了坚实基础,同时也顺利完成了学校要求的实践环节。
探索与聚焦(2023): 从2023年起,我开始构思并着手准备自己的研究课题以及最终的毕业论文。一次聆听张洪宇教授《代码智能:挑战与进展》报告分享的经历,像一束光,点亮了我的研究方向,也坚定了我未来的目标路径——这也是我博客取名“代码里程碑”的灵感来源之一。
冲刺与收获(2023-2025): 围绕着“代码智能”方向,我全身心投入课题研究和大论文撰写。历经一年半的潜心准备,终于在2