什么是RAG
我个人的开源项目飞速Markdown(后面简称flymd)在近日上线了RAG知识库功能。这篇教程主要面向首次使用RAG的朋友,这里就不在说太多专业术语。简单的说RAG(Retrieval-Augmented Generation)是一种人工智能技术。通过“检索外部知识 + 增强模型生成”的方式解决了传统大语言模型在知识更新和生成准确性方面的不足。如果理解不了没关系。对于大部分普通人,以及这个笔记应用你可以简单的理解成:一个秘书记住了你的笔记,当你要查询的时候。你不用去翻找,只需要对秘书说帮我查下……这个秘书就会根据笔记内记录的内容来组织语言进行告知。典型的使用场景:学习笔记的查找、个人记录的查询。
正式开始
第一步肯定是下载flymd。通过官网https://flymd.llingfei.com 或者Github仓库下载最新版本。
在flymd 左侧的库管理选择你本地存放文档的文件夹作为库
推荐在这个库文件夹下单独建立一个知识库文件夹,用于存放需要作为知识库的文档(不要放密码等隐私信息)
通过右上角的扩展菜单进入扩展市场,安装AI和RAG插件
点击设置flymd-RAG知识库索引的设置按钮进入设置 ,截图中我使用的自定义连接的voyage3.5模型。如果你不会用没关系,你直接在embedding里选择内置的免费向量模型BAAI/bge-m3 无须进行KEY和API的配置,只需要点击启用—保存设置—重建索引。
推荐使用白名单功能(仅扫描目录)比如我只扫描库目录下知识库文件夹内的内容。
第一次配置后需要点击重建索引,让向量模型对你的笔记进行记忆。这个记忆是存放到本地的。整个重建过程有日志和通知提示。完成后就可以开始使用了。
后续你在知识库里新增文档或者修改文档,他会自动加入新记忆。
在任意文本或者空文本情况下 右键打开AI助手对话框,并点亮下方RAG图标 即可使用!