【一】使用cloudflare实现最低成本的RAG 个人知识库
1. 前言
赛博菩萨Cloudflare又出手了,不仅提供免费额度的AI 模型调用,还教咱们怎么做自己的RAG( Retrieval-Augmented Generation (检索增强生成))
RAG 是什么?
RAG 是一种结合了信息检索和大语言模型生成的技术架构,用来让 AI 回答问题时能够:
先从外部知识库检索相关信息 再基于检索到的内容生成回答
而这一切通过Cloudflare实现的话,只需要开一个Workers Paid计划(每月5美元)😹,其中还包含了一堆其他的功能就不在这详细列出了。
文章以下内容根据Cloudflare的这篇博客完成,如果英文能力好的推荐阅读原文。
Build a Retrieval Augmented Generation (RAG) AI
1.1 想先看代码?
所有代码你都能在GitHub上找到:demo-rag-ai-tutorial
1.2 Live Demo
还有一个在线可以直接试试效果的页面:https://demo-rag.runnable.run/ui
2. 构建检索增强生成(RAG)AI · Cloudflare Workers AI 文档
本指南将带你完成使用 Cloudflare AI 搭建并部署第一个应用的全过程。你将构建一个全功能的 AI 应用,使用 Workers AI、Vectorize、D1 以及 Cloudflare Workers 等工具。
完成本教程后,你将拥有一个 AI 工具,可将信息存储起来并使用大语言模型进行查询。这种模式称为检索增强生成(Retrieval Augmented Generation,RAG),你可以通过组合 Cloudflare AI 工具包中的多个能力来实现。构建该应用不需要有使用 AI 工具的经验。
- 注册 Cloudflare 账号。
- 安装
Node.js。
Node.js 版本管理器
你还需要访问 Vectorize。本教程也会演示如何可选集成 Anthropic Claude,如需使用需准备 Anthropic API Key。