LlamaIndex
Azure Cosmos DB MongoDB vCore
主页
学习
使用案例
示例
组件指南
高级主题
API 参考
开源社区
LlamaCloud
LlamaIndex
主页
主页
高级概念
安装与设置
如何阅读这些文档
入门示例
入门示例
入门教程 (使用 OpenAI)
入门教程 (使用本地大型语言模型)
LlamaIndex 探索视频系列
常见问题 (FAQ)
入门工具
入门工具
RAG CLI
学习
学习
使用大型语言模型
构建代理
构建代理
使用现有工具
维护状态
流式输出和事件
人在回路
多代理工作流程
构建工作流程
构建工作流程
基本工作流程
分支和循环
维护状态
流式事件
并发执行
工作流程子类化
嵌套工作流程
可观测性
无绑定语法
构建 RAG 流水线
构建 RAG 流水线
加载与摄取
加载与摄取
加载数据 (摄取)
LlamaHub
从 LlamaCloud 加载
索引与嵌入
存储
查询
结构化数据提取
结构化数据提取
使用结构化大型语言模型
结构化预测
低级别提取
跟踪与调试
评估
评估
评估
成本分析
成本分析
使用模式
整合应用
整合应用
全栈 Web 应用
全栈 Web 应用
使用 LlamaIndex 构建全栈 Web 应用指南
使用 Delphic 构建全栈 LlamaIndex Web 应用指南
问答模式
问答模式
术语和定义提取指南
聊天机器人
聊天机器人
如何构建聊天机器人
结构化数据
结构化数据
使用案例
使用案例
提示工程
问答 (RAG)
聊天机器人
结构化数据提取
代理
多模态应用
微调
示例
示例
代理
代理
如何构建聊天机器人
GPT Builder 演示
FunctionAgent / AgentWorkflow 基础介绍
使用 AgentWorkflow 构建多代理研究工作流程
Agent Workflow + 使用 AgentQL 的研究助手
函数调用 Anthropic 代理
函数调用 AWS Bedrock Converse 代理
使用 LlamaIndex 的预构建 CodeAct 代理
从零开始创建 CodeAct 代理
聊天记忆缓冲区
简单可组合记忆
聊天摘要记忆缓冲区
向量记忆
函数调用 Mistral 代理
多文档代理 (V1)
函数调用 NVIDIA 代理
用于博客创作的文档研究助手
由 NVIDIA NIMs 提供支持的子问题查询引擎
上下文增强型函数调用代理
OpenAI 代理针对冗长工具描述的变通方法
OpenAI 代理 + 查询引擎实验 Cookbook
检索增强型代理
带有查询引擎工具的代理
ReAct 代理 - 使用计算器工具的简单介绍
带有查询引擎 (RAG) 工具的 ReAct 代理
使用 Return Direct 工具控制代理推理循环
聊天引擎
聊天引擎
聊天引擎 - 最佳模式
聊天引擎 - 浓缩加上下文模式
聊天引擎 - 浓缩问题模式
聊天引擎 - 上下文模式
聊天引擎 - OpenAI 代理模式
个性化聊天引擎 ✨
聊天引擎 - ReAct 代理模式
聊天引擎 - 简单模式 REPL
Cookbooks
Cookbooks
使用 LlamaIndex 实现 GraphRAG
使用 LlamaIndex 实现 GraphRAG - V2
AirtrainAI Cookbook
Anthropic Haiku Cookbook
使用 Trustworthy Language Model 构建可信赖的 RAG
MistralAI Codestral Cookbook
Cohere init8 和二进制嵌入检索评估
上下文检索
CrewAI + LlamaIndex Cookbook
Llama3 Cookbook
使用 Intel Gaudi 的大型语言模型 Cookbook
使用 Groq 的 Llama3 Cookbook
使用 Ollama 和 Replicate 的 Llama3 Cookbook
MistralAI Cookbook
mixedbread Rerank Cookbook
使用 MongoDB 和 LlamaIndex 优化相关性
带有文档处理的 Oracle AI 向量搜索
LlamaIndex 组件
评估 RAG 系统
摄取流水线
元数据提取
可观测性
代理
Router QueryEngine 和 SubQuestion QueryEngine
多模态 RAG 系统
使用 LlamaParse 的高级 RAG
Prometheus-2 Cookbook
使用 Toolhouse 的销售潜在客户工作流程
自定义
自定义
Azure OpenAI
ChatGPT
HuggingFace LLM - Camel-5b
HuggingFace LLM - StableLM
聊天提示自定义
补全提示自定义
流式处理
聊天引擎流式处理 - 浓缩问题模式
数据连接器
数据连接器
Google AlloyDB for PostgreSQL -
Chroma 阅读器
Google Cloud SQL for PostgreSQL -
DashVector 阅读器
数据库阅读器
DeepLake 阅读器
Discord 阅读器
Docling 阅读器
Faiss 阅读器
Github 仓库阅读器
Google Chat 阅读器测试
Google 文档阅读器
Google 云端硬盘阅读器
Google 地图文本搜索阅读器
Google 表格阅读器
Make 阅读器
Mbox 阅读器
Milvus 阅读器
MongoDB 阅读器
MyScale 阅读器
Notion 阅读器
Obsidian 阅读器
Oxylabs 阅读器
Pathway 阅读器
预处理
Psychic 阅读器
Qdrant 阅读器
Slack 阅读器
Twitter 阅读器
Weaviate 阅读器
网页阅读器
Zyte Serp 阅读器
Deplot 阅读器演示
HTML 标签阅读器
Oracle AI 向量搜索:文档处理
简单目录阅读器
SimpleDirectoryReader 并行处理
远程文件系统的 Simple Directory Reader
探索 LlamaIndex
探索 LlamaIndex
Discord 话题管理
文档存储
文档存储
Google AlloyDB for PostgreSQL - &
演示:将 Azure Table Storage 用作文档存储
Google Cloud SQL for PostgreSQL - &
文档存储演示
Dynamo DB 文档存储演示
Firestore 演示
MongoDB 演示
Redis 文档存储+索引存储演示
Tablestore 演示
嵌入
嵌入
Anyscale 嵌入
LangChain 嵌入
OpenAI 嵌入
Aleph Alpha 嵌入
Bedrock 嵌入
使用 Clarifai 的嵌入
Cloudflare Workers AI 嵌入
CohereAI 嵌入
自定义嵌入
Dashscope 嵌入
Databricks 嵌入
Deepinfra
Elasticsearch 嵌入
Qdrant FastEmbed 嵌入
Fireworks 嵌入
Google Gemini 嵌入
Gigachat
Google GenAI 嵌入
Google PaLM 嵌入
使用 HuggingFace 的本地嵌入
IBM watsonx.ai
在 Intel CPU 上使用 IPEX-LLM 的本地嵌入
在 Intel GPU 上使用 IPEX-LLM 的本地嵌入
Jina 8K 上下文窗口嵌入
Jina 嵌入
Llamafile 嵌入
LLMRails 嵌入
MistralAI 嵌入
Mixedbread AI 嵌入
ModelScope 嵌入
Nebius 嵌入
Netmind AI 嵌入
Nomic 嵌入
NVIDIA NIMs
Oracle Cloud Infrastructure (OCI) 数据科学服务
Oracle Cloud Infrastructure 生成式 AI
Ollama 嵌入
使用 OpenVINO 的本地嵌入
使用 Optimum-Intel 优化的嵌入模型
Oracle AI 向量搜索:生成嵌入
PremAI 嵌入
使用 LlamaIndex 与部署在 Amazon SageMaker Endpoint 中的嵌入进行交互
文本嵌入推理
TextEmbed - 嵌入推理服务器
Together AI 嵌入
Upstage 嵌入
使用 LlamaIndex 与部署在 Vertex AI Endpoint 中的嵌入进行交互
VoyageAI 嵌入
Yandexgpt
评估
评估
AIMon
BEIR 领域外基准测试
🚀 RAG/LLM 评估器 - DeepEval
HotpotQADistractor 演示
问题生成
RAGChecker:用于诊断 RAG 的细粒度评估框架
自我纠正查询引擎 - 评估与重试
Tonic Validate 评估器
如何在 LlamaIndex 中使用 UpTrain
答案相关性和上下文相关性评估
BatchEvalRunner - 运行多个评估
正确性评估器
忠实度评估器
指南评估器
基于 MT-Bench 人工判断的 LLM 评估器基准测试
基于 Mini MT-Bench (单次评分) 的 LLM 评估器基准测试
评估多模态 RAG
成对评估器
使用 Prometheus 模型进行评估
相关性评估器
检索评估
嵌入相似性评估器
🏔️ 使用 Argilla 的 RAG 工作流程进行回溯提示
微调
微调
如何使用 LlamaIndex 微调跨编码器
使用 NUDGE 微调语料库嵌入
微调嵌入
在任何黑盒嵌入模型之上微调适配器
用于微调 GPT-3.5 判断器(正确性)的知识蒸馏
用于微调 GPT-3.5 判断器(成对比较)的知识蒸馏
使用微调 API 微调 MistralAI 模型
微调 GPT-3.5-Turbo
使用函数调用进行微调
基于 Better Chain of Thought 微调 GPT-3.5 ReAct 代理
自定义 Cohere 重排序器
路由器微调
摄取
摄取
高级摄取流水线
异步摄取流水线 + 元数据提取
摄取流水线 + 文档管理
在 Google 云端硬盘文件上构建实时 RAG 流水线
摄取流水线并行化
Redis 摄取流水线
大型语言模型
大型语言模型
AI21
Aleph Alpha
Anthropic
Anthropic 提示缓存
Anyscale
ASI 大型语言模型
Azure AI 模型推理
Azure OpenAI
Bedrock
Bedrock Converse
Cerebras
Clarifai 大型语言模型
Cleanlab Trustworthy Language Model
Cohere
DashScope 大型语言模型
Databricks
DeepInfra
DeepSeek
EverlyAI
Fireworks
Fireworks 函数调用 Cookbook
Friendli
Gemini
Google GenAI
Groq
Hugging Face 大型语言模型
IBM watsonx.ai
在 Intel CPU 上的 IPEX-LLM
在 Intel GPU 上的 IPEX-LLM
Konko
Langchain
LiteLLM
Replicate - Llama 2 13B
🦙 x 🦙 说唱对决
Llama API
LlamaCPP
llamafile
大型语言模型预测器
LM Studio
LocalAI
Maritalk
MistralRS 大型语言模型
MistralAI
ModelScope 大型语言模型
Monster API <> LlamaIndex
MyMagic AI 大型语言模型
Nebius 大型语言模型
Netmind AI 大型语言模型
Neutrino AI
NVIDIA NIMs
NVIDIA NIMs
Nvidia TensorRT-LLM
NVIDIA 大型语言模型文本补全 API
Nvidia Triton
Oracle Cloud Infrastructure 数据科学
Oracle Cloud Infrastructure 生成式 AI
OctoAI
Ollama - Llama 3.1
Ollama - Gemma
OpenAI
OpenAI JSON 模式 vs 函数调用进行数据提取
OpenAI 响应 API
OpenLLM
OpenRouter
OpenVINO GenAI 大型语言模型
OpenVINO 大型语言模型
使用 IPEX 后端优化的 Optimum Intel 大型语言模型
AlibabaCloud-PaiEas
PaLM
Perplexity
Pipeshift
Portkey
Predibase
PremAI LlamaIndex
百度智能云千帆大型语言模型平台客户端
RunGPT
使用 LlamaIndex 与部署在 Amazon SageMaker Endpoint 中的大型语言模型进行交互
SambaNova Systems
Together AI 大型语言模型
Upstage
Vertex AI
Replicate - Vicuna 13B
vLLM
Xorbits 推理
Yi
Llama 数据集
Llama 数据集
从 LlamaHub 下载 Llama 数据集
对 RAG 流水线进行基准测试 A
提交模板 Notebook
向 LlamaHub 贡献 Llama 数据集
Llama Hub
Llama Hub
LlamaHub 演示
Ollama Llama Pack 示例
Llama Pack - 简历筛选器 📄
Llama Packs 示例
低级别
低级别
从零开始构建评估
从零开始构建高级融合检索器
从零开始构建数据摄取
从零开始构建 RAG (仅限开源!)
从零开始构建响应合成
从零开始构建检索
从零开始构建路由器
从零开始构建 (非常简单) 的向量存储
托管索引
托管索引
BGEM3 演示
Google Generative Language 语义检索器
PostgresML 托管索引
Google Cloud Vertex AI 上的 LlamaIndex 用于 RAG
语义检索器基准测试
Vectara 托管索引
记忆
记忆
Mem0
元数据提取器
元数据提取器
使用 Llama Index 的上下文检索
实体元数据提取
使用 Marvin 进行元数据提取和增强
提取元数据以更好地进行文档索引和理解
用于更好检索 + 合成的自动化元数据提取
Pydantic 提取器
多模态
多模态
使用 LlamaIndex 的 Chroma 多模态演示
使用 Anthropic 模型进行图像推理的多模态大型语言模型
使用 Azure OpenAI GPT-4o mini 进行图像推理的多模态大型语言模型
使用 Cohere 多模态嵌入的多模态检索
使用 DashScope qwen-vl 模型进行图像推理的多模态大型语言模型
使用 Google Gemini 模型进行图像理解并使用 LlamaIndex 构建检索增强生成的多模态大型语言模型
多模态结构化输出:GPT-4o 与其他 GPT-4 变体比较
GPT4-V 关于一般性、具体问题和 Chain Of Thought (COT) 提示技术的实验
使用 GPT4V 和多模态索引/检索器的高级多模态检索
使用 CLIP 嵌入进行图像到图像检索,并使用 GPT4V 进行图像相关性推理
使用 VoyageAI 多模态嵌入的多模态检索
使用 LlamaIndex 的 LlaVa 演示
检索增强型图像字幕
使用 Mistral 进行图像推理的多模态大型语言模型
[Beta] 多模态 ReAct 代理
多模态 GPT4V Pydantic 程序
使用 Nomic Embed 和 Anthropic 的多模态 RAG
使用 GPT 文本嵌入和 CLIP 图像嵌入对维基百科文章进行多模态检索
使用 OpenAI GPT4V 和 LanceDB 向量存储处理视频的多模态 RAG
使用 VideoDB 的多模态 RAG
多模态 RAG 护栏 Gemini llmguard llmguard
使用 Nebius 的多模态模型
使用 NVIDIA 端点进行图像推理的多模态大型语言模型
使用 OpenAI GPT-4V 模型进行图像推理
使用 OpenVINO 的本地多模态流水线
使用 Replicate LlaVa, Fuyu 8B, MiniGPT4 模型进行图像推理的多模态大型语言模型
半结构化图像检索
多租户
多租户
使用 LlamaIndex 的多租户 RAG
节点解析器与文本分割器
节点解析器与文本分割器
语义分块器
语义双重合并分块
TopicNodeParser
节点后处理器
节点后处理器
AIMon 重排序
Cohere 重排序
使用 ColPali, Cohere 重排序器和多模态嵌入进行重排序
Colbert 重排序
基于文件的节点解析器
FlagEmbeddingReranker
Jina 重排序
大型语言模型重排序器演示 (了不起的盖茨比)
大型语言模型重排序器演示 (2021 Lyft 10-k)
长上下文重排序
元数据替换 + 节点句子窗口
Mixedbread AI 重排序
NVIDIA NIMs
句子嵌入优化器
PII 掩码
前向/后向增强
近期过滤
SentenceTransformer 重排序
结构化大型语言模型重排序器演示 (2021 Lyft 10-k)
时间加权重排序
VoyageAI 重排序
IBM watsonx.ai
OpenVINO 重排序
RankGPT 重排序器演示 (梵高维基)
RankLLM 重排序器演示 (梵高维基)
对象存储
对象存储
类
可观测性
可观测性
Aim 回调
HoneyHive LlamaIndex 跟踪器
Cookbook LlamaIndex 集成 (Instrumentation 模块)
Langfuse 回调处理器
使用 PostHog 和 Langfuse 分析和调试 LlamaIndex 应用
Llama Debug 处理器
MLflow 跟踪和与 LlamaIndex 的端到端集成
OpenInference 回调处理器 + Arize Phoenix
使用 OpenLLMetry 的可观测性
使用 Opik 记录跟踪
PromptLayer 处理器
Token 计数处理器
UpTrain 回调处理器
Wandb 回调处理器
输出解析器
输出解析器
Guardrails 输出解析
Langchain 输出解析
DataFrame 结构化数据提取
Evaporate 演示
用于结构化提取的函数调用程序
Guidance Pydantic 程序
Sub-Question Query Engine 指南
大型语言模型 Pydantic 程序
LM Format Enforcer Pydantic 程序
LM Format Enforcer 正则表达式生成
大型语言模型 Pydantic 程序 - NVIDIA
OpenAI Pydantic 程序
OpenAI 函数调用用于 Sub-Question Query Engine
参数优化器
参数优化器
[WIP] RAG 超参数优化
提示
提示
高级提示技术 (变量映射,函数)
RAG 中的情感提示
在高级模块中访问/自定义提示
使用 RichPromptTemplate 构建
属性图
属性图
使用属性图存储
使用预定义模式构建属性图
属性图索引
定义自定义属性图检索器
Memgraph 属性图索引
Neo4j 属性图索引
查询引擎
查询引擎
带自定义检索器的检索器查询引擎 - 简单混合搜索
JSONalyze 查询引擎
联合问答摘要查询引擎
检索器路由器查询引擎
路由器查询引擎
SQL 自动向量查询引擎
SQL Join 查询引擎
SQL 路由器查询引擎
引用查询引擎
Cogniswitch 查询引擎
定义自定义查询引擎
集成查询引擎指南
FLARE 查询引擎
JSON 查询引擎
知识图谱查询引擎
知识图谱 RAG 查询引擎
结构化分层检索
Pandas 查询引擎
递归检索器 + 查询引擎演示
[Beta] 使用 PGVector 进行文本到 SQL
带有 Pydantic 输出的查询引擎
递归检索器 + 文档代理
对 Tesla 10K 进行联合表格/语义问答
子问题查询引擎
查询流水线
查询流水线
LlamaIndex 查询流水线简介
带异步/并行执行的查询流水线
查询流水线聊天引擎
Pandas DataFrames 上的查询流水线
带路由的查询流水线
用于高级文本到 SQL 的查询流水线
查询转换
查询转换
HyDE 查询转换
多步查询引擎
查询转换 Cookbook
响应合成器
响应合成器
Pydantic 树状摘要
使用召回任务对长上下文大型语言模型进行压力测试
Pydantic 树状摘要
精炼
使用结构化答案过滤进行精炼
树状摘要
检索器
检索器
自动合并检索器
比较结构化检索方法 (自动检索 vs 递归检索)
Bedrock (知识库)
BM25 检索器
可组合对象
Activeloop 深度记忆
集成检索指南
块 + 文档混合检索与长上下文嵌入 (Together.ai)
Pathway 检索器
互易重排序融合检索器
递归检索器 + 节点引用 + Braintrust
递归检索器 + 节点引用
相对分数融合和基于分布的分数融合
路由器检索器
简单融合检索器
从 Vectara 索引进行自动检索
Vertex AI Search 检索器
Videodb 检索器
You.com 检索器
工具
工具
使用 AgentQL 构建浏览器代理
OnDemandLoaderTool 教程
Azure 代码解释器工具规范
Cassandra 数据库工具
评估查询引擎工具
带回调的函数调用
转换
转换
转换评估
使用案例
使用案例
10K 分析
10Q 分析
电子邮件数据提取
Github Issue 分析
向量存储
向量存储
AWS DocDB 演示
阿里云 OpenSearch 向量存储
Google AlloyDB for PostgreSQL -
Amazon Neptune - Neptune Analytics 向量存储
AnalyticDB
将 ApertureDB 用作 LlamaIndex 的向量存储。
Astra DB
简单向量存储 - 异步索引创建
Awadb 向量存储
Azure AI 搜索
Azure CosmosDB MongoDB 向量存储
Azure Cosmos DB No SQL 向量存储
Bagel 向量存储
Bagel 网络
百度向量数据库
Cassandra 向量存储
Chroma + Fireworks + Nomic 使用 Matryoshka 嵌入
Chroma
ClickHouse 向量存储
Google Cloud SQL for PostgreSQL -
Couchbase 向量存储演示
DashVector 向量存储
Databricks 向量搜索
Deep Lake 向量存储快速入门
DocArray Hnsw 向量存储
DocArray 内存向量存储
DuckDB
Elasticsearch 向量存储
Elasticsearch
Epsilla 向量存储
Faiss 向量存储
Firestore 向量存储
Hnswlib
Hologres
Jaguar 向量存储
使用 LlamaIndex 和 KDB.AI 向量存储及时间过滤器的高级 RAG
LanceDB 向量存储
Lantern 向量存储 (自动检索器)
Lantern 向量存储
Lindorm
使用异步 API 的 Milvus 向量存储
带全文搜索的 Milvus 向量存储
带混合搜索的 Milvus 向量存储
Milvus 向量存储
Milvus 向量存储 - 元数据过滤器
MongoDB Atlas 向量存储
MongoDB Atlas + Fireworks AI RAG 示例
MongoDB Atlas + OpenAI RAG 示例
MyScale 向量存储
Neo4j 向量存储
Nile 向量存储 (多租户 PostgreSQL)
ObjectBox 向量存储演示
OceanBase 向量存储
Opensearch 向量存储
pgvecto.rs
Pinecone 向量存储 - 混合搜索
Pinecone 向量存储
Qdrant 向量存储
Qdrant 向量存储 - 元数据过滤器
Qdrant 向量存储 - 默认 Qdrant 过滤器
Redis 向量存储
Relyt
Rockset 向量存储
简单向量存储
本地 Llama2 + 向量存储索引
Llama2 + 向量存储索引
简单向量存储 - 最大边际相关性检索
S3/R2 存储
Supabase 向量存储
Tablestore 向量存储
Tair 向量存储
腾讯云向量数据库
TiDB 向量存储
Timescale 向量存储 (PostgreSQL)
txtai 向量存储
Typesense 向量存储
Upstash 向量存储
Vearch 演示
Google Vertex AI 向量搜索
Vespa 向量存储演示
Weaviate 向量存储 - 混合搜索
Weaviate 向量存储
从 Weaviate 向量数据库进行自动检索
Weaviate 向量存储元数据过滤器
WordLift 向量存储
Zep 向量存储
从向量数据库进行自动检索
Chroma 向量存储
从向量数据库进行自动检索
指南:将向量存储索引与现有 Pinecone 向量存储一起使用
指南:将向量存储索引与现有 Weaviate 向量存储一起使用
Gel 向量存储
Neo4j 向量存储 - 元数据过滤器
Oracle AI 向量搜索:向量存储
带有自动检索的简单到高级指南 (使用 Pinecone + Arize Phoenix)
Pinecone 向量存储 - 元数据过滤器
Postgres 向量存储
使用 Qdrant BM42 的混合搜索
Qdrant 混合搜索
工作流程
工作流程
JSONalyze 查询引擎
用于高级文本到 SQL 的工作流程
无
工作流程运行检查点
构建带有内嵌引用的 RAG
纠正性 RAG 工作流程
函数调用代理工作流程
选择你的冒险工作流程 (人在回路)
LongRAG 工作流程
多步查询引擎
带有反射的多策略工作流程
无
相同事件并行执行示例
查询规划工作流程
带有重排序的 RAG 工作流程
ReAct 代理工作流程
用于结构化输出的反射工作流程
路由器查询引擎
自我发现工作流程
子问题查询引擎作为工作流程
工作流程 cookbook:遍历工作流程的所有特性
组件指南
组件指南
模型
模型
大型语言模型
大型语言模型
使用大型语言模型
独立使用
自定义大型语言模型
可用大型语言模型集成
嵌入
多模态
提示
提示
提示使用模式
加载
加载
文档和节点
文档和节点
使用文档
使用节点
元数据提取
SimpleDirectoryReader
数据连接器
数据连接器
使用模式
LlamaParse
模块指南
节点解析器 / 文本分割器
节点解析器 / 文本分割器
节点解析器模块
摄取流水线
摄取流水线
转换
索引
索引
索引指南
向量存储索引
属性图索引
文档管理
LlamaCloud
元数据提取
模块
存储
存储
向量存储
文档存储
索引存储
聊天存储
键值存储
数据持久化与加载
自定义存储
查询
查询
查询引擎
查询引擎
使用模式
响应模式
流式处理
模块指南
支持模块
聊天引擎
聊天引擎
使用模式
模块指南
检索
检索
检索器模块
检索器模式
节点后处理器
节点后处理器
节点后处理器模块
响应合成
响应合成
响应合成模块
路由
工作流程
查询流水线 (已弃用)
查询流水线 (已弃用)
使用模式
模块指南
模块使用
结构化输出
结构化输出
输出解析模块
(已弃用) 查询引擎 + Pydantic 输出
Pydantic 程序
代理
代理
记忆
工具
工作流程
工作流程
评估
评估
使用模式 (响应评估)
使用模式 (检索)
模块
Llama 数据集
Llama 数据集
贡献 LabelledRagDataset
使用 LabelledRagDataset 进行评估
使用 LabelledEvaluatorDataset 评估评估器
可观测性
可观测性
仪器仪表
设置
Llama Deploy
Llama Deploy
入门
核心组件
手动编排
Python SDK
CLI
高级主题
高级主题
构建用于生产环境的高性能 RAG 应用
基本策略
代理策略
检索
检索
高级检索策略
查询转换
评估
评估
组件级评估
端到端评估
评估
微调
编写自定义模块
从零开始构建 RAG (低级别)
API 参考
API 参考
代理
代理
回调
回调
Agentops
Aim
Argilla
Arize phoenix
Deepeval
Honeyhive
Langfuse
Literalai
Llama debug
Openinference
无
Opik
Promptlayer
Token 计数器
Uptrain
Wandb
聊天引擎
聊天引擎
浓缩加上下文
浓缩问题
上下文
简单
嵌入
嵌入
适配器
Aleph Alpha
阿里云 AI 搜索
Anyscale
自动嵌入
Azure 推理
Azure OpenAI
Bedrock
Clarifai
Clip
Cloudflare Workers AI
Cohere
Dashscope
Databricks
Deepinfra
Elasticsearch
Fastembed
Fireworks
Gaudi
Gemini
Gigachat
Google
Google GenAI
无
HuggingFace
HuggingFace API
HuggingFace OpenVINO
HuggingFace Optimum
HuggingFace Optimum Intel
IBM
Instructor
IPEX LLM
Jina AI
Langchain
LiteLLM
Llamafile
大型语言模型 Rails
MistralAI
Mixedbread AI
ModelScope
Nebius
Netmind
Nomic
Nvidia
OCI 数据科学
OCI GenAI
无
Ollama
Opea
OpenAI
类似 OpenAI
OpenVINO GenAI
Oracle AI
PremAI
SageMaker 端点
Siliconflow
文本嵌入推理
Textembed
Together
Upstage
Vertex
Vertex 端点
vLLM
Voyage AI
Xinference
Yandexgpt
智谱 AI
评估
评估
答案相关性
上下文相关性
正确性
数据集生成
忠实度
指南
指标
多模态
成对比较
查询响应
响应
检索
语义相似度
Tonic validate
图谱 RAG
图谱 RAG
Cognee
索引
索引
BGE M3
Colbert
Dashscope
文档摘要
Google
关键词
知识图谱
Llama Cloud
PostgresML
属性图
摘要
树
Vectara
向量
Vertex AI
无
摄取
摄取
仪器仪表
仪器仪表
事件处理器
事件类型
Span 处理器
Span 类型
大型语言模型
大型语言模型
无
AI21
Aleph Alpha
阿里云 AI 搜索
Anthropic
Anyscale
ASI
Azure 推理
Azure OpenAI
Bedrock
Bedrock Converse
Cerebras
Clarifai
Cleanlab
Cohere
上下文
Cortex
自定义大型语言模型
Dashscope
Databricks
Deepinfra
DeepSeek
EverlyAI
Fireworks
Friendli
Gaudi
Gemini
Gigachat
Google GenAI
无
Groq
HuggingFace
HuggingFace API
IBM
IPEX LLM
Keywords AI
Konko
Langchain
LiteLLM
Llama API
Llama CPP
Llamafile
LM Studio
LocalAI
Maritalk
Meta
Mistral RS
MistralAI
MLX
ModelScope
Monster API
MyMagic
Nebius
Netmind
Neutrino
Novita
Nvidia
Nvidia TensorRT
Nvidia Triton
OCI 数据科学
OCI GenAI
OctoAI
Ollama
Opea
OpenAI
类似 OpenAI
OpenLLM
OpenRouter
OpenVINO
OpenVINO GenAI
Optimum Intel
PaiEas
PaLM
Perplexity
Pipeshift
Portkey
Predibase
PremAI
千帆
Reka
Replicate
RunGPT
SageMaker 端点
SambaNova Systems
Siliconflow
无
Stepfun
文本生成推理
Together
无
Upstage
Vertex
vLLM
Xinference
Yi
You
智谱 AI
Llama 数据集
Llama 数据集
Llama Deploy
Llama Deploy
apiserver
control_plane
部署
消息消费者
消息发布者
消息
协调器
Python SDK
服务
类型
消息队列
消息队列
Apache Kafka
RabbitMQ
Redis
简单
Solace
Llama Packs
Llama Packs
代理搜索检索器
代理 COA
代理 LATS
代理大型语言模型编译器
Amazon 产品提取
Arize Phoenix 查询引擎
自动合并检索器
Chroma 自动检索
代码层级结构
Cogniswitch 代理
Cohere 引用聊天
纠正性 RAG
DeepLake 深度记忆检索器
DeepLake 多模态检索
密集 x 检索
差分隐私简单数据集
评估器基准测试工具
融合检索器
模糊引用
Gmail OpenAI 代理
Gradio 代理聊天
Gradio React 代理聊天机器人
推断、检索、重排序
Koda 检索器
Llama 数据集元数据
Llama Guard 审核员
LLaVA 补全
LongRAG
代理混合
多文档代理
多租户 RAG
多文档自动检索
NebulaGraph 查询引擎
Neo4j 查询引擎
节点解析器语义分块
Ollama 查询引擎
Panel 聊天机器人
查询理解代理
Raft 数据集
本地 RAG CLI
RAG 评估器
RAG 融合查询流水线
Ragatouille 检索器
Raptor
递归检索器
简历筛选器
重试引擎 Weaviate
SecGPT
自我发现
自我 RAG
句子窗口检索器
Snowflake 查询引擎
股市数据查询引擎
Streamlit 聊天机器人
子问题 Weaviate
表格
Timescale 向量自动检索
Trulens 评估包
无
Vectara RAG
Voyage 查询引擎
Zenguard
Zephyr 查询引擎
LlamaDeploy
LlamaDeploy
apiserver
无
control_plane
部署
无
消息消费者
消息发布者
消息
协调器
Python SDK
服务
类型
记忆
记忆
聊天记忆缓冲区
Mem0
简单可组合记忆
向量记忆
消息队列
消息队列
Apache Kafka
RabbitMQ
Redis
简单
Solace
元数据提取器
元数据提取器
文档上下文
实体
关键词
无
Marvin
Pydantic
问题
Relik
摘要
标题
多模态大型语言模型
多模态大型语言模型
Anthropic
Azure OpenAI
Bedrock
Dashscope
Gemini
HuggingFace
MistralAI
Nebius
Nvidia
Ollama
OpenAI
OpenVINO
Reka
Replicate
智谱 AI
节点解析器与文本分割器
节点解析器与文本分割器
阿里云 AI 搜索
Dashscope
Docling
幻灯片
主题
代码
分层
HTML
JSON
Langchain
Markdown
Markdown 元素
语义分割器
句子分割器
句子窗口
Token 文本分割器
非结构化元素
节点后处理器
节点后处理器
命名实体识别 PII
PII
AIMon 重排序
阿里云 AI 搜索重排序
自动前后
Bedrock 重排序
Cohere 重排序
Colbert 重排序
ColPali 重排序
上下文重排序
Dashscope 重排序
嵌入近期性
固定近期性
Flag 嵌入重排序器
IBM
Jina AI 重排序
关键词
大型语言模型重排序
长上下文重排序
LongLLMLingua
元数据替换
Mixedbread AI 重排序
Nvidia 重排序
OpenVINO 重排序
Pinecone 原生重排序
Presidio
上一个下一个
RankGPT 重排序
RankLLM 重排序
SBERT 重排序
句子优化器
Siliconflow 重排序
相似度
TEI 重排序
时间加权
Voyage AI 重排序
Xinference 重排序
对象存储
对象存储
输出解析器
输出解析器
Guardrails
Langchain
Pydantic
选择
程序
程序
Evaporate
Guidance
大型语言模型文本补全
LM Format Enforcer
多模态
OpenAI
提示
提示
查询引擎
查询引擎
FLARE
JSONalyze
自然语言 SQL 表格
PGVector SQL
SQL Join
SQL 表格检索器
引用
Cogniswitch
自定义
知识图谱
多步
Pandas
检索器
检索器路由器
重试
路由器
简单多模态
子问题
工具检索器路由器
转换
查询流水线
查询流水线
代理
Arg 包
自定义
函数
输入
大型语言模型
多模态
对象
输出解析器
后处理器
提示
查询引擎
查询转换
检索器
路由器
合成器
工具运行器
问题生成器
问题生成器
Guidance
大型语言模型问题生成
OpenAI
阅读器
阅读器
代理搜索
Airbyte CDK
Airbyte Gong
Airbyte HubSpot
Airbyte Salesforce
Airbyte Shopify
Airbyte Stripe
Airbyte Typeform
Airbyte Zendesk 支持
Airtable
阿里云 AI 搜索
Apify
Arango DB
Arxiv
Asana
AssemblyAI
Astra DB
Athena
Awadb
Azure Cognitive Search
Azure Storage Blob
Bagel
哔哩哔哩
Bitbucket
BoardDocs
Box
ChatGPT 插件
Chroma
无
Confluence
Couchbase
CouchDB
老爸笑话
Dashscope
DashVector
数据库
DeepLake
Discord
Docling
Docstring walker
Docugami
Document360
财报电话会议纪要
Elasticsearch
Faiss
Feedly RSS
飞书文档
文件
Firebase Realtime Database
Firestore
GCS
Genius
GitBook
Github
Gitlab
Google
GPT 仓库
GraphDB Cypher
GraphQL
Guru
Hatena 博客
Hive
HubSpot
HuggingFace FS
HWP
Iceberg
IMDb 评论
Intercom
Jaguar
Jira
Joplin
JSON
Kaltura Esearch
Kibela
Lilac
Linear
Llama Parse
Macrometa GDN
Make.com
Mangadex
MangoApps 指南
地图
Markitdown
Mbox
Memos
Metal
Microsoft OneDrive
Microsoft Outlook
Microsoft Outlook 电子邮件
Microsoft SharePoint
Milvus
MinIO
Monday.com
MongoDB
MyScale
Notion
Nougat OCR
Obsidian
OpenAlex
无
OpenDAL
OpenSearch
Oracle AI
Oxylabs
Pandas AI
论文
PatentsView
Pathway
PDB
PDF 标记器
PDF 表格
Pebblo
无
预处理
Psychic
Qdrant
Quip
Rayyan
无
Readwise
Reddit
远程
远程深度
S3
SEC 文件
Semantic Scholar
简单目录阅读器
SingleStore
Slack
智能 PDF 加载器
Snowflake
Spotify
Stack Overflow
Steamship
字符串迭代器
Stripe 文档
结构化数据
Telegram
Toggl
Trello
Twitter
txtai
UniProt
Upstage
天气
Weaviate
Web
Whatsapp
Whisper
维基百科
WordLift
Wordpress
Youtube 字幕
Zendesk
Zep
Zulip
Zyte Serp
响应合成器
响应合成器
累积
紧凑累积
紧凑并精炼
生成
Google
精炼
简单摘要
树状摘要
检索器
检索器
自动合并
Bedrock
Bm25
Duckdb 检索器
Galaxia
Kendra
关键词
知识图谱
Mongodb Atlas Bm25 检索器
Pathway
查询融合
递归
路由器
Sql
摘要
Tldw
转换
树
向量
Vertexai 搜索
Videodb
You
Schema
Schema
选择器
选择器
Notdiamond
稀疏嵌入
稀疏嵌入
Fastembed
存储
存储
聊天存储
聊天存储
Azure
Azure Cosmos DB MongoDB vCore
Azurecosmosnosql
Dynamodb
Gel
Mongo
Postgres
Redis
简单
Sqlite
Tablestore
Upstash
文档存储
文档存储
Azure
Azurecosmosnosql
Couchbase
Dynamodb
Elasticsearch
Firestore
Gel
MongoDB
Postgres
Redis
简单
Tablestore
图存储
图存储
Falkordb
Kuzu
Memgraph
Nebula
Neo4j
Neptune
简单
Tidb
索引存储
索引存储
Azure
Azurecosmosnosql
Couchbase
Dynamodb
Elasticsearch
Firestore
Gel
MongoDB
Postgres
Redis
简单
Tablestore
Kvstore
Kvstore
Azure
Azurecosmosnosql
Couchbase
Dynamodb
Elasticsearch
Firestore
Gel
MongoDB
Postgres
Redis
S3
简单
Tablestore
存储
存储
存储上下文
向量存储
向量存储
ApertureDB
Alibabacloud opensearch
Analyticdb
Astra DB
Awadb
Awsdocdb
Azureaisearch
Azurecosmosmongo
Azurecosmosnosql
Bagel
Baiduvectordb
Cassandra
无
Chroma
Clickhouse
Couchbase
DashVector
Databricks
DeepLake
Docarray
Duckdb
Dynamodb
Elasticsearch
Epsilla
Faiss
Firestore
Gel
Google
Hologres
Jaguar
Kdbai
Lancedb
Lantern
Lindorm
Mariadb
无
Milvus
MongoDB
Neo4jvector
Neptune
Nile
Objectbox
Oceanbase
OpenSearch
Oracledb
Pgvecto rs
Pinecone
Postgres
Qdrant
Redis
Relyt
Rocksetdb
简单
Singlestoredb
无
Supabase
Tablestore
Tair
Tencentvectordb
Tidbvector
Timescalevector
txtai
Typesense
Upstash
Vearch
Vertexaivectorsearch
Vespa
Weaviate
WordLift
Zep
工具
工具
Agentql
Arxiv
Azure code interpreter
Azure cv
Azure speech
Azure translate
Bing search
Box
Brave search
Cassandra
ChatGPT 插件
Code interpreter
Cogniswitch
Dappier
数据库
无
Duckduckgo
Elevenlabs
Exa
Finance
函数
Google
GraphQL
Ionic shopping
Jina
Jira
Linkup research
Load and search
Mcp
Metaphor
Multion
Neo4j
Notion
Ondemand loader
OpenAI
Openapi
无
Playgrounds
Playwright
Python file
查询引擎
Query plan
Requests
检索器
Salesforce
Scrapegraph
Shopify
Slack
Tavily research
Text to image
Tool spec
Valyu
Vectara query
Vector db
Waii
天气
维基百科
Wolfram alpha
Yahoo finance
Yelp
Zapier
工作流程
工作流程
装饰器
上下文
事件
重试策略
工作流
开源社区
开源社区
集成
全栈项目
社区常见问题
社区常见问题
聊天引擎
文档和节点
嵌入
大型语言模型
查询引擎
向量数据库
贡献
贡献
代码
文档
更新日志
演示文稿
已弃用术语
LlamaCloud
LlamaCloud
LlamaParse
Azure Cosmos DB MongoDB vCore
返回顶部