跳至内容
LlamaIndex
支持的模块
主页
学习
使用案例
示例
组件指南
高级主题
API参考
开源社区
LlamaCloud
LlamaIndex
主页
主页
高级概念
安装与设置
如何阅读这些文档
入门示例
入门示例
入门教程 (使用 OpenAI)
入门教程 (使用本地大型语言模型)
探索 LlamaIndex 视频系列
常见问题 (FAQ)
入门工具
入门工具
RAG 命令行界面
学习
学习
使用大型语言模型
构建代理
构建代理
使用现有工具
维护状态
流式输出和事件
人工干预
多代理工作流
构建工作流
构建工作流
基本工作流
分支与循环
维护状态
流式事件
并发执行
工作流子类化
嵌套工作流
可观测性
无界语法
构建 RAG 流程
构建 RAG 流程
加载与摄取
加载与摄取
加载数据 (摄取)
LlamaHub
从 LlamaCloud 加载
索引与嵌入
存储
查询
结构化数据提取
结构化数据提取
使用结构化大型语言模型
结构化预测
低级别提取
跟踪与调试
评估
评估
评估
成本分析
成本分析
使用模式
整合所有模块
整合所有模块
全栈 Web 应用
全栈 Web 应用
使用 LLamaIndex 构建全栈 Web 应用指南
使用 Delphic 构建全栈 LlamaIndex Web 应用指南
问答模式
问答模式
术语和定义提取指南
聊天机器人
聊天机器人
如何构建聊天机器人
结构化数据
结构化数据
使用案例
使用案例
提示词
问答 (RAG)
聊天机器人
结构化数据提取
代理
多模态应用
微调
示例
示例
代理
代理
如何构建聊天机器人
GPT 构建器演示
FunctionAgent / AgentWorkflow 基本介绍
使用 AgentWorkflow 的多代理研究工作流
Agent Workflow + 使用 AgentQL 的研究助手
Anthropic 代理函数调用
AWS Bedrock Converse 代理函数调用
使用 LlamaIndex 的预构建 CodeAct 代理
从零开始创建 CodeAct 代理
聊天记忆缓冲区
简单可组合记忆
聊天摘要记忆缓冲区
向量记忆
Mistral 代理函数调用
多文档代理 (V1)
NVIDIA 代理函数调用
用于博客创建的文档研究助手
由 NVIDIA NIMs 驱动的子问题查询引擎
上下文增强函数调用代理
针对冗长工具描述的 OpenAI 代理变通方法
OpenAI 代理 + 查询引擎实验操作手册
检索增强代理
带有查询引擎工具的代理
ReAct 代理 - 带有计算器工具的简单介绍
带有查询引擎 (RAG) 工具的 ReAct 代理
使用 Return Direct 工具控制代理推理循环
聊天引擎
聊天引擎
聊天引擎 - 最佳模式
聊天引擎 - 压缩加上下文模式
聊天引擎 - 压缩问题模式
聊天引擎 - 上下文模式
聊天引擎 - OpenAI 代理模式
具有个性的聊天引擎 ✨
聊天引擎 - ReAct 代理模式
聊天引擎 - 简单模式 REPL
操作手册
操作手册
使用 LlamaIndex 实现 GraphRAG
使用 LlamaIndex 实现 GraphRAG - V2
AirtrainAI 操作手册
Anthropic Haiku 操作手册
使用可信语言模型的可信 RAG
MistralAI Codestral 操作手册
Cohere init8 和二进制嵌入检索评估
上下文检索
CrewAI + LlamaIndex 操作手册
Llama3 操作手册
使用 Intel Gaudi 的大型语言模型操作手册
使用 Groq 的 Llama3 操作手册
使用 Ollama 和 Replicate 的 Llama3 操作手册
MistralAI 操作手册
mixedbread 重排操作手册
使用 MongoDB 和 LlamaIndex 优化相关性
带有文档处理的 Oracle AI 向量搜索
LlamaIndex 组件
评估 RAG 系统
摄取流程
元数据提取
可观测性
代理
路由器查询引擎和子问题查询引擎
多模态 RAG 系统
使用 LlamaParse 的高级 RAG
Prometheus-2 操作手册
使用 Toolhouse 的销售前景工作流
自定义
自定义
Azure OpenAI
ChatGPT
HuggingFace 大型语言模型 - Camel-5b
HuggingFace 大型语言模型 - StableLM
聊天提示词自定义
完成提示词自定义
流式处理
聊天引擎流式处理 - 压缩问题模式
数据连接器
数据连接器
Google AlloyDB for PostgreSQL -
Chroma 读取器
Google Cloud SQL for PostgreSQL -
DashVector 读取器
数据库读取器
DeepLake 读取器
Discord 读取器
Docling 读取器
Faiss 读取器
Github 仓库读取器
Google Chat 读取器测试
Google Docs 读取器
Google Drive 读取器
Google Maps 文本搜索读取器
Google Sheets 读取器
Make 读取器
Mbox 读取器
Milvus 读取器
MongoDB 读取器
MyScale 读取器
Notion 读取器
Obsidian 读取器
Oxylabs 读取器
Pathway 读取器
预处理
Psychic 读取器
Qdrant 读取器
Slack 读取器
Twitter 读取器
Weaviate 读取器
网页读取器
Zyte Serp 读取器
Deplot 读取器演示
HTML 标签读取器
Oracle AI 向量搜索:文档处理
简单目录读取器
并行处理 SimpleDirectoryReader
远程文件系统的 Simple Directory Reader
探索 LlamaIndex
探索 LlamaIndex
Discord 线程管理
文档存储
文档存储
Google AlloyDB for PostgreSQL - &
演示:将 Azure Table Storage 用作文档存储
Google Cloud SQL for PostgreSQL - &
文档存储演示
Dynamo DB 文档存储演示
Firestore 演示
MongoDB 演示
Redis 文档存储+索引存储演示
Tablestore 演示
嵌入
嵌入
Anyscale 嵌入
LangChain 嵌入
OpenAI 嵌入
Aleph Alpha 嵌入
Bedrock 嵌入
使用 Clarifai 的嵌入
Cloudflare Workers AI 嵌入
CohereAI 嵌入
自定义嵌入
Dashscope 嵌入
Databricks 嵌入
Deepinfra
Elasticsearch 嵌入
Qdrant FastEmbed 嵌入
Fireworks 嵌入
Google Gemini 嵌入
Gigachat
Google GenAI 嵌入
Google PaLM 嵌入
使用 HuggingFace 的本地嵌入
IBM watsonx.ai
在 Intel CPU 上使用 IPEX-LLM 的本地嵌入
在 Intel GPU 上使用 IPEX-LLM 的本地嵌入
Jina 8K 上下文窗口嵌入
Jina 嵌入
Llamafile 嵌入
LLMRails 嵌入
MistralAI 嵌入
Mixedbread AI 嵌入
ModelScope 嵌入
Nebius 嵌入
Netmind AI 嵌入
Nomic 嵌入
NVIDIA NIMs
Oracle 云基础设施 (OCI) 数据科学服务
Oracle 云基础设施生成式人工智能
Ollama 嵌入
使用 OpenVINO 的本地嵌入
使用 Optimum-Intel 优化的嵌入模型
Oracle AI 向量搜索:生成嵌入
PremAI 嵌入
使用 LlamaIndex 与部署在 Amazon SageMaker 端点的嵌入进行交互
文本嵌入推理
TextEmbed - 嵌入推理服务器
Together AI 嵌入
Upstage 嵌入
使用 LlamaIndex 与部署在 Vertex AI 端点的嵌入进行交互
VoyageAI 嵌入
Yandexgpt
评估
评估
AIMon
BEIR 域外基准测试
🚀 RAG/大型语言模型评估器 - DeepEval
HotpotQADistractor 演示
问题生成
RAGChecker: 用于诊断 RAG 的细粒度评估框架
自校正查询引擎 - 评估与重试
Tonic Validate 评估器
如何在 LlamaIndex 中使用 UpTrain
答案相关性和上下文相关性评估
BatchEvalRunner - 运行多个评估
正确性评估器
忠实度评估器
指导原则评估器
在 MT-Bench 人工判断上对大型语言模型评估器进行基准测试
在 Mini MT-Bench (单次评分) 上对大型语言模型评估器进行基准测试
评估多模态 RAG
成对评估器
使用 Prometheus 模型进行评估
相关性评估器
检索评估
嵌入相似性评估器
🏔️ 使用 Argilla 和工作流进行 RAG 的后退提示
微调
微调
如何使用 LLamaIndex 微调跨编码器
使用 NUDGE 微调语料库嵌入
微调嵌入
在任何黑盒嵌入模型之上微调适配器
用于微调 GPT-3.5 评判器 (正确性) 的知识蒸馏
用于微调 GPT-3.5 评判器 (成对) 的知识蒸馏
使用 Finetuning API 微调 MistralAI 模型
微调 GPT-3.5-Turbo
使用函数调用进行微调
在 Better Chain of Thought 上微调 gpt-3.5 ReAct 代理
自定义 Cohere 重排器
路由器微调
摄取
摄取
高级摄取流程
异步摄取流程 + 元数据提取
摄取流程 + 文档管理
在 Google Drive 文件上构建实时 RAG 流程
并行化摄取流程
Redis 摄取流程
大型语言模型
大型语言模型
AI21
Aleph Alpha
Anthropic
Anthropic 提示词缓存
Anyscale
ASI 大型语言模型
Azure AI 模型推理
Azure OpenAI
Bedrock
Bedrock Converse
Cerebras
Clarifai 大型语言模型
Cleanlab 可信语言模型
Cohere
DashScope 大型语言模型
Databricks
DeepInfra
DeepSeek
EverlyAI
Fireworks
Fireworks 函数调用操作手册
Friendli
Gemini
Google GenAI
Groq
Hugging Face 大型语言模型
IBM watsonx.ai
Intel CPU 上的 IPEX-LLM
Intel GPU 上的 IPEX-LLM
Konko
Langchain
LiteLLM
Replicate - Llama 2 13B
🦙 x 🦙 Rap Battle
Llama API
LlamaCPP
llamafile
大型语言模型预测器
LM Studio
LocalAI
Maritalk
MistralRS 大型语言模型
MistralAI
ModelScope 大型语言模型
Monster API <> LLamaIndex
MyMagic AI 大型语言模型
Nebius 大型语言模型
Netmind AI 大型语言模型
Neutrino AI
NVIDIA NIMs
NVIDIA NIMs
Nvidia TensorRT-LLM
NVIDIA 大型语言模型文本补全 API
Nvidia Triton
Oracle 云基础设施数据科学
Oracle 云基础设施生成式人工智能
OctoAI
Ollama - Llama 3.1
Ollama - Gemma
OpenAI
OpenAI JSON 模式 vs. 函数调用用于数据提取
OpenAI 响应 API
OpenLLM
OpenRouter
OpenVINO GenAI 大型语言模型
OpenVINO 大型语言模型
使用 IPEX 后端优化的 Optimum Intel 大型语言模型
阿里云 PaiEas
PaLM
Perplexity
Pipeshift
Portkey
Predibase
PremAI LlamaIndex
百度智能云千帆大型语言模型平台客户端
RunGPT
使用 LlamaIndex 与部署在 Amazon SageMaker 端点的大型语言模型进行交互
SambaNova Systems
Together AI 大型语言模型
Upstage
Vertex AI
Replicate - Vicuna 13B
vLLM
Xorbits Inference
Yi
Llama 数据集
Llama 数据集
从 LlamaHub 下载 Llama 数据集
使用 A 对 RAG 流程进行基准测试
提交模板 Notebook
向 LlamaHub 贡献 Llama 数据集
Llama Hub
Llama Hub
LlamaHub 演示
Ollama Llama Pack 示例
Llama Pack - 简历筛选器 📄
Llama Packs 示例
低级别
低级别
从零开始构建评估
从零开始构建高级融合检索器
从零开始构建数据摄取
从零开始构建 RAG (仅限开源!)
从零开始构建响应合成
从零开始构建检索
从零开始构建路由器
从零开始构建一个 (非常简单的) 向量存储
托管索引
托管索引
BGEM3 演示
Google 生成语言语义检索器
PostgresML 托管索引
用于 RAG 的 Vertex AI 上的 Google Cloud LlamaIndex
语义检索器基准测试
Vectara 托管索引
记忆
记忆
Mem0
元数据提取器
元数据提取器
使用 Llama Index 的上下文检索
实体元数据提取
使用 Marvin 进行元数据提取和增强
提取元数据以更好地进行文档索引和理解
自动元数据提取以实现更好的检索 + 合成
Pydantic 提取器
多模态
多模态
使用 LlamaIndex 的 Chroma 多模态演示
使用 Anthropic 模型进行图像推理的多模态大型语言模型
使用 Azure OpenAI GPT-4o mini 进行图像推理的多模态大型语言模型
使用 Cohere 多模态嵌入的多模态检索
使用 DashScope qwen-vl 模型进行图像推理的多模态大型语言模型
使用 Google 的 Gemini 模型进行图像理解并使用 LlamaIndex 构建检索增强生成的多模态大型语言模型
多模态结构化输出:GPT-4o 与其他 GPT-4 变体
GPT4-V 实验:通用问题、特定问题和思维链 (COT) 提示技术。
使用 GPT4V 和多模态索引/检索器的高级多模态检索
使用 CLIP 嵌入的图像到图像检索和使用 GPT4V 的图像相关推理
使用 VoyageAI 多模态嵌入的多模态检索
使用 LlamaIndex 的 LlaVa 演示
检索增强图像字幕
使用 Mistral 进行图像推理的多模态大型语言模型
[Beta] 多模态 ReAct 代理
多模态 GPT4V Pydantic 程序
使用 Nomic Embed 和 Anthropic 的多模态 RAG。
使用 GPT 文本嵌入和 CLIP 图像嵌入对维基百科文章进行多模态检索
使用 OpenAI GPT4V 和 LanceDB 向量存储处理视频的多模态 RAG
使用 VideoDB 的多模态 RAG
多模态 RAG 护栏 Gemini 大型语言模型护栏 大型语言模型护栏
使用 Nebius 的多模态模型
使用 NVIDIA 端点进行图像推理的多模态大型语言模型
使用 OpenAI GPT-4V 模型进行图像推理
使用 OpenVINO 的本地多模态流程
使用 Replicate LlaVa, Fuyu 8B, MiniGPT4 模型进行图像推理的多模态大型语言模型
半结构化图像检索
多租户
多租户
使用 LlamaIndex 的多租户 RAG
节点解析器与文本分割器
节点解析器与文本分割器
语义分块器
语义双重合并分块
主题节点解析器
节点后处理器
节点后处理器
AIMon 重排
Cohere 重排
使用 ColPali、Cohere 重排器和多模态嵌入进行重排
Colbert 重排
基于文件的节点解析器
FlagEmbedding 重排器
Jina 重排
大型语言模型重排器演示 (了不起的盖茨比)
大型语言模型重排器演示 (2021 Lyft 10-k)
长上下文重排序
元数据替换 + 节点句子窗口
Mixedbread AI 重排
NVIDIA NIMs
句子嵌入优化器
PII 脱敏
前向/后向增强
时效性过滤
SentenceTransformer 重排
结构化大型语言模型重排器演示 (2021 Lyft 10-k)
时间加权重排
VoyageAI 重排
IBM watsonx.ai
OpenVINO 重排
RankGPT 重排器演示 (梵高维基)
RankLLM 重排器演示 (梵高维基)
对象存储
对象存储
类
可观测性
可观测性
Aim 回调
HoneyHive LlamaIndex 追踪器
操作手册 LlamaIndex 集成 (Instrumentation 模块)
Langfuse 回调处理程序
使用 PostHog 和 Langfuse 分析和调试 LlamaIndex 应用
Llama 调试处理程序
MLflow 跟踪和与 LlamaIndex 的端到端集成
OpenInference 回调处理程序 + Arize Phoenix
使用 OpenLLMetry 的可观测性
使用 Opik 记录跟踪
PromptLayer 处理程序
Token 计数处理程序
UpTrain 回调处理程序
Wandb 回调处理程序
输出解析器
输出解析器
Guardrails 输出解析
Langchain 输出解析
DataFrame 结构化数据提取
Evaporate 演示
用于结构化提取的函数调用程序
Guidance Pydantic 程序
子问题查询引擎指南
大型语言模型 Pydantic 程序
LM Format Enforcer Pydantic 程序
LM Format Enforcer 正则表达式生成
大型语言模型 Pydantic 程序 - NVIDIA
OpenAI Pydantic 程序
用于子问题查询引擎的 OpenAI 函数调用
参数优化器
参数优化器
[进行中] RAG 的超参数优化
提示词
提示词
高级提示词技术 (变量映射、函数)
RAG 中的 EmotionPrompt
在高级模块中访问/自定义提示词
使用 RichPromptTemplate 构建
属性图
属性图
使用属性图存储
使用预定义模式构建属性图
属性图索引
定义自定义属性图检索器
Memgraph 属性图索引
Neo4j 属性图索引
查询引擎
查询引擎
带有自定义检索器的检索器查询引擎 - 简单混合搜索
JSONalyze 查询引擎
联合问答摘要查询引擎
检索器路由器查询引擎
路由器查询引擎
SQL 自动向量查询引擎
SQL Join 查询引擎
SQL 路由器查询引擎
引用查询引擎
Cogniswitch 查询引擎
定义自定义查询引擎
集成查询引擎指南
FLARE 查询引擎
JSON 查询引擎
知识图谱查询引擎
知识图谱 RAG 查询引擎
结构化层次检索
Pandas 查询引擎
递归检索器 + 查询引擎演示
[Beta] 使用 PGVector 的文本到 SQL
带有 Pydantic 输出的查询引擎
递归检索器 + 文档代理
针对 Tesla 10K 的联合表格/语义问答
子问题查询引擎
查询流程
查询流程
LlamaIndex 查询流程介绍
带有异步/并行执行的查询流程
查询流程聊天引擎
针对 Pandas DataFrame 的查询流程
带有路由的查询流程
用于高级文本到 SQL 的查询流程
查询转换
查询转换
HyDE 查询转换
多步查询引擎
查询转换操作手册
响应合成器
响应合成器
Pydantic 树形摘要
使用回忆任务对长上下文大型语言模型进行压力测试
Pydantic 树形摘要
精炼
使用结构化答案过滤进行精炼
树形摘要
检索器
检索器
自动合并检索器
比较结构化检索方法 (自动检索 vs. 递归检索)
Bedrock (知识库)
BM25 检索器
可组合对象
Activeloop 深度记忆
集成检索指南
使用长上下文嵌入 (Together.ai) 的块 + 文档混合检索
Pathway 检索器
互惠重排融合检索器
递归检索器 + 节点引用 + Braintrust
递归检索器 + 节点引用
相对分数融合和基于分布的分数融合
路由器检索器
简单融合检索器
从 Vectara 索引自动检索
Vertex AI Search 检索器
Videodb 检索器
You.com 检索器
工具
工具
使用 AgentQL 构建浏览器代理
OnDemandLoaderTool 教程
Azure Code Interpreter 工具规范
Cassandra 数据库工具
评估查询引擎工具
带回调的函数调用
转换
转换
转换评估
使用案例
使用案例
10K 分析
10Q 分析
电子邮件数据提取
Github Issue 分析
向量存储
向量存储
AWS DocDB 演示
阿里云 OpenSearch 向量存储
Google AlloyDB for PostgreSQL -
Amazon Neptune - Neptune Analytics 向量存储
AnalyticDB
将 ApertureDB 用作 LlamaIndex 的向量存储。
Astra DB
简单向量存储 - 异步索引创建
Awadb 向量存储
Azure AI Search
Azure CosmosDB MongoDB 向量存储
Azure Cosmos DB No SQL 向量存储
Bagel 向量存储
Bagel Network
百度 VectorDB
Cassandra 向量存储
Chroma + Fireworks + Nomic 使用 Matryoshka 嵌入
Chroma
ClickHouse 向量存储
Google Cloud SQL for PostgreSQL -
Couchbase VectorStore 演示
DashVector 向量存储
Databricks 向量搜索
Deep Lake 向量存储快速入门
DocArray Hnsw 向量存储
DocArray 内存向量存储
DuckDB
Elasticsearch 向量存储
Elasticsearch
Epsilla 向量存储
Faiss 向量存储
Firestore 向量存储
Hnswlib
Hologres
Jaguar 向量存储
使用 LlamaIndex 和 KDB.AI 向量存储的高级 RAG (带有时间过滤器)
LanceDB 向量存储
Lantern 向量存储 (自动检索器)
Lantern 向量存储
Lindorm
带有异步 API 的 Milvus 向量存储
带有全文搜索的 Milvus 向量存储
带有混合搜索的 Milvus 向量存储
Milvus 向量存储
Milvus 向量存储 - 元数据过滤器
MongoDB Atlas 向量存储
MongoDB Atlas + Fireworks AI RAG 示例
MongoDB Atlas + OpenAI RAG 示例
MyScale 向量存储
Neo4j 向量存储
Nile 向量存储 (多租户 PostgreSQL)
ObjectBox VectorStore 演示
OceanBase 向量存储
Opensearch 向量存储
pgvecto.rs
Pinecone 向量存储 - 混合搜索
Pinecone 向量存储
Qdrant 向量存储
Qdrant 向量存储 - 元数据过滤器
Qdrant 向量存储 - 默认 Qdrant 过滤器
Redis 向量存储
Relyt
Rockset 向量存储
简单向量存储
本地 Llama2 + VectorStoreIndex
Llama2 + VectorStoreIndex
简单向量存储 - 最大边缘相关性检索
S3/R2 存储
Supabase 向量存储
Tablestore VectorStore
Tair 向量存储
腾讯云向量数据库
TiDB 向量存储
Timescale 向量存储 (PostgreSQL)
txtai 向量存储
Typesense 向量存储
Upstash 向量存储
Vearch 演示
Google Vertex AI 向量搜索
Vespa 向量存储演示
Weaviate 向量存储 - 混合搜索
Weaviate 向量存储
从 Weaviate 向量数据库自动检索
Weaviate 向量存储元数据过滤器
WordLift 向量存储
Zep 向量存储
从向量数据库自动检索
Chroma 向量存储
从向量数据库自动检索
指南:将向量存储索引与现有 Pinecone 向量存储一起使用
指南:将向量存储索引与现有 Weaviate 向量存储一起使用
Gel 向量存储
Neo4j 向量存储 - 元数据过滤器
Oracle AI 向量搜索:向量存储
自动检索的简单到高级指南 (使用 Pinecone + Arize Phoenix)
Pinecone 向量存储 - 元数据过滤器
Postgres 向量存储
使用 Qdrant BM42 的混合搜索
Qdrant 混合搜索
工作流
工作流
JSONalyze 查询引擎
用于高级文本到 SQL 的工作流
无
检查点工作流运行
构建带有内联引用的 RAG
纠正性 RAG 工作流
函数调用代理的工作流
选择你自己的冒险工作流 (人工干预)
LongRAG 工作流
多步查询引擎
带有反射的多策略工作流
无
相同事件的并行执行示例
查询规划工作流
带有重排的 RAG 工作流
ReAct 代理的工作流
用于结构化输出的反射工作流
路由器查询引擎
自我发现工作流
子问题查询引擎作为工作流
工作流操作手册:逐步讲解工作流的所有功能
组件指南
组件指南
模型
模型
大型语言模型
大型语言模型
使用大型语言模型
独立使用
自定义大型语言模型
可用大型语言模型集成
嵌入
多模态
提示词
提示词
提示词使用模式
加载
加载
文档和节点
文档和节点
使用文档
使用节点
元数据提取
SimpleDirectoryReader
数据连接器
数据连接器
使用模式
LlamaParse
模块指南
节点解析器 / 文本分割器
节点解析器 / 文本分割器
节点解析器模块
摄取流程
摄取流程
转换
索引
索引
索引指南
向量存储索引
属性图索引
文档管理
LlamaCloud
元数据提取
模块
存储
存储
向量存储
文档存储
索引存储
聊天存储
键值存储
持久化和加载数据
自定义存储
查询
查询
查询引擎
查询引擎
使用模式
响应模式
流式处理
模块指南
支持的模块
聊天引擎
聊天引擎
使用模式
模块指南
检索
检索
检索器模块
检索器模式
节点后处理器
节点后处理器
节点后处理器模块
响应合成
响应合成
响应合成模块
路由
工作流
查询流程 (已弃用)
查询流程 (已弃用)
使用模式
模块指南
模块使用
结构化输出
结构化输出
输出解析模块
(已弃用) 查询引擎 + Pydantic 输出
Pydantic 程序
代理
代理
记忆
工具
工作流
工作流
评估
评估
使用模式 (响应评估)
使用模式 (检索)
模块
Llama 数据集
Llama 数据集
贡献标注 RAG 数据集
使用标注 RAG 数据集进行评估
使用标注评估器数据集评估评估器
可观测性
可观测性
Instrumentation
设置
Llama Deploy
Llama Deploy
入门
核心组件
手动编排
Python SDK
命令行界面
高级主题
高级主题
构建用于生产环境的高性能 RAG 应用
基本策略
代理策略
检索
检索
高级检索策略
查询转换
评估
评估
按组件评估
端到端评估
评估
微调
编写自定义模块
从零开始构建 RAG (低级别)
API参考
API参考
代理
代理
回调
回调
Agentops
Aim
Argilla
Arize Phoenix
Deepeval
Honeyhive
Langfuse
Literalai
Llama Debug
Openinference
无
Opik
Promptlayer
Token 计数器
Uptrain
Wandb
聊天引擎
聊天引擎
压缩加上下文
压缩问题
上下文
简单
嵌入
嵌入
适配器
Alephalpha
阿里云 AI Search
Anyscale
自动嵌入
Azure 推理
Azure OpenAI
Bedrock
Clarifai
Clip
Cloudflare Workers AI
Cohere
Dashscope
Databricks
Deepinfra
Elasticsearch
Fastembed
Fireworks
Gaudi
Gemini
Gigachat
Google
Google GenAI
无
Huggingface
Huggingface API
Huggingface OpenVINO
Huggingface Optimum
Huggingface Optimum Intel
IBM
Instructor
IPEX LLM
Jina AI
Langchain
LiteLLM
Llamafile
大型语言模型 Rails
Mistral AI
Mixedbread AI
ModelScope
Nebius
Netmind
Nomic
Nvidia
OCI 数据科学
OCI GenAI
无
Ollama
Opea
OpenAI
类似 OpenAI 的
OpenVINO GenAI
Oracle AI
PremAI
SageMaker 端点
Siliconflow
文本嵌入推理
Textembed
Together
Upstage
Vertex
Vertex 端点
vLLM
VoyageAI
Xinference
Yandexgpt
智谱 AI
评估
评估
答案相关性
上下文相关性
正确性
数据集生成
忠实度
指导原则
指标
多模态
成对比较
查询响应
响应
检索
语义相似性
Tonic Validate
图 RAG
图 RAG
Cognee
索引
索引
BGE M3
Colbert
Dashscope
文档摘要
Google
关键词
知识图谱
Llama Cloud
PostgresML
属性图
摘要
树形
Vectara
向量
Vertex AI
无
摄取
摄取
Instrumentation
Instrumentation
事件处理程序
事件类型
Span 处理程序
Span 类型
大型语言模型
大型语言模型
无
AI21
Alephalpha
阿里云 AI Search
Anthropic
Anyscale
Asi
Azure 推理
Azure OpenAI
Bedrock
Bedrock Converse
Cerebras
Clarifai
Cleanlab
Cohere
上下文
Cortex
自定义大型语言模型
Dashscope
Databricks
Deepinfra
DeepSeek
Everly AI
Fireworks
Friendli
Gaudi
Gemini
Gigachat
Google GenAI
无
Groq
Huggingface
Huggingface API
IBM
IPEX LLM
Keywords AI
Konko
Langchain
LiteLLM
Llama API
Llama CPP
Llamafile
LM Studio
LocalAI
Maritalk
Meta
Mistral RS
Mistral AI
MLX
ModelScope
Monster API
MyMagic
Nebius
Netmind
Neutrino
Novita
Nvidia
Nvidia TensorRT
Nvidia Triton
OCI 数据科学
OCI GenAI
OctoAI
Ollama
Opea
OpenAI
类似 OpenAI 的
OpenLLM
OpenRouter
OpenVINO
OpenVINO GenAI
Optimum Intel
PaiEas
PaLM
Perplexity
Pipeshift
Portkey
Predibase
PremAI
千帆
Reka
Replicate
RunGPT
SageMaker 端点
SambaNova Systems
Siliconflow
无
Stepfun
文本生成推理
Together
无
Upstage
Vertex
vLLM
Xinference
Yi
You
智谱 AI
Llama 数据集
Llama 数据集
Llama Deploy
Llama Deploy
API 服务器
控制平面
部署
消息消费者
消息发布者
消息
编排器
Python SDK
服务
类型
消息队列
消息队列
Apache Kafka
RabbitMQ
Redis
简单
Solace
Llama Pack
Llama Pack
代理搜索检索器
代理 COA
代理 LATS
大型语言模型编译器代理
亚马逊产品提取
Arize Phoenix 查询引擎
自动合并检索器
Chroma 自动检索
代码层次结构
Cogniswitch 代理
Cohere 引用聊天
纠正性 RAG
Deeplake 深度记忆检索器
Deeplake 多模态检索
密集 x 检索
差异私有简单数据集
评估器基准测试工具
融合检索器
模糊引用
Gmail OpenAI 代理
Gradio 代理聊天
Gradio ReAct 代理聊天机器人
推理、检索、重排
Koda 检索器
Llama 数据集元数据
Llama Guard 审核器
LlaVa 完成
LongRAG
代理混合
多文档代理
多租户 RAG
多文档自动检索
NebulaGraph 查询引擎
Neo4j 查询引擎
节点解析器语义分块
Ollama 查询引擎
Panel 聊天机器人
查询理解代理
RAFT 数据集
RAG 命令行界面 本地
RAG 评估器
RAG 融合查询流程
Ragatouille 检索器
Raptor
递归检索器
简历筛选器
Weaviate 重试引擎
SecGPT
自我发现
Self RAG
句子窗口检索器
Snowflake 查询引擎
股票市场数据查询引擎
Streamlit 聊天机器人
子问题 Weaviate
表格
Timescale 向量自动检索
TruLens 评估包
无
Vectara RAG
Voyage 查询引擎
ZenGuard
Zephyr 查询引擎
LlamaDeploy
LlamaDeploy
API 服务器
无
控制平面
部署
无
消息消费者
消息发布者
消息
编排器
Python SDK
服务
类型
记忆
记忆
聊天记忆缓冲区
Mem0
简单可组合记忆
向量记忆
消息队列
消息队列
Apache Kafka
RabbitMQ
Redis
简单
Solace
元数据提取器
元数据提取器
文档上下文
实体
关键词
无
Marvin
Pydantic
问题
Relik
摘要
标题
多模态大型语言模型
多模态大型语言模型
Anthropic
Azure OpenAI
Bedrock
Dashscope
Gemini
Huggingface
Mistral AI
Nebius
Nvidia
Ollama
OpenAI
OpenVINO
Reka
Replicate
智谱 AI
节点解析器与文本分割器
节点解析器与文本分割器
阿里云 AI Search
Dashscope
Docling
幻灯片
主题
代码
层次结构
HTML
JSON
Langchain
Markdown
Markdown 元素
语义分割器
句子分割器
句子窗口
Token 文本分割器
非结构化元素
节点后处理器
节点后处理器
命名实体识别 PII
PII
AIMon 重排
阿里云 AI Search 重排
自动上一个下一个
Bedrock 重排
Cohere 重排
Colbert 重排
ColPali 重排
上下文重排
Dashscope 重排
嵌入时效性
固定时效性
Flag 嵌入重排器
IBM
Jina AI 重排
关键词
大型语言模型重排
长上下文重排序
LongLLMLingua
元数据替换
Mixedbread AI 重排
Nvidia 重排
OpenVINO 重排
Pinecone 原生重排
Presidio
上一个下一个
RankGPT 重排
RankLLM 重排
SBERT 重排
句子优化器
Siliconflow 重排
相似度
TEI 重排
时间加权
VoyageAI 重排
Xinference 重排
对象存储
对象存储
输出解析器
输出解析器
Guardrails
Langchain
Pydantic
选择
程序
程序
Evaporate
Guidance
大型语言模型文本补全
LMFormatEnforcer
多模态
OpenAI
提示词
提示词
查询引擎
查询引擎
FLARE
JSONalyze
自然语言到 SQL 表
PGVector SQL
SQL Join
SQL 表检索器
引用
Cogniswitch
自定义
知识图谱
多步
Pandas
检索器
检索器路由器
重试
路由器
简单多模态
子问题
工具检索器路由器
转换
查询流程
查询流程
代理
参数包
自定义
函数
输入
大型语言模型
多模态
对象
输出解析器
后处理器
提示词
查询引擎
查询转换
检索器
路由器
合成器
工具运行器
问题生成器
问题生成器
Guidance
大型语言模型问题生成
OpenAI
读取器
读取器
代理搜索
Airbyte CDK
Airbyte Gong
Airbyte HubSpot
Airbyte Salesforce
Airbyte Shopify
Airbyte Stripe
Airbyte Typeform
Airbyte Zendesk Support
Airtable
阿里云 AI Search
Apify
Arango DB
ArXiv
Asana
AssemblyAI
Astra DB
Athena
Awadb
Azure Cognitive Search
Azure Storage Blob
Bagel
Bilibili
Bitbucket
BoardDocs
Box
ChatGPT 插件
Chroma
无
Confluence
Couchbase
CouchDB
爸爸笑话
Dashscope
DashVector
数据库
DeepLake
Discord
Docling
文档字符串遍历器
Docugami
Document360
财报电话会议记录
Elasticsearch
Faiss
Feedly RSS
飞书文档
文件
Firebase Realtime DB
Firestore
GCS
Genius
GitBook
Github
GitLab
Google
GPT 仓库
GraphDB Cypher
GraphQL
Guru
Hatena 博客
Hive
HubSpot
Huggingface 文件系统
HWP
Iceberg
IMDB 评论
Intercom
Jaguar
Jira
Joplin
JSON
Kaltura ESearch
Kibela
Lilac
Linear
LlamaParse
Macrometa GDN
Make.com
Mangadex
Mangoapps 指南
地图
Markitdown
Mbox
Memos
Metal
Microsoft OneDrive
Microsoft Outlook
Microsoft Outlook 电子邮件
Microsoft SharePoint
Milvus
MinIO
Monday.com
MongoDB
MyScale
Notion
Nougat OCR
Obsidian
OpenAlex
无
OpenDAL
OpenSearch
Oracle AI
Oxylabs
Pandas AI
论文
PatentsView
Pathway
PDB
PDF 标记器
PDF 表格
Pebblo
无
预处理
Psychic
Qdrant
Quip
Rayyan
无
Readwise
Reddit
远程
远程深度
S3
SEC 文件
Semantic Scholar
简单目录读取器
SingleStore
Slack
智能 PDF 加载器
Snowflake
Spotify
Stack Overflow
Steamship
字符串可迭代对象
Stripe 文档
结构化数据
Telegram
Toggl
Trello
Twitter
txtai
UniProt
Upstage
天气
Weaviate
网页
Whatsapp
Whisper
维基百科
WordLift
Wordpress
Youtube 视频记录
Zendesk
Zep
Zulip
Zyte Serp
响应合成器
响应合成器
累积
紧凑累积
紧凑和精炼
生成
Google
精炼
简单摘要
树形摘要
检索器
检索器
自动合并
Bedrock
BM25
DuckDB 检索器
Galaxia
Kendra
关键词
知识图谱
MongoDB Atlas BM25 检索器
Pathway
查询融合
递归
路由器
SQL
摘要
TLDW
转换
树形
向量
Vertex AI Search
Videodb
You
Schema
Schema
选择器
选择器
Notdiamond
稀疏嵌入
稀疏嵌入
Fastembed
存储
存储
聊天存储
聊天存储
Azure
Azure CosmosDB Mongo vCore
Azure CosmosDB NoSQL
DynamoDB
Gel
Mongo
Postgres
Redis
简单
SQLite
Tablestore
Upstash
文档存储
文档存储
Azure
Azure CosmosDB NoSQL
Couchbase
DynamoDB
Elasticsearch
Firestore
Gel
MongoDB
Postgres
Redis
简单
Tablestore
图存储
图存储
FalkorDB
Kuzu
Memgraph
Nebula
Neo4j
Neptune
简单
TiDB
索引存储
索引存储
Azure
Azure CosmosDB NoSQL
Couchbase
DynamoDB
Elasticsearch
Firestore
Gel
MongoDB
Postgres
Redis
简单
Tablestore
Kvstore
Kvstore
Azure
Azure CosmosDB NoSQL
Couchbase
DynamoDB
Elasticsearch
Firestore
Gel
MongoDB
Postgres
Redis
S3
简单
Tablestore
存储
存储
存储上下文
向量存储
向量存储
ApertureDB
阿里云 OpenSearch
Analyticdb
Astra DB
Awadb
Awsdocdb
Azure AI Search
Azurecosmosmongo
Azure CosmosDB NoSQL
Bagel
百度向量数据库
Cassandra
无
Chroma
ClickHouse
Couchbase
DashVector
Databricks
DeepLake
Docarray
DuckDB
DynamoDB
Elasticsearch
Epsilla
Faiss
Firestore
Gel
Google
Hologres
Jaguar
Kdbai
Lancedb
Lantern
Lindorm
MariaDB
无
Milvus
MongoDB
Neo4j Vector
Neptune
Nile
Objectbox
OceanBase
OpenSearch
Oracledb
Pgvecto rs
Pinecone
Postgres
Qdrant
Redis
Relyt
Rocksetdb
简单
SingleStoreDB
无
Supabase
Tablestore
Tair
腾讯向量数据库
TiDB Vector
Timescale Vector
txtai
Typesense
Upstash
Vearch
Vertex AI Vector Search
Vespa
Weaviate
WordLift
Zep
工具
工具
Agentql
ArXiv
Azure 代码解释器
Azure CV
Azure 语音
Azure 翻译
Bing 搜索
Box
Brave 搜索
Cassandra
ChatGPT 插件
代码解释器
Cogniswitch
Dappier
数据库
无
DuckDuckGo
Eleven Labs
Exa
金融
函数
Google
GraphQL
Ionic 购物
Jina
Jira
Linkup 研究
加载和搜索
Mcp
Metaphor
Multion
Neo4j
Notion
按需加载器
OpenAI
OpenAPI
无
Playgrounds
Playwright
Python 文件
查询引擎
查询计划
请求
检索器
Salesforce
Scrapegraph
Shopify
Slack
Tavily 研究
文本转图片
工具规范
Valyu
Vectara 查询
向量数据库
Waii
天气
维基百科
Wolfram Alpha
Yahoo 金融
Yelp
Zapier
工作流
工作流
装饰器
上下文
事件
重试策略
工作流
开源社区
开源社区
集成
全栈项目
社区常见问题
社区常见问题
聊天引擎
文档和节点
嵌入
大型语言模型
查询引擎
向量数据库
贡献
贡献
代码
文档
更新日志
演示文稿
弃用术语
LlamaCloud
LlamaCloud
LlamaParse
支持模块
#
查询转换
回到顶部