构建 LLM 应用#
欢迎阅读《理解 LlamaIndex》。这是一系列关于构建智能体式 LLM 应用各个阶段的简短教程,旨在让您熟悉如何使用 LlamaIndex,然后再深入学习更高级和细微的策略。如果您是一位有经验但刚接触 LlamaIndex 的程序员,这里是您的起点。
构建智能体式 LLM 应用的关键步骤#
提示
如果您对这些术语不熟悉,建议您阅读我们的高层概念。
本教程包含三个主要部分:构建 RAG 管道、构建代理和构建工作流,前后还包含一些较小的章节。以下是您将学到的内容:
-
使用 LLM:立即开始使用 LLM。我们将向您展示如何使用我们支持的几十种 LLM,无论是通过远程 API 调用还是在本地机器上运行。
-
构建代理:代理是基于 LLM 的知识工作者,可以通过一组工具与世界互动。这些工具可以检索信息(例如 RAG,见下文)或采取行动。本教程包括:
-
工作流:工作流是构建智能体式应用的低层、事件驱动抽象。它们是构建任何高级智能体式应用时应使用的基础层。您可以使用上面学到的预构建抽象,也可以从头开始构建代理。本教程涵盖:
-
为您的代理添加 RAG:检索增强生成 (RAG) 是将您的数据输入 LLM 的关键技术,也是更复杂智能体系统的一个组成部分。我们将向您展示如何使用功能齐全的 RAG 管道增强您的代理,该管道可以回答有关您数据的问题。这包括:
-
加载与摄取:从数据所在之处获取数据,无论是无结构文本、PDF、数据库还是其他应用的 API。LlamaIndex 在 LlamaHub 上提供了数百个连接器,可连接到各种数据源。
-
索引与嵌入:一旦您获取了数据,就有无数种方法来构建数据访问方式,以确保您的应用始终处理最相关的数据。LlamaIndex 内置了大量这些策略,可以帮助您选择最佳方案。
-
存储:您可能会发现,将数据以索引形式或由 LLM 提供的预处理摘要形式存储效率更高,通常存储在一种称为
向量存储
的专用数据库中(见下文)。您还可以存储索引、元数据等。 -
查询:每种索引策略都有相应的查询策略,并且有许多方法可以提高您检索的内容以及 LLM 在返回给您之前对其处理的相关性、速度和准确性,包括将其转换为结构化响应,例如 API。
-
-
整合所有内容:无论您是构建问答系统、聊天机器人、API 还是自主代理,我们都将向您展示如何将您的应用投入生产。
-
追踪与调试:也称为可观测性,对于 LLM 应用来说,能够查看其内部运行情况尤为重要,这有助于您调试问题并找到改进之处。
-
评估:每种策略都有其优缺点,构建、发布和迭代您的应用的关键部分在于评估您的更改是否在准确性、性能、清晰度、成本等方面改进了您的应用。可靠地评估您的更改是 LLM 应用开发的关键部分。
开始吧!#
准备好深入了解了吗?前往使用 LLM。