跳到内容

构建 LLM 应用#

欢迎阅读《理解 LlamaIndex》。这是一系列关于构建智能体式 LLM 应用各个阶段的简短教程,旨在让您熟悉如何使用 LlamaIndex,然后再深入学习更高级和细微的策略。如果您是一位有经验但刚接触 LlamaIndex 的程序员,这里是您的起点。

构建智能体式 LLM 应用的关键步骤#

提示

如果您对这些术语不熟悉,建议您阅读我们的高层概念

本教程包含三个主要部分:构建 RAG 管道构建代理构建工作流,前后还包含一些较小的章节。以下是您将学到的内容:

  • 使用 LLM:立即开始使用 LLM。我们将向您展示如何使用我们支持的几十种 LLM,无论是通过远程 API 调用还是在本地机器上运行。

  • 构建代理:代理是基于 LLM 的知识工作者,可以通过一组工具与世界互动。这些工具可以检索信息(例如 RAG,见下文)或采取行动。本教程包括:

    • 构建单个代理:我们将向您展示如何构建一个可以通过一组工具与世界互动的简单代理。

    • 使用现有工具:LlamaIndex 在 LlamaHub 上提供了一个预构建代理工具注册表,您可以将其整合到您的代理中。

    • 维护状态:代理可以维护状态,这对于构建更复杂的应用非常重要。

    • 流式输出和事件:向用户提供可见性和反馈非常重要,流式传输可以实现这一点。

    • 人在回路中:获取人类对您代理的反馈至关重要。

    • 使用 AgentWorkflow 构建多代理系统:组合多个代理进行协作是构建更复杂系统的强大技术;本节向您展示如何做到这一点。

  • 工作流:工作流是构建智能体式应用的低层、事件驱动抽象。它们是构建任何高级智能体式应用时应使用的基础层。您可以使用上面学到的预构建抽象,也可以从头开始构建代理。本教程涵盖:

    • 构建简单工作流:一个简单的工作流,向您展示如何使用 Workflow 类构建基本的智能体式应用。

    • 工作流可视化:工作流可以可视化为图,帮助您理解应用中的控制流。

    • 循环和分支:这些核心控制流模式是构建更复杂工作流的基石。

    • 并发执行:您可以并行运行步骤,以高效地分配工作。

    • 流式事件:您的代理可以像您上面构建的代理一样发出面向用户的事件。

    • 从头构建多代理系统:您可以使用上面学到的技术从头开始构建多代理系统。

  • 为您的代理添加 RAG:检索增强生成 (RAG) 是将您的数据输入 LLM 的关键技术,也是更复杂智能体系统的一个组成部分。我们将向您展示如何使用功能齐全的 RAG 管道增强您的代理,该管道可以回答有关您数据的问题。这包括:

    • 加载与摄取:从数据所在之处获取数据,无论是无结构文本、PDF、数据库还是其他应用的 API。LlamaIndex 在 LlamaHub 上提供了数百个连接器,可连接到各种数据源。

    • 索引与嵌入:一旦您获取了数据,就有无数种方法来构建数据访问方式,以确保您的应用始终处理最相关的数据。LlamaIndex 内置了大量这些策略,可以帮助您选择最佳方案。

    • 存储:您可能会发现,将数据以索引形式或由 LLM 提供的预处理摘要形式存储效率更高,通常存储在一种称为 向量存储 的专用数据库中(见下文)。您还可以存储索引、元数据等。

    • 查询:每种索引策略都有相应的查询策略,并且有许多方法可以提高您检索的内容以及 LLM 在返回给您之前对其处理的相关性、速度和准确性,包括将其转换为结构化响应,例如 API。

  • 整合所有内容:无论您是构建问答系统、聊天机器人、API 还是自主代理,我们都将向您展示如何将您的应用投入生产。

  • 追踪与调试:也称为可观测性,对于 LLM 应用来说,能够查看其内部运行情况尤为重要,这有助于您调试问题并找到改进之处。

  • 评估:每种策略都有其优缺点,构建、发布和迭代您的应用的关键部分在于评估您的更改是否在准确性、性能、清晰度、成本等方面改进了您的应用。可靠地评估您的更改是 LLM 应用开发的关键部分。

开始吧!#

准备好深入了解了吗?前往使用 LLM