跳到内容

使用 TruLens 进行评估和跟踪#

本页介绍如何使用 TruLens 评估和跟踪基于 Llama-Index 构建的 LLM 应用。

TruLens 是什么?#

TruLens 是一个开源软件包,为基于大型语言模型 (LLM) 的应用提供 Instrumentation 和评估工具。这包括对相关性、情感等方面的反馈函数评估,以及深入的跟踪(包括成本和延迟)。

TruLens Architecture

当您迭代 LLM 应用的新版本时,您可以比较它们在所有不同质量指标上的性能。您还可以按记录级别查看评估,并探索每条记录的应用元数据。

安装和设置#

添加 TruLens 很简单,只需从 pypi 安装即可!

pip install trulens-eval
from trulens_eval import TruLlama

试试看!#

llama_index_quickstart.ipynb

Open In Colab

阅读更多#