使用 TruLens 进行评估和跟踪#
本页介绍如何使用 TruLens 评估和跟踪基于 Llama-Index 构建的 LLM 应用。
TruLens 是什么?#
TruLens 是一个开源软件包,为基于大型语言模型 (LLM) 的应用提供 Instrumentation 和评估工具。这包括对相关性、情感等方面的反馈函数评估,以及深入的跟踪(包括成本和延迟)。
当您迭代 LLM 应用的新版本时,您可以比较它们在所有不同质量指标上的性能。您还可以按记录级别查看评估,并探索每条记录的应用元数据。
安装和设置#
添加 TruLens 很简单,只需从 pypi 安装即可!
pip install trulens-eval
from trulens_eval import TruLlama