Tonic Validate
基类: BaseEvaluator
Tonic Validate 的回答一致性二元指标。
输出分数是一个浮点数,为 0.0 或 1.0。
更多详情请参阅 https://docs.tonic.ai/validate/。
参数
名称
类型 | 描述 | 默认值 | openai_service(OpenAIService) |
---|---|---|---|
要使用的 OpenAI 服务。指定用作 LLM 评估器的聊天补全模型。默认为 "gpt-4"。
|
必需 |
源代码位于 llama-index-integrations/evaluation/llama-index-evaluation-tonic-validate/llama_index/evaluation/tonic_validate/answer_consistency_binary.py
|
AnswerConsistencyEvaluator #
12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 |
|
Tonic Validate 的回答一致性指标。
Tonic Validate 的回答一致性二元指标。
输出分数是一个介于 0.0 和 1.0 之间的浮点数。
源代码位于 llama-index-integrations/evaluation/llama-index-evaluation-tonic-validate/llama_index/evaluation/tonic_validate/answer_consistency.py
参数
名称
类型 | 描述 | 默认值 | openai_service(OpenAIService) |
---|---|---|---|
要使用的 OpenAI 服务。指定用作 LLM 评估器的聊天补全模型。默认为 "gpt-4"。
|
必需 |
源代码位于 llama-index-integrations/evaluation/llama-index-evaluation-tonic-validate/llama_index/evaluation/tonic_validate/answer_consistency_binary.py
|
AnswerSimilarityEvaluator #
12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 |
|
Tonic Validate 的回答相似度指标。
Tonic Validate 的回答一致性二元指标。
输出分数是一个介于 0.0 和 5.0 之间的浮点数。
源代码位于 llama-index-integrations/evaluation/llama-index-evaluation-tonic-validate/llama_index/evaluation/tonic_validate/answer_similarity.py
参数
名称
类型 | 描述 | 默认值 | openai_service(OpenAIService) |
---|---|---|---|
要使用的 OpenAI 服务。指定用作 LLM 评估器的聊天补全模型。默认为 "gpt-4"。
|
必需 |
源代码位于 llama-index-integrations/evaluation/llama-index-evaluation-tonic-validate/llama_index/evaluation/tonic_validate/answer_consistency_binary.py
|
AugmentationAccuracyEvaluator #
12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 |
|
Tonic Validate 的增强准确度指标。
Tonic Validate 的回答一致性二元指标。
源代码位于 llama-index-integrations/evaluation/llama-index-evaluation-tonic-validate/llama_index/evaluation/tonic_validate/augmentation_accuracy.py
源代码位于 llama-index-integrations/evaluation/llama-index-evaluation-tonic-validate/llama_index/evaluation/tonic_validate/answer_consistency.py
参数
名称
类型 | 描述 | 默认值 | openai_service(OpenAIService) |
---|---|---|---|
要使用的 OpenAI 服务。指定用作 LLM 评估器的聊天补全模型。默认为 "gpt-4"。
|
必需 |
源代码位于 llama-index-integrations/evaluation/llama-index-evaluation-tonic-validate/llama_index/evaluation/tonic_validate/answer_consistency_binary.py
|
AugmentationPrecisionEvaluator #
12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 |
|
Tonic Validate 的增强精度指标。
Tonic Validate 的回答一致性二元指标。
源代码位于 llama-index-integrations/evaluation/llama-index-evaluation-tonic-validate/llama_index/evaluation/tonic_validate/augmentation_precision.py
源代码位于 llama-index-integrations/evaluation/llama-index-evaluation-tonic-validate/llama_index/evaluation/tonic_validate/answer_consistency.py
参数
名称
类型 | 描述 | 默认值 | openai_service(OpenAIService) |
---|---|---|---|
要使用的 OpenAI 服务。指定用作 LLM 评估器的聊天补全模型。默认为 "gpt-4"。
|
必需 |
源代码位于 llama-index-integrations/evaluation/llama-index-evaluation-tonic-validate/llama_index/evaluation/tonic_validate/answer_consistency_binary.py
|
RetrievalPrecisionEvaluator #
12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 |
|
Tonic Validate 的检索精度指标。
Tonic Validate 的回答一致性二元指标。
源代码位于 llama-index-integrations/evaluation/llama-index-evaluation-tonic-validate/llama_index/evaluation/tonic_validate/retrieval_precision.py
源代码位于 llama-index-integrations/evaluation/llama-index-evaluation-tonic-validate/llama_index/evaluation/tonic_validate/answer_consistency.py
参数
名称
类型 | 描述 | 默认值 | openai_service(OpenAIService) |
---|---|---|---|
要使用的 OpenAI 服务。指定用作 LLM 评估器的聊天补全模型。默认为 "gpt-4"。
|
必需 |
源代码位于 llama-index-integrations/evaluation/llama-index-evaluation-tonic-validate/llama_index/evaluation/tonic_validate/answer_consistency_binary.py
|
TonicValidateEvaluator #
12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 |
|
Tonic Validate 的验证评分器。计算 Tonic Validate 的所有指标。
Tonic Validate 的回答一致性二元指标。
要使用的指标。默认为 Tonic Validate 的所有指标。
参数
名称
类型 | 描述 | 默认值 | openai_service(OpenAIService) |
---|---|---|---|
metrics(List[Metric])
|
The metrics to use. Defaults to all of Tonic Validate's metrics. |
源代码位于 llama-index-integrations/evaluation/llama-index-evaluation-tonic-validate/llama_index/evaluation/tonic_validate/answer_consistency_binary.py
|
|
model_evaluator(str)
|
必需 |
源代码位于 llama-index-integrations/evaluation/llama-index-evaluation-tonic-validate/llama_index/evaluation/tonic_validate/answer_consistency_binary.py
|
源代码位于 llama-index-integrations/evaluation/llama-index-evaluation-tonic-validate/llama_index/evaluation/tonic_validate/tonic_validate_evaluator.py
30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 |
|
aevaluate_run async
#
aevaluate_run(queries: List[str], responses: List[str], contexts_list: List[List[str]], reference_responses: List[str], **kwargs: Any) -> Any
评估一批响应。
返回一个 Tonic Validate Run 对象,该对象可以记录到 Tonic Validate UI。更多详情请参阅 https://docs.tonic.ai/validate/。
源代码位于 llama-index-integrations/evaluation/llama-index-evaluation-tonic-validate/llama_index/evaluation/tonic_validate/tonic_validate_evaluator.py
108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 |
|
evaluate_run #
evaluate_run(queries: List[str], responses: List[str], contexts_list: List[List[str]], reference_responses: List[str], **kwargs: Any) -> Any
评估一批响应。
返回一个 Tonic Validate Run 对象,该对象可以记录到 Tonic Validate UI。更多详情请参阅 https://docs.tonic.ai/validate/。
源代码位于 llama-index-integrations/evaluation/llama-index-evaluation-tonic-validate/llama_index/evaluation/tonic_validate/tonic_validate_evaluator.py
142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 |
|