检索
评估模块。
BaseRetrievalEvaluator #
基类:BaseModel
基础检索评估器类。
参数
名称 | 类型 | 描述 | 默认值 |
---|---|---|---|
metrics
|
List[BaseRetrievalMetric]
|
要评估的指标列表 |
必需 |
源代码位于 llama-index-core/llama_index/core/evaluation/retrieval/base.py
77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 |
|
from_metric_names classmethod
#
from_metric_names(metric_names: List[str], **kwargs: Any) -> BaseRetrievalEvaluator
从指标名称创建评估器。
参数
名称 | 类型 | 描述 | 默认值 |
---|---|---|---|
metric_names
|
List[str]
|
指标名称列表 |
必需 |
**kwargs
|
Any
|
评估器的附加参数 |
{}
|
源代码位于 llama-index-core/llama_index/core/evaluation/retrieval/base.py
85 86 87 88 89 90 91 92 93 94 95 96 97 98 |
|
evaluate #
evaluate(query: str, expected_ids: List[str], expected_texts: Optional[List[str]] = None, mode: RetrievalEvalMode = TEXT, **kwargs: Any) -> RetrievalEvalResult
使用查询字符串和预期 ID 运行评估结果。
参数
名称 | 类型 | 描述 | 默认值 |
---|---|---|---|
query
|
str
|
查询字符串 |
必需 |
expected_ids
|
List[str]
|
预期 ID |
必需 |
返回
名称 | 类型 | 描述 |
---|---|---|
默认值 |
默认值
|
评估结果 |
源代码位于 llama-index-core/llama_index/core/evaluation/retrieval/base.py
107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 |
|
aevaluate async
#
aevaluate(query: str, expected_ids: List[str], expected_texts: Optional[List[str]] = None, mode: RetrievalEvalMode = TEXT, **kwargs: Any) -> RetrievalEvalResult
使用查询字符串、检索到的上下文和生成的响应字符串运行评估。
子类可以覆盖此方法以提供自定义评估逻辑并接受附加参数。
源代码位于 llama-index-core/llama_index/core/evaluation/retrieval/base.py
137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 |
|
aevaluate_dataset async
#
aevaluate_dataset(dataset: EmbeddingQAFinetuneDataset, workers: int = 2, show_progress: bool = False, **kwargs: Any) -> List[RetrievalEvalResult]
使用数据集运行评估。
源代码位于 llama-index-core/llama_index/core/evaluation/retrieval/base.py
172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 |
|
RetrieverEvaluator #
检索器评估器。
此模块将使用一组指标评估检索器。
参数
名称 | 类型 | 描述 | 默认值 |
---|---|---|---|
metrics
|
List[BaseRetrievalMetric]
|
要评估的指标序列 |
必需 |
retriever
|
BaseRetriever
|
要评估的检索器。 |
必需 |
node_postprocessors
|
Optional[List[BaseNodePostprocessor]]
|
在检索后应用的后处理器。 |
工作流运行检查点
|
源代码位于 llama-index-core/llama_index/core/evaluation/retrieval/evaluator.py
16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 |
|
RetrievalEvalResult #
基类:BaseModel
检索评估结果。
注意:此抽象未来可能会更改。
参数
名称 | 类型 | 描述 | 默认值 |
---|---|---|---|
query
|
str
|
查询字符串 |
必需 |
expected_ids
|
List[str]
|
预期 ID |
必需 |
expected_texts
|
List[str] | None
|
与 |
工作流运行检查点
|
retrieved_ids
|
List[str]
|
检索到的 ID |
必需 |
retrieved_texts
|
List[str]
|
检索到的文本 |
必需 |
mode
|
RetrievalEvalMode
|
文本或图像 |
<RetrievalEvalMode.TEXT: 'text'>
|
metric_dict
|
Dict[str, RetrievalMetricResult]
|
评估的指标字典 |
必需 |
属性
名称 | 类型 | 描述 |
---|---|---|
query |
str
|
查询字符串 |
expected_ids |
List[str]
|
预期 ID |
retrieved_ids |
List[str]
|
检索到的 ID |
metric_dict |
Dict[str, BaseRetrievalMetric]
|
评估的指标字典 |
源代码位于 llama-index-core/llama_index/core/evaluation/retrieval/base.py
36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 |
|