句子窗口
节点解析器.
SentenceWindowNodeParser #
基类: NodeParser
句子窗口节点解析器。
将文档分割成节点,每个节点是一个句子。每个节点在其元数据中包含来自周围句子的一个“窗口”。
参数
名称 | 类型 | 描述 | 默认值 |
---|---|---|---|
sentence_splitter
|
可选[可调用对象]
|
将文本分割成句子 |
<function split_by_sentence_tokenizer.<locals>.<lambda> at 0x7e52a45ebf60>
|
include_metadata
|
bool
|
是否在节点中包含元数据 |
必需的 |
include_prev_next_rel
|
bool
|
是否包含前后节点关系 |
必需的 |
window_size
|
int
|
捕获句子两侧的句子数量。 |
3
|
window_metadata_key
|
str
|
存储句子窗口的元数据键。 |
'window'
|
original_text_metadata_key
|
str
|
存储原始句子的元数据键。 |
'original_text'
|
源代码位于 llama-index-core/llama_index/core/node_parser/text/sentence_window.py
21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 |
|
build_window_nodes_from_documents #
从文档构建窗口节点。
源代码位于 llama-index-core/llama_index/core/node_parser/text/sentence_window.py
103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 |
|