Json
JSONReader #
继承自: BaseReader
JSON 读取器。
读取 JSON 文档,并提供选项以帮助我们处理节点之间的关系。
参数
名称 | 类型 | 描述 | 默认值 |
---|---|---|---|
levels_back
|
int
|
在 JSON 树中回溯的层数,如果需要所有层,则为 0。如果 levels_back 为 None,则我们只格式化 JSON,并将每一行作为一个嵌入。 |
无
|
collapse_length
|
int
|
在输出中折叠 JSON 片段的最大字符数(levels_back 不能为 None)。例如:如果 collapse_length = 10,输入为 {a: [1, 2, 3], b: {"hello": "world", "foo": "bar"}},那么 a 将被折叠成一行,而 b 不会。建议从 100 左右开始调整。 |
无
|
is_jsonl
|
Optional[bool]
|
如果为 True,表示文件为 JSONL 格式。 |
False
|
clean_json
|
Optional[bool]
|
如果为 True,则移除只包含 JSON 结构体的行。 |
True
|
源代码位于 llama-index-integrations/readers/llama-index-readers-json/llama_index/readers/json/base.py
52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 |
|
load_data #
load_data(input_file: str, extra_info: Optional[Dict] = {}) -> List[Document]
从输入文件加载数据。
源代码位于 llama-index-integrations/readers/llama-index-readers-json/llama_index/readers/json/base.py
96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 |
|