递归检索器
EmbeddedTablesUnstructuredRetrieverPack #
嵌入式表格 + Unstructured.io 检索器包。
使用 unstructured.io 从 HTML 文档中解析出嵌入式表格,构建节点图,然后对该图运行我们的递归检索器。
注意:必须接收单个 HTML 文件。
源代码位于 llama-index-packs/llama-index-packs-recursive-retriever/llama_index/packs/recursive_retriever/embedded_tables_unstructured/base.py
16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 |
|
get_modules #
get_modules() -> Dict[str, Any]
获取模块。
源代码位于 llama-index-packs/llama-index-packs-recursive-retriever/llama_index/packs/recursive_retriever/embedded_tables_unstructured/base.py
59 60 61 62 63 64 65 |
|
run #
run(*args: Any, **kwargs: Any) -> Any
运行流水线。
源代码位于 llama-index-packs/llama-index-packs-recursive-retriever/llama_index/packs/recursive_retriever/embedded_tables_unstructured/base.py
67 68 69 |
|
RecursiveRetrieverSmallToBigPack #
小到大检索(使用递归检索器)。
给定输入文档和一组初始“父”块,将每个块进一步细分为“子”块。将每个子块链接到其父块,并索引子块。
源代码位于 llama-index-packs/llama-index-packs-recursive-retriever/llama_index/packs/recursive_retriever/small_to_big/base.py
15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 |
|
get_modules #
get_modules() -> Dict[str, Any]
获取模块。
源代码位于 llama-index-packs/llama-index-packs-recursive-retriever/llama_index/packs/recursive_retriever/small_to_big/base.py
76 77 78 79 80 81 82 83 |
|
run #
run(*args: Any, **kwargs: Any) -> Any
运行流水线。
源代码位于 llama-index-packs/llama-index-packs-recursive-retriever/llama_index/packs/recursive_retriever/small_to_big/base.py
85 86 87 |
|