Steamship
SteamshipFileReader #
基类: BaseReader
读取持久化的 Steamship 文件并将其转换为 Documents。
参数
名称 | 类型 | 描述 | 默认值 |
---|---|---|---|
api_key
|
可选[字符串]
|
Steamship API 密钥。如果未提供,默认为 STEAMSHIP_API_KEY 环境变量的值。 |
无
|
注意
需要安装 steamship
包和有效的 Steamship API 密钥。要获取 Steamship API 密钥,请访问:https://steamship.com/account/api。获取 API 密钥后,可以通过名为 STEAMSHIP_API_KEY
的环境变量公开它,或者将其作为 init 参数 (`api_key`) 传递。
源代码位于 llama-index-integrations/readers/llama-index-readers-steamship/llama_index/readers/steamship/base.py
8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 |
|
load_data #
load_data(workspace: str, query: Optional[str] = None, file_handles: Optional[List[str]] = None, collapse_blocks: bool = True, join_str: str = '\n\n') -> List[Document]
从持久化的 Steamship 文件加载数据到 Documents。
参数
名称 | 类型 | 描述 | 默认值 |
---|---|---|---|
workspace
|
字符串
|
Steamship workspace 的 handle(参见:https://docs.steamship.com/workspaces/index.html) |
必需 |
query
|
可选[字符串]
|
用于检索文件的 Steamship tag query(例如:'filetag and value("import-id")="import-001"') |
无
|
file_handles
|
可选[列表[字符串]]
|
Steamship 文件 handles 列表(例如: |
无
|
collapse_blocks
|
布尔值
|
是否将单个 File Blocks 合并到一个 Document 中,或者分开它们。 |
True
|
join_str
|
字符串
|
当 collapse_blocks 为 True 时,这是块文本的连接方式。 |
'\n\n'
|
注意
来自 query
和 file_handles
的文件集合将被合并。目前不支持消除集合之间的冲突(这意味着如果一个文件同时出现在查询结果集和 file_handles 中,它将被加载两次)。
源代码位于 llama-index-integrations/readers/llama-index-readers-steamship/llama_index/readers/steamship/base.py
35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 |
|