Apify
ApifyActor #
基类: BaseReader
Apify Actor 阅读器。调用 Apify 平台上的一个 Actor,等待其完成,并读取其结果数据集。
参数
名称 | 类型 | 描述 | 默认值 |
---|---|---|---|
apify_api_token
|
str
|
Apify API token。 |
必需 |
源代码位于 llama-index-integrations/readers/llama-index-readers-apify/llama_index/readers/apify/actor/base.py
10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 |
|
load_data #
load_data(actor_id: str, run_input: Dict, dataset_mapping_function: Callable[[Dict], Document], *, build: Optional[str] = None, memory_mbytes: Optional[int] = None, timeout_secs: Optional[int] = None) -> List[Document]
调用 Apify 平台上的 Actor,等待其完成,并返回其结果数据集。
参数
名称 | 类型 | 描述 | 默认值 |
---|---|---|---|
actor_id
|
str
|
Actor 的 ID 或名称。 |
必需 |
run_input
|
Dict
|
您正在尝试运行的 Actor 的输入对象。 |
必需 |
dataset_mapping_function
|
Callable
|
一个函数,接受一个字典(一个 Apify 数据集项)并将其转换为 Document 类的一个实例。 |
必需 |
build
|
str
|
可选地指定要运行的 Actor 构建。它可以是构建标签或构建编号。 |
无
|
memory_mbytes
|
int
|
运行时的可选内存限制,以兆字节为单位。 |
无
|
timeout_secs
|
int
|
运行时的可选超时,以秒为单位。 |
无
|
返回
类型 | 描述 |
---|---|
List[Document]
|
List[Document]: 文档列表。 |
源代码位于 llama-index-integrations/readers/llama-index-readers-apify/llama_index/readers/apify/actor/base.py
33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 |
|
ApifyDataset #
基类: BaseReader
Apify 数据集读取器。读取 Apify 平台上的数据集。
参数
名称 | 类型 | 描述 | 默认值 |
---|---|---|---|
apify_api_token
|
str
|
Apify API token。 |
必需 |
源代码位于 llama-index-integrations/readers/llama-index-readers-apify/llama_index/readers/apify/dataset/base.py
8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 |
|
load_data #
从 Apify 数据集加载数据。
参数
名称 | 类型 | 描述 | 默认值 |
---|---|---|---|
dataset_id
|
str
|
数据集 ID。 |
必需 |
dataset_mapping_function
|
Callable[[Dict], Document]
|
将数据集项映射到 Document 的函数。 |
必需 |
返回
类型 | 描述 |
---|---|
List[Document]
|
List[Document]: 文档列表。 |
源代码位于 llama-index-integrations/readers/llama-index-readers-apify/llama_index/readers/apify/dataset/base.py
30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 |
|