LlamaHub#
我们的数据连接器通过 LlamaHub 🦙 提供。LlamaHub 包含一个开源数据连接器注册表,您可以轻松将其插入任何 LlamaIndex 应用(+ 代理工具和 Llama Pack)。
使用模式#
开始使用
from llama_index.core import download_loader
from llama_index.readers.google import GoogleDocsReader
loader = GoogleDocsReader()
documents = loader.load_data(document_ids=[...])
内置连接器:SimpleDirectoryReader#
SimpleDirectoryReader
。支持解析多种文件类型,包括 .md
, .pdf
, .jpg
, .png
, .docx
,以及音频和视频类型。它直接作为 LlamaIndex 的一部分提供。
from llama_index.core import SimpleDirectoryReader
documents = SimpleDirectoryReader("./data").load_data()
可用连接器#
直接浏览 LlamaHub 查看数百种可用连接器,包括:
- Notion (
NotionPageReader
) - Google Docs (
GoogleDocsReader
) - Slack (
SlackReader
) - Discord (
DiscordReader
) - Apify Actors (
ApifyActor
)。可以抓取网页、刮取网页、提取文本内容、下载文件,包括.pdf
,.jpg
,.png
,.docx
等。