跳到内容

LlamaHub#

我们的数据连接器通过 LlamaHub 🦙 提供。LlamaHub 包含一个开源数据连接器注册表,您可以轻松将其插入任何 LlamaIndex 应用(+ 代理工具和 Llama Pack)。

使用模式#

开始使用

from llama_index.core import download_loader

from llama_index.readers.google import GoogleDocsReader

loader = GoogleDocsReader()
documents = loader.load_data(document_ids=[...])

内置连接器:SimpleDirectoryReader#

SimpleDirectoryReader。支持解析多种文件类型,包括 .md, .pdf, .jpg, .png, .docx,以及音频和视频类型。它直接作为 LlamaIndex 的一部分提供。

from llama_index.core import SimpleDirectoryReader

documents = SimpleDirectoryReader("./data").load_data()

可用连接器#

直接浏览 LlamaHub 查看数百种可用连接器,包括:

  • Notion (NotionPageReader)
  • Google Docs (GoogleDocsReader)
  • Slack (SlackReader)
  • Discord (DiscordReader)
  • Apify Actors (ApifyActor)。可以抓取网页、刮取网页、提取文本内容、下载文件,包括 .pdf, .jpg, .png, .docx 等。