跳到内容

结构化数据提取#

LLMs 能够摄取大量非结构化数据并将其以结构化格式返回,而 LlamaIndex 的设置使得这变得简单。

使用 LlamaIndex,您可以让 LLM 读取自然语言并识别具有重要语义的细节,例如姓名、日期、地址和数字,并无论源格式如何,都以一致的结构化格式返回这些细节。

当您有非结构化源材料,例如聊天记录和对话转录时,这尤其有用。

一旦您拥有结构化数据,就可以将其发送到数据库,或者在代码中解析结构化输出以自动化工作流程。

完整教程#

我们的学习部分包含一个关于结构化数据提取的完整教程。我们建议从那里开始。

还有一个示例笔记本,展示了教程中的一些技巧。

有关使用 LlamaIndex 进行结构化数据提取的更全面概述,包括较低层级的模块,请查阅以下指南

我们还提供多模态结构化数据提取。查看详情

杂项示例#

一些突出用例的额外示例