结构化数据提取#
LLMs 能够摄取大量非结构化数据并将其以结构化格式返回,而 LlamaIndex 的设置使得这变得简单。
使用 LlamaIndex,您可以让 LLM 读取自然语言并识别具有重要语义的细节,例如姓名、日期、地址和数字,并无论源格式如何,都以一致的结构化格式返回这些细节。
当您有非结构化源材料,例如聊天记录和对话转录时,这尤其有用。
一旦您拥有结构化数据,就可以将其发送到数据库,或者在代码中解析结构化输出以自动化工作流程。
完整教程#
我们的学习部分包含一个关于结构化数据提取的完整教程。我们建议从那里开始。
还有一个示例笔记本,展示了教程中的一些技巧。
其他指南#
有关使用 LlamaIndex 进行结构化数据提取的更全面概述,包括较低层级的模块,请查阅以下指南
我们还提供多模态结构化数据提取。查看详情。
杂项示例#
一些突出用例的额外示例