• 允许你分析和注释文档,并与其他人分享
• genAI 原生的,在查询端和数据提取端都使用 LLM + Llama Index。
• 查询端集成LLM让您可以回答数百个文档的问题。
• 数据提取端集成LLM让你可以对所有文档进行结构化提取,除了人工标记的注释之外,还可以添加其他注释
项目:github.com/JSv4/OpenContracts
主要功能:
• 管理文档,管理文档集合 ( Corpuses)
• 布局解析器,自动从 PDF 中提取布局特征
• 自动矢量嵌入,为上传的 PDF 和提取的布局块生成
可插入式微服务分析器架构,分析文档并自动注释
• 人工注释界面,用于手动注释文档,包括多页注释
• LlamaIndex 集成- 使用我们的向量存储(由 pgvector 提供支持)和任何手动或自动注释的功能,让 LLM 智能地回答问题。
• 数据提取,使用复杂的 LLM 查询行为对数百个文档提出多个问题。我们的示例实现使用 LlamaIndex + Marvin。
• 自定义数据提取,可以在前端使用自定义数据提取管道批量查询文档。
Prev Chapter:AI大神Karpathy官宣创业,打造80亿人AI原生学校!首款课程GitHub斩获17k星
Next Chapter:生成式AI可能迎来下一个风口:TTT模型