OpenContracts:完全开源的、基于LlamaIndex、Pgvector、React和Django的海量文档分析平台_tiknovel-最新最全的nft,web3,AI技术资讯技术社区

OpenContracts:完全开源的、基于LlamaIndex、Pgvector、React和Django的海量文档分析平台

2024-07-17 16:04:14  浏览:303  作者:管理员
OpenContracts:完全开源的、基于LlamaIndex、Pgvector、React和Django的海量文档分析平台

• 允许你分析和注释文档,并与其他人分享
• genAI 原生的,在查询端和数据提取端都使用 LLM + Llama Index。
• 查询端集成LLM让您可以回答数百个文档的问题。
• 数据提取端集成LLM让你可以对所有文档进行结构化提取,除了人工标记的注释之外,还可以添加其他注释

项目:github.com/JSv4/OpenContracts

主要功能:
• 管理文档,管理文档集合 ( Corpuses)
• 布局解析器,自动从 PDF 中提取布局特征
• 自动矢量嵌入,为上传的 PDF 和提取的布局块生成
可插入式微服务分析器架构,分析文档并自动注释
• 人工注释界面,用于手动注释文档,包括多页注释
• LlamaIndex 集成- 使用我们的向量存储(由 pgvector 提供支持)和任何手动或自动注释的功能,让 LLM 智能地回答问题。
• 数据提取,使用复杂的 LLM 查询行为对数百个文档提出多个问题。我们的示例实现使用 LlamaIndex + Marvin。
• 自定义数据提取,可以在前端使用自定义数据提取管道批量查询文档。

评论区

共 0 条评论
  • 这篇文章还没有收到评论,赶紧来抢沙发吧~

【随机内容】

返回顶部