上海人工智能实验室开源的PDF文档提取工具:MinerU。这是一款将PDF转化为机器可读格式的工具(如markdown、json),可以很方便地抽取为任意格式。
项目地址:github.com/opendatalab/MinerU/
“ MinerU诞生于书生-浦语的预训练过程中,我们将会集中精力解决科技文献中的符号转化问题,希望在大模型时代为科技发展做出贡献。 ”
Prev Chapter:SK电信与Rebellions合并:打造价值7.4亿美元AI芯片巨头 挑战英伟达
Next Chapter:第一批AI原住民开始变现:9岁小学生,用大模型写书赚2万