发布源码 | 软件分类 | 最近更新 | 下载推荐 | 下载排行 | 会员中心 hao下载 - 中国最大的站长类资源下载网站

您的位置: 首页 > 源码下载 > MinerU

MinerU v2.5.4

授权方式:开源软件 更新时间:2025-10-03
软件分类:开发工具 文件大小:6.88 MB
开发语言:Python 推荐等级:
数  据  库:未知
运行环境:未知
软件作者:暂无 下载人气:
相关链接:相关链接 [报错]   [收藏]   [下载地址]
      
MinerU v2.5.4
软件介绍
下载地址

  MinerU是一款将PDF转化为机器可读格式的工具(如markdown、json),可以很方便地抽取为任意格式。

  主要功能:

  1、删除页眉、页脚、脚注、页码等元素,确保语义连贯

  2、输出符合人类阅读顺序的文本,适用于单栏、多栏及复杂排版

  3、保留原文档的结构,包括标题、段落、列表等

  4、提取图像、图片描述、表格、表格标题及脚注

  5、自动识别并转换文档中的公式为LaTeX格式

  6、自动识别并转换文档中的表格为HTML格式

  7、自动检测扫描版PDF和乱码PDF,并启用OCR功能

  8、OCR支持84种语言的检测与识别

  9、支持多种输出格式,如多模态与NLP的Markdown、按阅读顺序排序的10、JSON、含有丰富信息的中间格式等

  11、支持多种可视化结果,包括layout可视化、span可视化等,便于高效确认输出效果与质检

  12、支持纯CPU环境运行,并支持 GPU(CUDA)/NPU(CANN)/MPS 加速

  13、兼容Windows、Linux和Mac平台

已累计被下载

发表评论  网友评论
微信
客服
微信客服二维码

扫码添加微信客服