跳转至

命令行工具使用说明

查看帮助信息

要查看 MinerU 命令行工具的帮助信息,可以使用 --help 参数。以下是各个命令行工具的帮助信息示例:

mineru --help
Usage: mineru [OPTIONS]

Options:
  -v, --version                   显示版本并退出
  -p, --path PATH                 输入文件路径或目录(必填)
  -o, --output PATH               输出目录(必填)
  --api-url TEXT                  MinerU FastAPI 服务地址;不传时自动拉起本地临时 mineru-api
  -m, --method [auto|txt|ocr]     解析方法:auto(默认)、txt、ocr(仅用于 pipeline  hybrid* 后端)
  -b, --backend [pipeline|hybrid-auto-engine|hybrid-http-client|vlm-auto-engine|vlm-http-client]
                                  解析后端(默认为 hybrid-auto-engine)
  -l, --lang [ch|ch_server|ch_lite|en|korean|japan|chinese_cht|ta|te|ka|th|el|latin|arabic|east_slavic|cyrillic|devanagari]
                                  指定文档语言(可提升 OCR 准确率,仅用于 pipeline  hybrid* 后端)
  -u, --url TEXT                  当使用 http-client 时,传给服务端后端的 OpenAI 兼容地址
  -s, --start INTEGER             开始解析的页码(从 0 开始)
  -e, --end INTEGER               结束解析的页码(从 0 开始)
  -f, --formula BOOLEAN           是否启用公式解析(默认开启)
  -t, --table BOOLEAN             是否启用表格解析(默认开启)
  --help                          显示帮助信息

Tip

mineru 当前支持本地 PDF、图片与 DOCX 文件或目录输入。

mineru-api --help
Usage: mineru-api [OPTIONS]

Options:
  --host TEXT     服务器主机地址(默认:127.0.0.1)
  --port INTEGER  服务器端口(默认:8000)
  --reload        启用自动重载(开发模式)
  --enable-vlm-preload BOOLEAN
                   mineru-api 启动阶段预加载本地 VLM 模型
  --help          显示此帮助信息并退出
mineru-gradio --help
Usage: mineru-gradio [OPTIONS]

Options:
  --enable-example BOOLEAN        启用示例文件输入(需要将示例文件放置在当前
                                  执行命令目录下的 `example` 文件夹中)
  --enable-http-client BOOLEAN    在后端选项中启用 HTTP 客户端选项
  --enable-api BOOLEAN            启用 Gradio API 以提供应用程序服务
  --max-convert-pages INTEGER     设置从 PDF 转换为 Markdown 的最大页数
  --server-name TEXT              设置 Gradio 应用程序的服务器主机名
  --server-port INTEGER           设置 Gradio 应用程序的服务器端口
  --api-url TEXT                  MinerU FastAPI 服务地址;不传时自动拉起可复用的本地
                                  mineru-api
  --enable-vlm-preload BOOLEAN     Gradio 拉起本地 mineru-api 时预加载本地
                                  VLM 模型
  --latex-delimiters-type [a|b|all]
                                  设置在 Markdown 渲染中使用的 LaTeX 分隔符类型
                                  ('a' 表示 '$' 类型,'b' 表示 '()[]' 类型,
                                  'all' 表示两种类型都使用)
  --help                          显示此帮助信息并退出
mineru-router --help
Usage: mineru-router [OPTIONS]

Options:
  --host TEXT             路由服务主机地址(默认:127.0.0.1)
  --port INTEGER          路由服务端口(默认:8002)
  --reload                启用自动重载(开发模式)
  --upstream-url TEXT     现有 MinerU FastAPI 服务地址;可重复传入多个
  --local-gpus TEXT       本地 GPU worker 配置:auto、none  0,1,2 形式
  --worker-host TEXT      路由托管 worker 的监听地址(默认:127.0.0.1)
  --enable-vlm-preload BOOLEAN
                           router 托管的本地 mineru-api worker 中预加载本地
                          VLM 模型
  --help                  显示此帮助信息并退出

环境变量说明

Note

从当前版本开始,mineru 是基于 mineru-api 的编排客户端: - 未传 --api-url 时,CLI 会自动拉起本地临时 mineru-api - 传入 --api-url 时,CLI 会直连该 FastAPI 服务 - --url 不再表示 MinerU API 地址,而是服务端 vlm/hybrid-http-client 所需的 OpenAI 兼容地址

MinerU命令行工具的某些参数存在相同功能的环境变量配置,通常环境变量配置的优先级高于命令行参数,且在所有命令行工具中都生效。 以下是常用的环境变量及其说明:

  • MINERU_TOOLS_CONFIG_JSON

    • 用于指定配置文件路径
    • 默认为用户目录下的mineru.json,可通过环境变量指定其他配置文件路径。
  • MINERU_FORMULA_ENABLE

    • 用于启用公式解析
    • 默认为true,可通过环境变量设置为false来禁用公式解析。
  • MINERU_FORMULA_CH_SUPPORT

    • 用于启用中文公式解析优化(实验性功能)
    • 默认为false,可通过环境变量设置为true来启用中文公式解析优化。
    • 仅对pipeline后端生效。
  • MINERU_TABLE_ENABLE

    • 用于启用表格解析
    • 默认为true,可通过环境变量设置为false来禁用表格解析。
  • MINERU_TABLE_MERGE_ENABLE

    • 用于启用表格合并功能
    • 默认为true,可通过环境变量设置为false来禁用表格合并功能。
  • MINERU_PDF_RENDER_TIMEOUT

    • 用于设置将PDF渲染为图片的超时时间(秒)
    • 默认为300秒,可通过环境变量设置为其他值以调整渲染图片的超时时间。
    • 仅在linux和macOS系统中生效。
  • MINERU_PDF_RENDER_THREADS

    • 用于设置将PDF渲染为图片时使用的线程数
    • 默认为4,可通过环境变量设置为其他值以调整渲染图片时的线程数。
    • 仅在linux和macOS系统中生效。
  • MINERU_PROCESSING_WINDOW_SIZE

    • 用于设置单次处理窗口大小,影响大文档处理时的内存占用和吞吐表现
    • 默认为64,可通过环境变量设置为其他正整数。
  • MINERU_API_MAX_CONCURRENT_REQUESTS

    • 用于设置 mineru-apimineru-router 管理的 worker 最大并发请求数
    • 默认为3,需设置为正整数。
  • MINERU_API_ENABLE_FASTAPI_DOCS

    • 用于控制是否启用 FastAPI 自动生成的 /docs/openapi.json/redoc
    • 默认为true
  • MINERU_API_OUTPUT_ROOT

    • 用于指定 mineru-api 输出目录根路径
    • 默认为当前工作目录下的 ./output
  • MINERU_LOCAL_API_STARTUP_TIMEOUT_SECONDS

    • 用于控制各命令行工具等待本地拉起的 mineru-api 进入健康状态的最长时间
    • 默认为 300 秒。
    • 适用于 mineru 的临时本地 API、mineru-gradio 的 preload 启动,以及 mineru-router 托管的本地 worker。
  • MINERU_API_TASK_RETENTION_SECONDS

    • 用于设置任务完成或失败后的保留时长(秒)
    • 默认为 86400 秒(24 小时)。
  • MINERU_API_TASK_CLEANUP_INTERVAL_SECONDS

    • 用于设置任务清理轮询间隔(秒)
    • 默认为 300 秒(5 分钟)。
  • MINERU_INTRA_OP_NUM_THREADS

    • 用于设置onnx模型的intra_op线程数,影响单个算子的计算速度
    • 默认为-1(自动选择),可通过环境变量设置为其他值以调整线程数。
  • MINERU_INTER_OP_NUM_THREADS

    • 用于设置onnx模型的inter_op线程数,影响多个算子的并行执行
    • 默认为-1(自动选择),可通过环境变量设置为其他值以调整线程数。
  • MINERU_HYBRID_BATCH_RATIO

    • 用于设置 hybrid-* 后端中 小模型处理的batch倍率
    • 在hybrid-http-client中较为常用,可以通过控制小模型的batch倍率来调整单个客户端的显存占用量
    • 单个client端显存大小 MINERU_HYBRID_BATCH_RATIO
      <= 6 GB 8
      <= 4 GB 4
      <= 3 GB 2
      <= 2 GB 1
  • MINERU_HYBRID_FORCE_PIPELINE_ENABLE

    • 用于强制将 hybrid-* 后端中的 文本提取部分使用 小模型 进行处理
    • 默认为false,可通过环境变量设置为true来启用该功能,从而在某些极端情况下减少幻觉的发生。
  • MINERU_VL_MODEL_NAME

    • 用于指定 vlm/hybrid 后端使用的模型名称,这将允许您在同时存在多个模型的远程openai-server中指定 MinerU 运行所需的模型。
  • MINERU_VL_API_KEY:

    • 用于指定 vlm/hybrid 后端使用的API Key,这将允许您在远程openai-server中进行身份验证。