跳转至

MinerU 扩展模块安装指南

MinerU 支持根据不同需求,按需安装扩展模块,以增强功能或支持特定的模型后端。

常见场景

核心功能安装

core 模块是 MinerU 的核心依赖,包含了常用解析功能,不包含vllm/lmdeploy/s3等可选模块。安装此模块可以确保 MinerU 的基本功能正常运行。

uv pip install "mineru[core]"

使用 S3 输入输出

如需通过 S3 读取或写入文件,请安装s3扩展模块。

uv pip install "mineru[s3]"

使用vllm加速 VLM 模型推理

Note

vllmlmdeploy对vlm的推理加速效果和使用方式几乎相同,您可以根据实际情况选择其中之一进行安装和使用,但不建议同时安装这两个模块,以避免潜在的依赖冲突。

vllm 模块提供了对 VLM 模型推理的加速支持,适用于具有 Volta 及以后架构的显卡(8G 显存及以上)。安装此模块可以显著提升模型推理速度。

uv pip install "mineru[core,vllm]"

Tip

  • 由于vllm扩展包已放开到 0.21 系列版本,默认安装通常会选择当前允许范围内更高的vllm版本。请确保物理机显卡驱动支持所安装vllm包对应的 CUDA 运行时,默认路径需要 CUDA 13.0 兼容驱动。
  • 如需使用 CUDA 12.9 兼容环境,请参考 vllm 官方文档 选择对应的 CUDA 安装方式,或直接使用 Docker 中的vllm/vllm-openai:v0.21.0-cu129基础镜像。
  • 如在安装包含vllm的扩展包过程中发生异常,也可参考 vllm 官方文档 尝试解决。

使用lmdeploy加速 VLM 模型推理

Note

vllmlmdeploy对vlm的推理加速效果和使用方式几乎相同,您可以根据实际情况选择其中之一进行安装和使用,但不建议同时安装这两个模块,以避免潜在的依赖冲突。

lmdeploy 模块提供了对 VLM 模型推理的加速支持,适用于具有 Volta 及以后架构的显卡(8G 显存及以上)。安装此模块可以显著提升模型推理速度。

uv pip install "mineru[core,lmdeploy]"

Tip

如在安装包含lmdeploy的扩展包过程中发生异常,请参考 lmdeploy 官方文档 尝试解决。


安装轻量版client连接兼容openai服务器使用 (适用vlm-http-client模式)

如果您需要在边缘设备上安装轻量版的 client 端以连接兼容 openai 接口的服务端来使用vlm模式,可以安装mineru的基础包,非常轻量,适合在只有cpu和网络连接的设备上使用。

uv pip install mineru
mineru -p <input_path> -o <output_path> -b vlm-http-client -u http://127.0.0.1:30000

安装轻量版client连接兼容openai服务器使用 (适用hybrid-http-client模式)

如果您需要在边缘设备上安装轻量版的 client 端以连接兼容 openai 接口的服务端来使用hybrid模式,可以安装mineru的pipeline扩展包,相对较轻量,可以在只有cpu和网络连接的设备上使用,同时在支持gpu加速的设备上可以更快运行。

uv pip install "mineru[pipeline]"
mineru -p <input_path> -o <output_path> -b hybrid-http-client -u http://127.0.0.1:30000