Ascend

1. 测试平台

以下为本指南测试使用的平台信息，供参考：

os: CTyunOS 22.06  
cpu: Kunpeng-920 (aarch64)  
npu: Ascend 910B2  
driver: 23.0.3 
docker: 20.10.12

2. 环境准备

Note

Ascend加速卡支持使用vllm或lmdeploy进行VLM模型推理加速。请根据实际需求选择安装和使用其中之一:

2.1 使用 Dockerfile 构建镜像（vllm）

Tip

ascend-vllm支持设备如下:

Atlas A2 training series (Atlas 800T A2, Atlas 900 A2 PoD, Atlas 200T A2 Box16, Atlas 300T A2)
Atlas 800I A2 inference series (Atlas 800I A2)
Atlas A3 training series (Atlas 800T A3, Atlas 900 A3 SuperPoD, Atlas 9000 A3 SuperPoD)
Atlas 800I A3 inference series (Atlas 800I A3)
[Experimental] Atlas 300I inference series (Atlas 300I Duo)

Dockerfile文件第三行为ascend-vllm基础镜像信息,默认tag为A2适配的版本,例如 v0.11.0

如需使用A3适配的版本,请将第三行的tag修改为 v0.11.0-a3,然后再执行build操作。
如需使用Atlas 300I Duo适配的版本,请将第三行的tag修改为 v0.10.0rc1-310p,然后再执行build操作。

wget https://gcore.jsdelivr.net/gh/opendatalab/MinerU@master/docker/china/npu.Dockerfile
docker build --network=host -t mineru:npu-vllm-latest -f npu.Dockerfile .

2.2 使用 Dockerfile 构建镜像（lmdeploy）

Tip

ascend-lmdeploy支持设备如下:

Atlas A2 training series (Atlas 800T A2, Atlas 900 A2 PoD, Atlas 200T A2 Box16, Atlas 300T A2)
Atlas 800I A2 inference series (Atlas 800I A2)

如果您的设备为Atlas A3系列或Atlas 300I Duo系列，请使用vllm版本的镜像。

wget https://gcore.jsdelivr.net/gh/opendatalab/MinerU@master/docker/china/npu.Dockerfile
# 将基础镜像从 vllm 切换为 lmdeploy
sed -i '3s/^/# /' npu.Dockerfile && sed -i '5s/^# //' npu.Dockerfile
docker build --network=host -t mineru:npu-lmdeploy-latest -f npu.Dockerfile .

3. 启动 Docker 容器

docker run -u root --name mineru_docker --privileged=true \
    --ipc=host \
    --network=host \
    --device=/dev/davinci0 \
    --device=/dev/davinci1 \
    --device=/dev/davinci2 \
    --device=/dev/davinci3 \
    --device=/dev/davinci4 \
    --device=/dev/davinci5 \
    --device=/dev/davinci6 \
    --device=/dev/davinci7 \
    --device=/dev/davinci_manager \
    --device=/dev/devmm_svm \
    --device=/dev/hisi_hdc \
    -v /var/log/npu/:/usr/slog \
    -v /usr/local/dcmi:/usr/local/dcmi \
    -v /usr/local/bin/npu-smi:/usr/local/bin/npu-smi \
    -v /usr/local/Ascend/driver:/usr/local/Ascend/driver \
    -e VLLM_WORKER_MULTIPROC_METHOD=spawn \
    -e MINERU_MODEL_SOURCE=local \
    -e MINERU_LMDEPLOY_DEVICE=ascend \
    -it mineru:npu-vllm-latest \
    /bin/bash

Tip

请根据实际情况选择使用vllm或lmdeploy版本的镜像，如需使用lmdeploy，替换上述命令中的mineru:npu-vllm-latest为mineru:npu-lmdeploy-latest即可。

执行该命令后，您将进入到Docker容器的交互式终端，您可以直接在容器内运行MinerU相关命令来使用MinerU的功能。您也可以直接通过替换/bin/bash为服务启动命令来启动MinerU服务，详细说明请参考通过命令启动服务。

Note

由于310p加速卡不支持图模式与bf16精度，因此在使用该加速卡时，执行任意与vllm相关命令需追加--enforce-eager --dtype float16参数。例如:

mineru-openai-server --port 30000 --enforce-eager --dtype float16

4. 注意事项

不同环境下，MinerU对Ascend加速卡的支持情况如下表所示：

使用场景		容器环境
使用场景		vllm	lmdeploy
命令行工具(mineru)	pipeline	🟢	🟢
	<vlm/hybrid>-auto-engine	🟢	🟢
	<vlm/hybrid>-http-client	🟢	🟢
fastapi服务(mineru-api)	pipeline	🟢	🟢
	<vlm/hybrid>-auto-engine	🟢	🟢
	<vlm/hybrid>-http-client	🟢	🟢
gradio界面(mineru-gradio)	pipeline	🟢	🟢
	<vlm/hybrid>-auto-engine	🟢	🟢
	<vlm/hybrid>-http-client	🟢	🟢
openai-server服务（mineru-openai-server）		🟢	🟢
数据并行 (--data-parallel-size/--dp)		🟢	🔴

注：
🟢: 支持，运行较稳定，精度与Nvidia GPU基本一致
🟡: 支持但较不稳定，在某些场景下可能出现异常，或精度存在一定差异
🔴: 不支持，无法运行，或精度存在较大差异

Tip

NPU加速卡指定可用加速卡的方式与NVIDIA GPU类似，请参考ASCEND_RT_VISIBLE_DEVICES
在Ascend平台可以通过npu-smi info命令查看加速卡的使用情况，并根据需要指定空闲的加速卡ID以避免资源冲突。