Cherry Studio 简介

Cherry Studio 是一款功能强大的多模型 AI 客户端软件，支持 Windows、macOS 和 Linux 等多平台运行，集成了 OpenAI、DeepSeek、Gemini、Anthropic 等主流 AI 云服务，同时支持本地模型运行，用户可以灵活切换不同的AI模型。

目前，MinerU 强大的文档解析能力已深度集成到 Cherry Studio 的知识库与对话交互中，为用户带来更便捷的文档处理与信息获取体验。

Cherry Studio 官网地址：https://www.cherry-ai.com/

MinerU 在 Cherry Studio 中的使用方法

进入 Cherry Studio 设置

a. 打开 Cherry Studio 应用程序

b. 点击左下角的"设置"按钮，进入设置页面

c. 在左侧菜单中，选择"MCP 服务器"

在右侧的 MCP 服务器配置界面中，您可以看到已有的 MCP 服务器列表。点击右上角的"添加服务器"按钮来创建新的 MCP 服务，或者点击现有服务来编辑配置。

添加 MinerU-MCP 配置

点击"添加服务器"后，您将看到一个配置表单。请按以下步骤填写：

a. 名称：输入"MinerU-MCP"或您喜欢的其他名称

b. 描述：可选，如"文档转换为Markdown工具"

c. 类型：选择"标准输入/输出（stdio）"

d. 命令：输入 uvx

e. 参数：输入 mineru-mcp

f. 环境变量：添加以下环境变量

MINERU_API_BASE=https://mineru.net
MINERU_API_KEY=您的API密钥
OUTPUT_DIR=./downloads
USE_LOCAL_API=false
LOCAL_MINERU_API_BASE=http://localhost:8888

使用 uvx 命令可以自动处理 mineru-mcp 的安装和运行，无需预先手动安装 mineru-mcp 包。这是最简单的配置方式。

保存配置

确认无误后，点击界面右上角的"保存"按钮完成配置。保存后，MCP 服务器列表中会显示您刚刚添加的 MinerU-MCP 服务。

使用 Cherry Studio 中的 MinerU MCP

一旦配置完成，您可以在 Cherry Studio 中的对话中使用 MinerU MCP 工具。在 Cherry Studio 中，您可以使用如下提示让模型调用 MinerU MCP 工具。模型会自动识别任务并调用相应的工具。

示例 1: 使用 URL 转换文档

用户输入:

请使用 MinerU MCP 将以下 URL 的 PDF 文档转换为 Markdown 格式：https://example.com/sample.pdf

模型将执行的步骤：

模型识别这是文档转换任务，并调用 parse_documents 工具，参数为:

{"file_sources": "https://example.com/sample.pdf"}

工具处理完成后，模型会告知您转换结果。

示例 2: 转换本地文档

用户输入:

请使用 MinerU-MCP 将本地的 D://sample.pdf 文件转换为 Markdown 格式

模型将执行的步骤：

模型识别这是本地文档转换任务，调用 parse_documents 工具，参数为:

{"file_sources": "D://sample.pdf"}

示例 3: 启用 OCR 处理扫描文档

用户输入:

请使用 MinerU-MCP 将以下 URL 的扫描版 PDF 文档转换为 Markdown 格式，并启用 OCR 功能：
https://example.com/scanned.pdf

模型将执行的步骤：

模型识别这是需要 OCR 处理的文档转换任务，调用 parse_documents 工具，并启用 OCR 参数:

{"file_sources": "https://example.com/scanned.pdf","enable_ocr": true}

示例 4: 完整对话流程

以下是一个完整的对话流程示例：

用户:

我有一份学术论文的 PDF，网址是 https://arxiv.org/pdf/2303.08774.pdf，能帮我转换成 Markdown 格式吗？

模型:

我可以帮您将这份学术论文转换为 Markdown 格式。我将使用 MinerU-MCP 工具来处理这个任务。
[模型调用 parse_documents 工具，处理过程中...]
论文已成功转换为 Markdown 格式。转换结果如下：
# The Capacity of Diffusion Models to Memorize and Generate Training Data
## Abstract
Recent diffusion models can generate high-quality images that are nearly indistinguishable from real ones...
[显示论文内容...]

工具参数详解

在使用过程中，模型会根据您的指令自动选择合适的工具和参数。以下是主要工具的参数说明：

● parse_documents 工具参数

● get_ocr_languages 工具参数

无需参数，用于获取OCR支持的语言列表。

高级用法

指定语言和页码范围

用户输入:

请使用 MinerU MCP 将以下 URL 的文档转换为 Markdown 格式，只处理第 5-10 页，并指定语言为中文：https://example.com/document.pdf

模型会使用 parse_documents 工具，并设置 language 参数为 "ch"，page_ranges 参数为 "5-10"。

批量处理多个文档

用户输入:

请使用 MinerU-MCP 将以下多个 URL 的文档转换为 Markdown 格式：
https://example.com/doc1.pdf
https://example.com/doc2.pdf
https://example.com/doc3.pdf

模型会调用 parse_documents 工具，并将多个 URL 以逗号分隔传入 file_sources 参数。

注意事项

● 当设置 USE_LOCAL_API=true 时，使用本地配置的API进行解析

● 当设置 USE_LOCAL_API=false 时，会使用 MinerU 官网的API进行解析

● 处理大型文档可能需要较长时间，请耐心等待

● 如果遇到超时问题，请考虑分批处理文档或使用本地API模式

常见问题与解决方案

无法启动 MCP 服务

问题：运行 uv run -m mineru.cli时报错。

解决方案：

● 确保已激活虚拟环境

● 检查是否已安装所有依赖

● 尝试使用 python -m mineru.cli命令替代

文件转换失败

问题：文件上传成功但转换失败。

解决方案：

● 检查文件格式是否受支持

● 确认API密钥是否正确

● 查看MCP服务日志获取详细错误信息

文件路径问题

问题：使用 parse_documents 工具处理本地文件时报找不到文件错误。

解决方案：请确保使用绝对路径，或者相对于服务器运行目录的正确相对路径。

MCP 服务调用超时问题

问题：调用 parse_documents 工具时出现 Error calling tool 'parse_documents': MCP error -32001: Request timed out 错误。

解决方案：这个问题常见于处理大型文档或网络不稳定的情况。在某些 MCP 客户端（如 Cursor）中，超时后可能导致无法再次调用 MCP 服务，需要重启客户端。最新版本的 Cursor 中可能会显示正在调用 MCP，但实际上没有真正调用成功。建议：

● 等待官方修复：这是Cursor客户端的已知问题，建议等待Cursor官方修复

● 处理小文件：尽量只处理少量小文件，避免处理大型文档导致超时

● 分批处理：将多个文件分成多次请求处理，每次只处理一两个文件

● 增加超时时间设置（如果客户端支持）

● 对于超时后无法再次调用的问题，需要重启 MCP 客户端

● 如果反复出现超时，请检查网络连接或考虑使用本地 API 模式