跳转至

Cherry Studio 简介

Cherry Studio 是一款功能强大的多模型 AI 客户端软件,支持 Windows、macOS 和 Linux 等多平台运行,集成了 OpenAI、DeepSeek、Gemini、Anthropic 等主流 AI 云服务,同时支持本地模型运行,用户可以灵活切换不同的AI模型。

目前,MinerU 强大的文档解析能力已深度集成到 Cherry Studio 的知识库与对话交互中,为用户带来更便捷的文档处理与信息获取体验。

img

  • Cherry Studio 官网地址:https://www.cherry-ai.com/

MinerU 在 Cherry Studio 中的使用方法

进入 Cherry Studio 设置

a. 打开 Cherry Studio 应用程序

b. 点击左下角的"设置"按钮,进入设置页面

c. 在左侧菜单中,选择"MCP 服务器"

在右侧的 MCP 服务器配置界面中,您可以看到已有的 MCP 服务器列表。点击右上角的"添加服务器"按钮来创建新的 MCP 服务,或者点击现有服务来编辑配置。

添加 MinerU-MCP 配置

点击"添加服务器"后,您将看到一个配置表单。请按以下步骤填写:

a. 名称:输入"MinerU-MCP"或您喜欢的其他名称

b. 描述:可选,如"文档转换为Markdown工具"

c. 类型:选择"标准输入/输出(stdio)"

d. 命令:输入 uvx

e. 参数:输入 mineru-mcp

f. 环境变量:添加以下环境变量

MINERU_API_BASE=https://mineru.net
MINERU_API_KEY=您的API密钥
OUTPUT_DIR=./downloads
USE_LOCAL_API=false
LOCAL_MINERU_API_BASE=http://localhost:8888

使用 uvx 命令可以自动处理 mineru-mcp 的安装和运行,无需预先手动安装 mineru-mcp 包。这是最简单的配置方式。

保存配置

确认无误后,点击界面右上角的"保存"按钮完成配置。保存后,MCP 服务器列表中会显示您刚刚添加的 MinerU-MCP 服务。

img

img

使用 Cherry Studio 中的 MinerU MCP

一旦配置完成,您可以在 Cherry Studio 中的对话中使用 MinerU MCP 工具。在 Cherry Studio 中,您可以使用如下提示让模型调用 MinerU MCP 工具。模型会自动识别任务并调用相应的工具。

示例 1: 使用 URL 转换文档

用户输入:

请使用 MinerU MCP 将以下 URL 的 PDF 文档转换为 Markdown 格式:https://example.com/sample.pdf

模型将执行的步骤:

模型识别这是文档转换任务,并调用 parse_documents 工具,参数为:

{"file_sources": "https://example.com/sample.pdf"}

工具处理完成后,模型会告知您转换结果。

img

示例 2: 转换本地文档

用户输入:

请使用 MinerU-MCP 将本地的 D://sample.pdf 文件转换为 Markdown 格式

模型将执行的步骤:

模型识别这是本地文档转换任务,调用 parse_documents 工具,参数为:

{"file_sources": "D://sample.pdf"}

img

示例 3: 启用 OCR 处理扫描文档

用户输入:

请使用 MinerU-MCP 将以下 URL 的扫描版 PDF 文档转换为 Markdown 格式,并启用 OCR 功能:
https://example.com/scanned.pdf

模型将执行的步骤:

模型识别这是需要 OCR 处理的文档转换任务,调用 parse_documents 工具,并启用 OCR 参数:

{"file_sources": "https://example.com/scanned.pdf","enable_ocr": true}

img

示例 4: 完整对话流程

以下是一个完整的对话流程示例:

用户:

我有一份学术论文的 PDF,网址是 https://arxiv.org/pdf/2303.08774.pdf,能帮我转换成 Markdown 格式吗?

模型:

我可以帮您将这份学术论文转换为 Markdown 格式。我将使用 MinerU-MCP 工具来处理这个任务。
[模型调用 parse_documents 工具,处理过程中...]
论文已成功转换为 Markdown 格式。转换结果如下:
# The Capacity of Diffusion Models to Memorize and Generate Training Data
## Abstract
Recent diffusion models can generate high-quality images that are nearly indistinguishable from real ones...
[显示论文内容...]

img

工具参数详解

在使用过程中,模型会根据您的指令自动选择合适的工具和参数。以下是主要工具的参数说明:

parse_documents 工具参数

img

get_ocr_languages 工具参数

无需参数,用于获取OCR支持的语言列表。

高级用法

指定语言和页码范围

用户输入:

请使用 MinerU MCP 将以下 URL 的文档转换为 Markdown 格式,只处理第 5-10 页,并指定语言为中文:https://example.com/document.pdf

模型会使用 parse_documents 工具,并设置 language 参数为 "ch",page_ranges 参数为 "5-10"。

批量处理多个文档

用户输入:

请使用 MinerU-MCP 将以下多个 URL 的文档转换为 Markdown 格式:
https://example.com/doc1.pdf
https://example.com/doc2.pdf
https://example.com/doc3.pdf

模型会调用 parse_documents 工具,并将多个 URL 以逗号分隔传入 file_sources 参数。

注意事项

● 当设置 USE_LOCAL_API=true 时,使用本地配置的API进行解析

● 当设置 USE_LOCAL_API=false 时,会使用 MinerU 官网的API进行解析

● 处理大型文档可能需要较长时间,请耐心等待

● 如果遇到超时问题,请考虑分批处理文档或使用本地API模式

常见问题与解决方案

无法启动 MCP 服务

问题:运行 uv run -m mineru.cli时报错。

解决方案

● 确保已激活虚拟环境

● 检查是否已安装所有依赖

● 尝试使用 python -m mineru.cli命令替代

文件转换失败

问题:文件上传成功但转换失败。

解决方案

● 检查文件格式是否受支持

● 确认API密钥是否正确

● 查看MCP服务日志获取详细错误信息

文件路径问题

问题:使用 parse_documents 工具处理本地文件时报找不到文件错误。

解决方案:请确保使用绝对路径,或者相对于服务器运行目录的正确相对路径。

MCP 服务调用超时问题

问题:调用 parse_documents 工具时出现 Error calling tool 'parse_documents': MCP error -32001: Request timed out 错误。

解决方案:这个问题常见于处理大型文档或网络不稳定的情况。在某些 MCP 客户端(如 Cursor)中,超时后可能导致无法再次调用 MCP 服务,需要重启客户端。最新版本的 Cursor 中可能会显示正在调用 MCP,但实际上没有真正调用成功。建议:

● 等待官方修复:这是Cursor客户端的已知问题,建议等待Cursor官方修复

● 处理小文件:尽量只处理少量小文件,避免处理大型文档导致超时

● 分批处理:将多个文件分成多次请求处理,每次只处理一两个文件

● 增加超时时间设置(如果客户端支持)

● 对于超时后无法再次调用的问题,需要重启 MCP 客户端

● 如果反复出现超时,请检查网络连接或考虑使用本地 API 模式