Skip to content

PDF翻译模块使用说明

一、功能概述

本模块提供PDF文档的智能翻译服务,支持多语言互译及格式保留功能,适用于学术论文、合同文件等场景的快速本地化处理。

软件第一次启动的时候,会自动下载必要的模型文件,可能需要一些时间,请耐心等待。

二、操作指南

1. 文件上传

  • 方式一:点击灰色虚线框区域,通过弹出窗口选择本地PDF文件
  • 方式二:直接将PDF文件拖拽至虚线框内完成上传
  • 注意事项
    • 单次仅支持单个文件上传(无文件大小限制)
    • 银行卡号、身份证等敏感信息请自行脱敏,【小书芽】本身不会留存任何数据,但是调用大模型会发送数据到响应的大模型平台。

2. 参数配置

基础设置

选项描述
源语言下拉菜单选择原文档语言(目前其实不太重要)
目标语言选择翻译目标语言
服务平台可以设置添加大模型,目前支持OpenAi和Ollama协议
翻译模型推荐使用智谱AI下的GLM-4-Flash模型,该模型不收费,且日常足够使用

高级选项

功能项默认状态作用说明
翻译引擎BabelDOC支持BabelDOC和PDFmath两个模型
线程数4数值越大速度越快但更耗资源,理论上为自己电脑CPU核数的2倍最佳
启用术语库关闭开启后优先使用自定义术语表
翻译表格关闭默认情况下pdf中的表格内容不进行翻译
禁用富文本关闭富文本翻译可能会导致某些pdf翻译问题
双语对照关闭开启后会额外生成一份双语对照阅读的PDF文档
消除重影关闭开启后双层pdf文档翻译就没重影了(双层pdf文档指的是扫描件经过OCR识别后的pdf)

3. 启动翻译

  1. 确认所有参数无误后,点击绿色【翻译】按钮
  2. 系统会显示实时进度条(绿色勾图标表示就绪状态)
  3. 处理完成后自动下载翻译后的PDF文件

4. 异常处理

  • 若需中断翻译,点击红色【终止】按钮
  • 出现错误提示时,检查:
    • 文件格式是否为标准PDF
    • 网络连接是否正常
    • 是否包含不可翻译的加密内容

三、常见问题解答

  1. 常见使用问题
  2. 电脑用户名导致的启动问题
  3. OPENSSL UDlink(00007FFE0D424068.08):nO OPENSSL Aoplink

Q1: 翻译后的排版是否会改变? A: 当"禁用富文本"关闭时,系统会尽量保留原PDF的布局结构,但复杂图表可能无法完全复现。

Q2: 如何提高翻译准确性? A:

  1. 使用专业领域对应的翻译模型
  2. 开启术语库并导入行业词典
  3. 分段落处理超长文档

Q3: 大文件处理时间过长怎么办? A: 可尝试:

  • 将线程数调至8(需保证设备性能)
  • 分拆为多个小文件分别处理
  • 使用离线部署版本(企业版功能)

四、系统支持

  • 兼容操作系统:Windows 10+
  • 不支持MacOS,因为我没有mac电脑

小书芽-专业隐私完美保持排版的PDF翻译工具