Appearance
PDF翻译模块使用说明
一、功能概述
本模块提供PDF文档的智能翻译服务,支持多语言互译及格式保留功能,适用于学术论文、合同文件等场景的快速本地化处理。
软件第一次启动的时候,会自动下载必要的模型文件,可能需要一些时间,请耐心等待。
二、操作指南
1. 文件上传
- 方式一:点击灰色虚线框区域,通过弹出窗口选择本地PDF文件
- 方式二:直接将PDF文件拖拽至虚线框内完成上传
- 注意事项:
- 单次仅支持单个文件上传(无文件大小限制)
- 银行卡号、身份证等敏感信息请自行脱敏,【小书芽】本身不会留存任何数据,但是调用大模型会发送数据到响应的大模型平台。
2. 参数配置
基础设置
选项 | 描述 |
---|---|
源语言 | 下拉菜单选择原文档语言(目前其实不太重要) |
目标语言 | 选择翻译目标语言 |
服务平台 | 可以设置添加大模型,目前支持OpenAi和Ollama协议 |
翻译模型 | 推荐使用智谱AI下的GLM-4-Flash模型,该模型不收费,且日常足够使用 |
高级选项
功能项 | 默认状态 | 作用说明 |
---|---|---|
翻译引擎 | BabelDOC | 支持BabelDOC和PDFmath两个模型 |
线程数 | 4 | 数值越大速度越快但更耗资源,理论上为自己电脑CPU核数的2倍最佳 |
启用术语库 | 关闭 | 开启后优先使用自定义术语表 |
翻译表格 | 关闭 | 默认情况下pdf中的表格内容不进行翻译 |
禁用富文本 | 关闭 | 富文本翻译可能会导致某些pdf翻译问题 |
双语对照 | 关闭 | 开启后会额外生成一份双语对照阅读的PDF文档 |
消除重影 | 关闭 | 开启后双层pdf文档翻译就没重影了(双层pdf文档指的是扫描件经过OCR识别后的pdf) |
3. 启动翻译
- 确认所有参数无误后,点击绿色【翻译】按钮
- 系统会显示实时进度条(绿色勾图标表示就绪状态)
- 处理完成后自动下载翻译后的PDF文件
4. 异常处理
- 若需中断翻译,点击红色【终止】按钮
- 出现错误提示时,检查:
- 文件格式是否为标准PDF
- 网络连接是否正常
- 是否包含不可翻译的加密内容
三、常见问题解答
Q1: 翻译后的排版是否会改变? A: 当"禁用富文本"关闭时,系统会尽量保留原PDF的布局结构,但复杂图表可能无法完全复现。
Q2: 如何提高翻译准确性? A:
- 使用专业领域对应的翻译模型
- 开启术语库并导入行业词典
- 分段落处理超长文档
Q3: 大文件处理时间过长怎么办? A: 可尝试:
- 将线程数调至8(需保证设备性能)
- 分拆为多个小文件分别处理
- 使用离线部署版本(企业版功能)
四、系统支持
- 兼容操作系统:Windows 10+
- 不支持MacOS,因为我没有mac电脑