小书芽集成的开源翻译引擎介绍
小书芽PDF翻译工具集成了两款优秀的开源翻译引擎:PDFMathTranslate和BabelDoc。用户可以根据文档类型和需求自由选择合适的翻译引擎。
PDFMathTranslate
项目简介
专注于学术PDF文档翻译,特别擅长处理包含复杂数学公式、图表和科技术语的专业文档。
核心特点
- 学术文档优化:完美保留数学公式和复杂排版
- 多服务支持:智谱AI、OpenAI等多种翻译服务
- 部署灵活:CLI、GUI和Docker多种使用方式
技术实现
- PyMuPDF解析PDF结构
- DocLayout-YOLO模型布局分析
- ReportLab库重建翻译后PDF
项目地址:GitHub - PDFMathTranslate
BabelDoc
项目简介
专注于数据隐私保护的PDF翻译解决方案,强调本地化处理能力。
核心特点
- 隐私优先:所有翻译过程在本地完成
- 格式保持:完整保留原始文档结构和样式
- 模型灵活:可接入不同大语言模型
项目地址:GitHub - BabelDoc