扫一扫分享
babelDOC 是 funstory-ai 团队开发的一款开源 PDF 翻译工具,主打科学论文翻译和双语对照功能,就像为多语言文档处理量身打造的 “高效助手”。它不仅支持在线使用,还能自行部署,既提供了简单易上手的命令行操作,也开放了 Python api 供二次开发,不管是普通用户快速翻译文件,还是开发者嵌入其他程序,都能满足需求。
翻译后能生成双语 PDF,支持两种展示模式:一种是原文和译文并排显示,另一种是交替分页展示,不用切换窗口就能轻松对比。还能自由设置原文在前还是译文在前,满足不同阅读习惯。同时支持给译文 PDF 加水印,也能选择不加水印,甚至同时输出两种版本,灵活适配各种使用场景。
针对科学论文常见的数学公式、表格、特殊排版,BabelDOC 采用先进的解析技术,能最大程度保留原文的版式结构 —— 公式不会错乱、表格格式不变、字体和行距也能精准还原。就算是包含大量专业符号的学术文档,翻译后也能直接使用,不用再手动调整格式。
支持同时上传多个 PDF 文件批量处理,不用逐个等待。还能指定具体翻译页码,比如只翻译第 1-5 页、第 8 页,或者排除不需要的页面,避免做无用功。对于几百页的大文档,还能设置 “每页拆分上限”,自动分成小部分翻译后再合并,既不占用过多资源,又能保证翻译流畅度。
能对接 OpenAI 兼容的大语言模型,比如 GPT-4o-mini、glm-4-flash、deepseek-chat 等,也支持本地模型(如 Ollama),不用复杂配置,只要设置好 API 地址和密钥就能使用。如果需要更多翻译引擎支持,搭配 PDFMathTranslate 使用还能拓展更多选择,不管是专业学术翻译,还是日常文档处理,都能找到合适的翻译方案。
可以生成离线资源包,把所需的模型、字体等全部打包保存,之后在没有网络的环境下,直接恢复这个包就能正常使用。对于经常出差、或者工作环境没网的用户来说,这个功能简直太实用了,而且资源包会通过哈希校验保证完整性,不用担心文件损坏。
针对部分特殊 PDF 可能出现的兼容问题,提供了 “增强兼容性” 模式,一键开启后能跳过冗余的清理步骤、简化翻译输入,让老旧 PDF 或格式复杂的文件也能顺利翻译。还支持 OCR 辅助识别,对于扫描版 PDF,能通过 OCR 提取文本并补全背景,确保翻译准确识别内容。
基于 AGPL-3.0 开源协议,所有核心功能完全免费,没有隐藏收费项。在线版每月提供 1000 页免费翻译额度,对于学生、科研人员来说完全够用;自行部署后还能解锁更多自定义功能,不用依赖第三方付费服务。
安装方式很便捷,通过 uv 工具(Python 包管理工具)几步就能完成部署,之后用简单的命令行指令就能启动翻译,比如输入 “babeldoc --bing --files example.pdf” 就能快速翻译文件。还支持 TOML 格式的配置文件,把常用的翻译语言、输出目录、模型参数等提前设置好,下次直接调用配置文件就行,不用重复输入指令。
采用插件式架构设计,未来还会逐步支持图表翻译、跨页段落识别、文档大纲保留等更高级的功能。开发者可以通过 Python API 将其嵌入自己的程序,比如 Zotero 用户就能通过对应的插件直接在文献管理工具里使用 BabelDOC 的翻译功能,不用来回切换软件。
支持自定义翻译提示词,比如给翻译模型添加 “专业学术翻译”“保持简洁” 等指令,让译文更符合使用场景。还能设置翻译的最小文本长度,避免翻译零散的短句导致语义不通;同时支持跳过扫描件检测(已知文档不是扫描件时),能大幅提升处理速度。
科研人员:快速翻译外文文献、学术论文,不用再逐句对照词典,节省研究时间;
高校师生:处理多语言教学材料、课程论文,轻松完成双语版本整理;
企业研发 / 商务人员:翻译技术文档、商务合同,确保专业术语准确,助力跨国协作;
开发者:需要在自己的程序中集成 PDF 翻译功能,借助 Python API 快速实现需求。
学术研究:翻译英文期刊论文、会议报告,生成双语版本方便查阅和引用;
教学工作:将外文教材、课件翻译成中文,或者制作双语教学资料,提升教学效果;
企业办公:批量翻译跨国项目的技术文档、产品说明,确保团队沟通无语言障碍;
个人使用:翻译外文书籍、说明书等 PDF 文件,满足日常学习和生活需求。
先安装 uv 并配置环境变量,之后通过命令快速安装:
uv tool install --python 3.12 BabelDOC
如果想从源码安装,克隆项目后进入目录,用 uv 安装依赖即可:
git clone https://github.com/funstory-ai/BabelDOC
cd BabelDOC
uv run babeldoc --help
单文件翻译(用 Bing 翻译):
babeldoc --bing --files example.pdf
多文件翻译(用 OpenAI 模型):
uv run babeldoc --files example1.pdf --files example2.pdf --openai --openai-model "gpt-4o-mini" --openai-api-key "你的密钥"
指定页码翻译(只翻译第 1-3 页和第 5 页):
babeldoc --files example.pdf --pages "1-3,5" --lang-out "zh"
对接 Zotero:沉浸式翻译 Pro 会员可通过专属插件,直接在 Zotero 中使用 BabelDOC 翻译文献;
自行部署:搭配 PDFMathTranslate 1.9.3 + 版本,可搭建带 Web 界面的私有翻译服务,支持更多翻译引擎;
离线使用:生成离线资源包后,在无网环境下通过 “restore-offline-assets” 命令恢复即可使用。
BabelDOC 作为一款开源免费的 PDF 翻译工具,把 “精准、高效、灵活” 做到了实处 —— 既解决了普通翻译工具格式错乱、专业术语不准的问题,又提供了批量处理、离线使用等实用功能,不管是学术场景还是办公场景,都能大幅降低多语言文档处理的门槛。如果你经常需要和外文 PDF 打交道,不管是自己用还是嵌入程序,BabelDOC 都是值得一试的选择,让多语言文档处理变得简单又高效!
仅供个人学习参考/导航指引使用,具体请以第三方网站说明为准,本站不提供任何专业建议。如果地址失效或描述有误,请联系站长反馈~感谢您的理解与支持!
手机扫一扫预览