看了宝玉老师的帖子,把 65 页的 Google 官方提示工程白皮书 PDF 文件转为Markdown文件再进行翻译,效果确实会非常好!
顺便介绍推荐下MinerU,一个开源高质量数据提取工具,将PDF转换成Markdown和JSON格式。且官方提供了带美观界面的一键客户端,如此一来人人可用。
1/3
https://t.co/h0AYcJw438 https://t.co/Jhyv70HKuu
Show more
我是如何高效翻译 65 页 Google 官方提示工程白皮书 PDF 文件的
前几天翻译 Google 官方提示工程白皮书 PDF Google 官方提示工程 (Prompt Engineering)白皮书完整翻译和 PDF 下载 的时候,尝试了一些自动化的方法来提升效率,分享一些我翻译 PDF 的经验和心得。
首先我个人比较排斥保持排版的翻译方式,因为 PDF 在翻译后,文字长度不一致会导致排版很难看,忽大忽小;另外翻译的时候由于布局导致的文字被强行分割,导致上下文不完整会影响翻译质量。
我在翻译 PDF 时,会把 PDF 先转成 Markdown,再基于 Markdown 去翻译,翻译好了基于翻译好的 Markdown 再去重新生成 PDF,对于文字、表格、图片都能很好的保留,主要缺点是布局格式保留的不是很好,不过我翻译的通常是文字图表为主的,所以影响不大。
🧵
Show more