Google翻訳で英文PDFやWordファイルを翻訳する 改行を修正してPDFの翻訳精度を向上

スポンサーリンク

google翻訳

Google翻訳は英語や中国語など、世界各国の言語を日本語に変換してくれるとても便利なツールです。使い方はとても簡単で、翻訳したいテキストやURLをそのまま入力するだけです。

また、Google翻訳はテキスト入力だけでなく、PDFファイルやWordファイルなどのドキュメント文書をそのまま翻訳する機能もあります。英語の論文など長めの文書を翻訳する場合は、この機能を使うと便利です。

しかし、PDFファイルをそのまま翻訳すると、余計な改行が入るため翻訳精度が下がります。これを変換ツールで修正する方法もご紹介します。

Google翻訳 PDFファイルやWordファイルを翻訳

では、さっそくGoogle翻訳にPDFファイルを読み込ませて翻訳してみましょう。Google翻訳はこちらからどうぞ。

https://translate.google.co.jp/?hl=ja

Google 翻訳

まずは入力ウィンドウの下にある「ドキュメントを翻訳します。」をクリックします。

google翻訳 ドキュメントを翻訳

「ファイルを選択」で翻訳したいPDFファイルを選び、右側の「翻訳」をクリックしてください。

google翻訳 pdfファイルを翻訳

PDF内の文章が翻訳されました。翻訳されたPDFファイル内の画像や装飾、表組みは除外され、テキストだけが表示されます。複数ページがある場合は、ページごとに区切りができます。

google翻訳 pdfファイル翻訳結果

翻訳された文章は何となく理解できますが、翻訳精度はイマイチですねぇ。

翻訳したPDFファイルは、The Institute for Social Justice (ISJ) Pakistan の「Investment in the rights of the child in Pakistan」を使いました。

なお、一度に読み込めるPDFファイルの容量は5MBまでとなっています。大量のPDFファイルを読み込ませる場合は、事前に分割するなどの対応が必要です。

google翻訳 Wordファイルを翻訳

Wordファイルも同様の手順で翻訳できます。.doc等のWordファイルを選択して翻訳をクリックすると、ファイル内の文章が翻訳されます。

google翻訳 Wordファイル翻訳結果

ところどころ違和感が残るものの、全体的にはちゃんと意味の分かる文章に翻訳されていますね。

翻訳したWordファイルは、The Institute for Social Justice (ISJ) Pakistan の「Child Marriages in Pakistan」です。

改行が原因 PDF論文の翻訳精度は低い

さて、これでPDFやWordファイルをそのまま翻訳できることがわかりました。でも、今回試したPDFファイルとWordファイルの翻訳精度を見ると、明らかにPDFファイルの方が劣っています。

これはPDFファイルを読み込む時に余計な改行が入るため、文章の区切りがおかしくなるのでGoogle翻訳が正しく文章を理解できないためです。Wordは改行が入らないので、正確に翻訳されています。

実際の例を見てみましょう。先ほどのPDFを一部抜粋して翻訳してみます。英語の原文はこちらです。

In 2009, the Committee on the Rights of the Child in its Concluding Observations and Recommendations against Pakistan’s 3rd and 4th combined periodic report to the UNCRC welcomed Pakistan’s pledge to increase allocation of resources for children especially in the field of health and education.

PDFファイルからgoogle翻訳にコピペすると、改行がそのまま残るので何となく不自然な文章になります。

google翻訳 pdfファイル翻訳精度

2009年に、子どもの権利に関する委員会は、その終わりの観察と勧告
パキスタンの3回目と4回目のUNCRCへの定期報告書に対するパキスタンの約束を歓迎した
特に保健や教育分野の子どもたちのための資源の配分を増やす。

改行を修正するとこうなります。かなりまともな翻訳になりましたね。

google翻訳 pdfファイル翻訳精度

2009年、UNCRCへのパキスタンの第3回と第4回の定期的な報告をまとめた、子どもの権利に関する委員会は、パキスタンの保健と教育の分野における子供のための資源の配分を増やすという約束を歓迎した。

google翻訳 改行を除外してPDF論文の翻訳精度を上げる

PDF論文の翻訳精度を上げるためには、PDF内の改行を修正すればよいことがわかりました。ただ、長い論文になると、いちいち手作業で修正していくのはとても大変ですね。

そこでオススメのツールを紹介します。テキストを入力して変換するだけで余計な改行を取り除き、ピリオド(.)の後だけ改行が入るように文章を修正してくれる「英語論文整形ツール」です。

http://p2p.neontetra.net/textformat/textformat.html

英語論文整形ツール

長いテキストでもご覧の通り、ちゃんと改行を取り除いて文章を修正してくれます。あとは修正済みのテキストをgoogle翻訳に入力すればOKです。これは便利ですね~♪

英語論文修正ツール

英語の論文やレポートが苦手な方でも、Google翻訳を使えば手軽に内容を知ることができます。PDFファイルの場合はさらに一手間必要ですが、全て翻訳する手間を考えると屁みたいなもんです。

それにしてもGoogle翻訳の精度は驚くほど向上しています。翻訳精度の向上にAI(人工知能)を活用しているとのことですが、あと数年もすれば人間が書いた文章と変わりないものが出てくるでしょう。

この調子だと、専門性や特技のある翻訳者以外は仕事がなくなりそうですね。進化のスピードに驚くばかりですが、その先の未来はどうなっているんでしょうか。Google翻訳の今後に注目です。

スポンサーリンク
PC用
PC用

フォローする