Google翻訳で英文PDFやWordファイルを翻訳 改行修正でPDF翻訳精度が向上

スポンサーリンク
スポンサーリンク

google翻訳

Google翻訳は英語や中国語など、世界各国の言語を日本語に変換してくれるとても便利なツールです。使い方はとても簡単で、翻訳したいテキストやURLをそのまま入力するだけです。

また、Google翻訳はテキスト入力だけでなく、PDFファイルやWordファイルなどのドキュメント文書をそのまま翻訳する機能もあります。英語の論文など長めの文書を翻訳する場合は、この機能を使うと便利です。

しかし、PDFファイルをそのまま翻訳すると、余計な改行が入るため翻訳精度が下がります。これを変換ツールで修正して、PDFの翻訳精度を向上させる方法もご紹介します。

以下の「Google翻訳」カテゴリで、Google翻訳の便利な使い方をたくさん紹介しています。

google翻訳の使い方 スマホアプリ活用方法
Googleが提供する便利な翻訳サービス「Google翻訳」の使い方や活用方法に関する記事一覧です。URLを入力するだけでウェブサイト全体を翻訳してくれる翻訳サービス「Google翻訳」の使い方、スマホアプリ版Google翻訳の使い方などを紹介しています。
スポンサーリンク

Google翻訳 PDFファイルやWordファイルを翻訳

では、さっそくGoogle翻訳にPDFファイルを読み込ませて翻訳してみましょう。Google翻訳は以下からアクセスしてください。

Google 翻訳
Google の無料サービスなら、単語、フレーズ、ウェブページを英語から 100 以上の他言語にすぐに翻訳できます。

まずは入力ウィンドウの下にある「ドキュメントを翻訳します。」をクリックします。

google翻訳 ドキュメントを翻訳

「ファイルを選択」で翻訳したいPDFファイルを選び、右側の「翻訳」をクリックしてください。

google翻訳 pdfファイルを翻訳

PDF内の文章が翻訳されました。翻訳されたPDFファイル内の画像や装飾、表組みは除外され、テキストだけが表示されます。複数ページがある場合は、ページごとに区切りができます。

翻訳したPDFファイルは、The Institute for Social Justice (ISJ) Pakistan の「Investment in the rights of the child in Pakistan」を使いました。

google翻訳 pdfファイル翻訳結果

翻訳された文章は何となく理解できますが、翻訳精度はイマイチですねぇ。これはPDF内に余計な改行が入って、文章の区切りがおかしくなるためです。

なお、一度に読み込めるPDFファイルの容量は5MBまでとなっています。大量のPDFファイルを読み込ませる場合は、事前に分割するなどの対応が必要です。

google翻訳でWordファイルを翻訳

Wordファイルも同様の手順で翻訳できます。.doc等のWordファイルを選択して翻訳をクリックすると、ファイル内の文章が翻訳されます。

google翻訳 Wordファイル翻訳結果

Wordファイルには余計な改行が入らないので、文章が正しく翻訳されます。ところどころ違和感が残るものの、全体的にはちゃんと意味の分かる内容に翻訳されていますね。

翻訳したWordファイルは、The Institute for Social Justice (ISJ) Pakistan の「Child Marriages in Pakistan」です。

改行が原因 PDFファイルの翻訳精度は低い

さて、これでPDFやWordファイルをそのまま翻訳できることがわかりました。でも、今回試したPDFファイルとWordファイルの翻訳精度を見ると、明らかにPDFファイルの方が劣っています。

これはPDFファイルを読み込む時に余計な改行が入るため、文章の区切りがおかしくなって内容を正しく理解できないからです。Wordは改行が入らないので、正確に翻訳されています。

実際の例を見てみましょう。先ほどのPDFを一部抜粋して翻訳します。英語の原文はこちらです。

In 2009, the Committee on the Rights of the Child in its Concluding Observations and Recommendations against Pakistan’s 3rd and 4th combined periodic report to the UNCRC welcomed Pakistan’s pledge to increase allocation of resources for children especially in the field of health and education.

PDFファイルからgoogle翻訳にコピペすると、改行がそのまま残るので何となく不自然な文章になります。

google翻訳 pdfファイル翻訳精度

2009年に、子どもの権利に関する委員会は、その終わりの観察と勧告
パキスタンの3回目と4回目のUNCRCへの定期報告書に対するパキスタンの約束を歓迎した
特に保健や教育分野の子どもたちのための資源の配分を増やす。

改行を修正するとこうなります。かなりまともな翻訳になりましたね。

google翻訳 pdfファイル翻訳精度

2009年、UNCRCへのパキスタンの第3回と第4回の定期的な報告をまとめた、子どもの権利に関する委員会は、パキスタンの保健と教育の分野における子供のための資源の配分を増やすという約束を歓迎した。

google翻訳 改行を除外してPDF論文の翻訳精度を上げる

PDF論文の翻訳精度を上げるためには、PDF内の改行を修正すればよいことがわかりました。ただ、長い論文になると、いちいち手作業で修正していくのはとても大変ですね。

そこでオススメのツールを紹介します。テキストを入力して「自動改行」するだけで余計な改行を取り除き、ピリオド(.)の後だけ改行が入るように文章を修正してくれる「google翻訳のための英語論文(pdf文書)の文末整形ツール」です。

長いテキストでもご覧の通り、ちゃんと改行を取り除いて文章を修正してくれます。あとは修正済みのテキストをgoogle翻訳に入力すればOKです。これは便利ですね~

google翻訳のための英語論文(pdf文書)の文末整形ツール

このツールには違和感のある語句をあらかじめ変換できる「オリジナル置換語句」や、文字数をカウントする機能もあります。

英語の論文やレポートが苦手な方でも、Google翻訳を使うと簡単に内容を知ることができます。PDFファイルの場合は改行の修正が必要ですが、これぐらいなら手間のうちに入りません。

それにしてもGoogle翻訳の精度は驚くほど向上しています。AI(人工知能)を活用して翻訳精度を向上させていますが、あと数年もすれば人間が書いた文章と変わらないものが出てくるでしょう。

この調子だと、専門性や特技のある翻訳者以外は仕事がなくなりそうですね。進化のスピードに驚くばかりですが、その先の未来はどうなっているんでしょうか。Google翻訳の今後に注目です。

タイトルとURLをコピーしました