pdfのテキストを改行、ハイフンの削除などの前処理を行った状態でクリップボードにコピーできるようになります
Cast Paperは論文などのPDFファイルのテキストを翻訳する際に必要な前処理を行うための拡張機能です。
PDFファイルのテキストをコピーした場合、すべての段落の末尾に改行やハイフンが含まれてしまいます。Google翻訳やDeepLをはじめとした翻訳サイトでは、これらの余計な改行やハイフンを削除した状態でないと正しい結果を出力することができません。
Cast Paperでは任意の選択範囲から、余計な改行やハイフンの削除・置き換えを行い翻訳サイトが翻訳しやすい形式でクリップボードにコピーします。
Cast Paperをインストールするとテキスト選択時の右クリックメニュー内に「翻訳前処理をしてコピー」という項目が現れます。
「翻訳前処理をしてコピー」を実行すると改行記号の削除やハイフンの削除、置き換えを行った状態のテキストをクリップボードにコピーされます。
あとは通常の翻訳と同じでクリップボードにコピーしたテキストを翻訳サイトのテキストエリアにペーストすれば、より適切な翻訳結果を得ることができます。
これらの前処理を行うウェブサービスなどは存在していますが、Cast Paperでは通常のコピー&ペーストとほぼ同じ手順、手間で前処理を行うことを可能にします。
Cast Paperはオープンソースソフトウェアとして開発しています。
開発に協力してくださる方は以下のURLを参照してください。
https://github.com/Uno-Takashi/CastPaper
本アプリケーションは少数のサンプルにおいて検証を行っており、検証したサンプルに対しては十分な性能を有している事を確認していますが、すべてのPDFファイルに対して完璧な前処理が可能であるとは考えていません。もしも不具合を起こすようなPDFファイルのテキストパターンを発見した場合やそのほかの不具合を発見した場合は、お手数ではありますが以下のURLにあります開発者のツイッターへDMいただきますようお願い申し上げます。
Twitter
https://twitter.com/tks_uno
Statistics
Installs
732
history
Category
Rating
0.0 (0 votes)
Last update / version
2020-05-27 / 1.0
Listing languages
ja