pdftotext

大量の英文PDF(要は論文)をtext形式に変換する必要に駆られました.
Acrobatで[ファイル]→[名前を付けて保存]として,ファイルの種類を[Text(Plain)]にする方法もあります.でもPDFファイルが大量にあると変換作業が超めんどくさいのです.そこでコマンドラインツールからpdfをtextに変換できるツールを発見.早速使用してみました.
XpdfというX ウィンドウ上で動作する PDF ビューアに含まれているpdftotextというツールです.

$ pdftotext sample.pdf

としてやると,sample.txtというテキストファイルが作成されます.

$ pdftotext *.pdf

で一発変換!もできてしまいます.
参考URL
http://www.mlb.co.jp/linux/science/xpdf/
http://www.mlab.t.u-tokyo.ac.jp/~saru/archives/000072.php