読者です 読者をやめる 読者になる 読者になる

PDFをテキスト/HTMLに変換する

PDF

SoftBank技術資料のページ公開されている資料は、かなりのページ数があるPDFで、開くのにうんざりし、引用しようとするとさらにうんざりする代物ですが、pdftotextで変換すれば結構快適に読めるかも。

SoftBank技術資料
http://developers.softbankmobile.co.jp/dp/tool_dl/web/tech.php


Fedoraならばyumでxpdfを入れて、

$ sudo yum install xpdf

pdftotextで変換。

$ pdftotext 104-011-XHTML_2.0.0.pdf

これだけだと読みにくいので、適宜-layoutオプション(オリジナルに近いレイアウトにする)や-htmlmetaオプション(出力をHTMLにする)をつける。

$ pdftotext -layout -htmlmeta 104-011-XHTML_2.0.0.pdf

参考ページ
http://www.atmarkit.co.jp/flinux/rensai/linuxtips/745textfpdf.html