[Document & Workflow] Pandoc: HTML を Markdown に変換する
オンライン版を少し探したが見つけられなかったので、Pandoc ですませた。
Contents
インストール
brew cask で入れた方がバージョンが新しい。
% brew cask info pandoc
pandoc: 1.12.3
http://johnmacfarlane.net/pandoc
Not installed
https://github.com/phinze/homebrew-cask/commits/master/Casks/pandoc.rb
==> Contents
pandoc-1.12.3.pkg (install)
% brew cask install pandoc
==> Downloading https://pandoc.googlecode.com/files/pandoc-1.12.3.pkg.zip
######################################################################## 100.0%
==> Running installer for pandoc; your password may be necessary.
Password:
==> installer: Package name is pandoc
==> installer: Installing at base path /
==> installer: The install was successful.
pandoc installed to '/opt/homebrew-cask/Caskroom/pandoc/1.12.3' (13 files, 17M)
つかいかた
a.html というファイルから、a.md という Markdown ファイルを生成する。
% pandoc -o a.md a.html
補遺
当ブログのエントリーを HTML => Markdown
形式へ変換してみましたが、以下のような問題が起きました。
- 意図しない書き方に変換される。
- Code が一部欠損する。
何も確認せずに自動変換、とはいかなさそうです。
追記:2015/04/07
markdown には方言があるので、pandoc の入力オプション -f/--from
と出力オプション -t/--to
を適切に指定すれば問題なく変換できたかも知れないですね。
- markdown (Pandocによる拡張Markdown)
- markdown_strict (オリジナルの拡張されていないMarkdown)
- markdown_phpextra (PHP Markdown Extraによる拡張Markdown)
- markdown_github (GitHubによる拡張Markdown)
ブラウザで HTML を Markdown に変換する
追記:2014/05/15
サービスを見つけました。