はじめに

ドキュメント変換ツールのpandocについてメモします。
markdownで書いたドキュメントをlatexやwordファイルに変換したり、その逆変換をしたりができます。
wordのバイナリの場合、gitでコミットして差分が確認できないですが、markdownなどで作成すれば確認できるようになります。
レイアウトも考えて作るのが面倒でとりあえずテキストをって場合にmarkdownで書いてあとから、レイアウトはwordかlatexなどと言う風に使うことができます。

公式サイト
https://pandoc.org/

日本語ガイド
http://sky-y.github.io/site-pandoc-jp/users-guide/

リポジトリ
https://github.com/jgm/pandoc

pandoc概要

Pandocは Haskell で書かれたライブラリおよびコマンドラインツールであり、 あるマークアップ形式で書かれた文書を別の形式へ変換するものです。

対応している入力形式は以下の通りです

markdown
Textile (のサブセット、以下同様)
reStructuredText
HTML
LaTeX
MediaWiki markup
Haddock markup
OPML
Emacs Org-mode
DocBook
出力形式は以下の通りです:

プレーンテキスト
markdown
reStructuredText
XHTML
HTML 5
LaTeX (beamerスライドショーを含む)
ConTeXt
RTF
OPML
DocBook
OpenDocument
ODT
Word docx
GNU Texinfo
MediaWiki markup
EPUB (v2またはv3)
FictionBook2
Textile
groff manページ
Emacs Org-Mode
AsciiDoc
InDesign ICML
HTMLスライドショー:Slidy、Slideous、DZSlides、reveal.js、S5
PDF出力(LaTeXがインストールされているシステムで使用できます)

引用:http://sky-y.github.io/site-pandoc-jp/users-guide/

macにpandocインストール

homebrewでインストールします。

$ brew install pandoc

きれいなレイアウトのwordに変換

markdownで書いたものをそのままwordにpandocで変換しても、レイアウトが綺麗にはなりません。
そのため一度ワードでスタイルやヘッダー、フッターなど作ったテンプレートのwordを用意して、それをベースにmarkdownからwordにすると綺麗にレイアウトも整います。
もっとレイアウトをきちんとしたい場合はlatexを使うといいと思います。

markdownからテンプレートのwordをベースにword作成

hoge.mdファイルをtemplate.docxのスタイルをベースにcomplete.docxを作ります

$ pandoc hoge.md –reference-docx=template.docx -s -o complete.docx

wordからmarkdown変換

hoge.docxからhoge.mdを作ります。(word→markdown)

$ pandoc hoge.docx -t markdown-raw_html-native_divs-native_spans -o hoge.md

一度wordのファイルで序盤だけ作り、markdownに変換してからそれを追加で作成するとあとでword変換するときにレイアウト崩れを防げると思います。

その他おすすめの備忘録

Tagged with:
 

Comments are closed.