Ebben a cikkben áttekintjük a Markdown [1] és a DOCX - a Microsoft Word 2007 óta használt natív dokumentumformátuma - közötti konverziót. Kíváncsi lehet, miért foglalkozik a Markdown és az Asciidoc rajongója (mint én) ezzel az esettel. Nos, más írók csoportjával való együttműködés helyzethez vezethet, míg egy vagy több résztvevő DOCX-t kér kimeneti formátumként. Ne hagyjon cserben senkit, és derítse ki, hogy mely korlátozások vannak, és hogyan próbálhatjuk meg boldoggá tenni a csoport minden tagját.
Mi a Markdown?
Amint azt a „Bevezetés a Markdown-ba” [2] már rámutatott, a Markdown szándéka egyszerű szöveges HTML átalakítás. Az ötlet az volt, hogy a weboldalak, dokumentációk és különösen a blogbejegyzések írása ugyanolyan egyszerűvé váljon, mint az e-mail írása. A mai naptól kezdve ez a tényleges szinonimája a könnyű jelölő leíró nyelvek osztályának, és a cél elérhetőnek tekinthető.
A Markdown egyszerű szöveges formázási szintaxist használ. A HTML-hez hasonló megközelítéssel számos jelölő a címsorokat, listákat, képeket és hivatkozásokat jelzi a szövegben. Az alábbi néhány sor egy olyan alapdokumentumot illusztrál, amely két címsort (1. és 2. szint), valamint két bekezdést és listakörnyezetet tartalmaz.
## Franciaország
Ez egy válogatott hely:
* Párizs (_Ile de France_)
* Strasbourg (_Alsace_)
Megfelelő látogatási tervhez kb. Egy hét.
Átalakítás DOCX-re
A Markdown dokumentum DOCX formátumba konvertálásához használja a pandoc eszközt [3]. A Pandoc egy Haskell-könyvtár, és „univerzális dokumentum-átalakítónak”, vagy „svájci késnek a dokumentumok átalakításához” írja le magát. Különféle platformokon érhető el, például Linux, Microsoft Windows, Mac OS X és BSD. A Pandoc rendszerint olyan Linux disztribúciók csomagjaként szerepel, mint a Debian GNU / Linux, az Ubuntu és a CentOS.
Az átalakítás egyszerű felhívása a következő:
$ pandoc -o teszt.docx teszt.mdAz első '-o' paraméter a kimeneti fájlra vonatkozik, amelyet a fájl neve követ ('test.docx '). A fájlkiterjesztés segíti a pandoc-ot a kívánt kimeneti formátum azonosításában. A második paraméter megnevezi az input fájlt - esetünkben egyszerűen 'teszt.md '.
A fenti parancs hosszú verziója tartalmazza a két paramétert: '-f markdown' és '-t docx'. Az első rövidíti az „aroma” kifejezést, és leírja a bemeneti fájl formátumát. A második ugyanezt teszi a kimeneti fájlnál, és rövidíti a '-to'.
A teljes parancs a következő:
$ pandoc -o teszt.docx -f markdown -t docx teszt.mdAz átalakított fájl Microsoft Word alkalmazással történő megnyitása a következő kimenetet eredményezi:
A különböző szövegelemekhez a Pandoc stíluslapokat használ. Ez lehetővé teszi, hogy ezeket az elemeket később az igényeinek megfelelően módosítsa az egész dokumentumban. A Pandoc újabb verziói fordítva is kínálják - a DOCX fájlokat a következőképpen konvertálhatja Markdownra:
$ pandoc -o teszt.md teszt.docxEzután a létrehozott fájl a következő tartalommal rendelkezik:
Ajánlott látnivalók Európában=====================================
Franciaország
------
Ez egy válogatott hely:
- Párizs (* Ile de France *)
- Strasbourg (* Elzász *)
Egy megfelelő látogatási tervhez körülbelül egy hét.
Hasznos parancssori opciók
A Pandoc opciók listája meglehetősen hosszú. A következők segítenek jobb eredmények elérésében, és sokkal könnyebbé teszik életét:
* '-P' (hosszú változat '-preserve-tabs'): A fülek megőrzése ahelyett, hogy szóközekké konvertálná őket. Ez akkor hasznos, ha kódblokkok vannak behúzott sorokkal, amelyek a szöveg részét képezik.
* '-S' (hosszú változat '-smart'): tipográfiailag helyes kimenetet készít.
Ez az opció korrigálja az idézőjeleket, kötőjeleket / kötőjeleket, valamint az ellipsziseket („…”). További, nem törő szóközöket adunk hozzá bizonyos rövidítések után, például: „Mr.”.
* '-track-changes = value': Megadja, hogy mit kell kezdeni a beillesztésekkel, törlésekkel és megjegyzésekkel, amelyeket a Microsoft Word „Változások követése” szolgáltatásával hoztak létre. Az érték lehet elfogadni, elutasítani, vagy mindez a dokumentumban végrehajtott változtatások beillesztése vagy eltávolítása érdekében. Az eredmény egy lapos fájl.
További lehetőségekért tekintse meg a dokumentációt és a Pandoc kézikönyv oldalát.
Összegzés
A Markdown és a DOCX közötti átalakítás már nem rejtély. Néhány lépésen belül elkészül, és nagyon jól működik. Boldog hackelés 🙂
Linkek és hivatkozások
* [1] Jelölés
* [2] Frank Hofmann: Bevezetés a Markdownba
* [3] Pandoc
Köszönetnyilvánítás
A szerző köszönetet mond Annette Kalbow-nak a cikk elkészítése során nyújtott segítségéért.