{"id":4797,"date":"2011-11-25T23:28:37","date_gmt":"2011-11-25T22:28:37","guid":{"rendered":"https:\/\/www.gambaru.de\/blog\/?p=4797"},"modified":"2019-10-16T14:38:43","modified_gmt":"2019-10-16T12:38:43","slug":"ein-freier-blick-auf-office-dokumente","status":"publish","type":"post","link":"https:\/\/gambaru.de\/blog\/2011\/11\/25\/ein-freier-blick-auf-office-dokumente\/","title":{"rendered":"Ein freier Blick auf Office-Dokumente"},"content":{"rendered":"<p>MS-Office-Dokumente per E-Mail zu erhalten kann in der Regel nur Arbeit bedeuten. Doch bevor man sie aus Reflex oder Angewohnheit dem elektronischen M\u00fcll \u00fcberantwortet, ist es manchmal doch kl\u00fcger vorher noch einen Blick hinein zu werfen. Es k\u00f6nnte ja wichtig sein.<br \/>\nSeit meinem Umstieg auf Linux benutze ich Freie Software, die in standardisierte Formate abspeichert. Es ist schon merkw\u00fcrdig, dass das <a href=\"http:\/\/de.wikipedia.org\/wiki\/OpenDocument\">Open-Document-Format<\/a> ein quelloffener Standard ist, Microsofts weit verbreitetes Doc- und Docx-Format aber nicht. Darum scheren sich aber die wenigsten Leute. F\u00fcr viele erscheint es zwar selbstverst\u00e4ndlich zu sein, dass man nicht mehr mit Elle, Zoll, Spanne oder Klafter misst, mittelalterliche Praktiken bei Dateiformaten nimmt man aber mehr oder weniger gelassen hin.<br \/>\nAuf meiner Festplatte tummeln sich immer noch alte Word-Perfect-Dokumente, die ich irgendwann noch einmal in ein freies Odt-Format umwandeln m\u00f6chte, wenn ich mich nicht doch endlich entschlie\u00dfe den alten Kram nach \/dev\/null zu verschieben. \ud83d\ude44<br \/>\nIn der Regel habe ich auf dem leistungsf\u00e4higsten Rechner <a href=\"http:\/\/de.libreoffice.org\/\">LibreOffice<\/a> installiert, mit dem ich bisher immer alle Formate \u00f6ffnen konnte und nat\u00fcrlich gibt es auch noch das PDF-Format, um den Kompatibilit\u00e4tswahnsinn ein wenig zu umgehen.<br \/>\nIch muss aber nicht auf jedem Rechner eine vollwertige Office Suite installiert haben. F\u00fcr diesen Fall habe ich mir angew\u00f6hnt eine leichtere Alternative zu installieren, die mir lediglich den Inhalt eines Dokuments anzeigt. F\u00fcr Doc-Dokumente ist das nach wie vor <a href=\"http:\/\/www.winfield.demon.nl\/\">antiword<\/a>, obwohl dieses kleine aber feine Programm seit 2005 nicht mehr weiterentwickelt wird. Als Konsolenalternative f\u00fcr das freie Odt-Format oder das \u00e4ltere Sxw benutze ich bei Debian <a href=\"http:\/\/packages.debian.org\/odt2txt\">odt2txt<\/a>. Beide sind \u00e4u\u00dferst anspruchslos an die Hardware und mit beiden l\u00e4sst sich der Inhalt von Doc- oder Odt-Dateien anzeigen. Besonders gut spielen beide auch mit dem Text-E-Mail-Programm <a href=\"https:\/\/www.gambaru.de\/blog\/2010\/08\/14\/alpine-in-funf-minuten\/\">Alpine<\/a> zusammen, in dem die Doc- und Odt-Anh\u00e4nge automatisch im Textformat angezeigt werden.<br \/>\nEine Alternative f\u00fcr \u00e4ltere Word-Dokumente kann ebenfalls <a href=\"http:\/\/packages.debian.org\/wv\">wv<\/a> sein, welches auch nach HTML, LaTeX oder PDF konvertieren kann. G\u00e4be es nun nicht noch das Docx-Format, ich k\u00f6nnte an dieser Stelle schon Schluss machen. Bis auf ein kleines Perl-Skript namens <a href=\"http:\/\/sourceforge.net\/projects\/docx2txt\/\">docx2txt<\/a> habe ich bisher noch kein reines Konsolenprogramm gefunden, welches mir wie bei Antiword einfach nur den Inhalt als Text ausgibt oder diesen sogar in PDF umwandeln kann. Jedoch funktioniert docx2txt f\u00fcr mich leider nicht.<br \/>\nBisher war deshalb auch mein einziger Ausweg aus dem Dilemma LibreOffice zum Betrachten zu benutzen oder besser gesagt <a href=\"http:\/\/packages.debian.org\/unoconv\">unoconv<\/a>, ein Werkzeug f\u00fcr die Kommandozeile, mit dem es z.B auch m\u00f6glich ist PowerPoint-Folien zur schnellen Ansicht in PDF umzuwandeln.<\/p>\n<p><code>unoconv -f pdf wiewirdmanmillionaer.ppt<\/code><\/p>\n<p><code><\/code>Leider l\u00e4sst es sich nicht alleine installieren und ben\u00f6tigt zum Funktionieren Teile der LibreOffice Suite.<br \/>\nIch habe mich deswegen im IRC in #debian auf irc.debian.org nach weiteren L\u00f6sungsm\u00f6glichkeiten umgeh\u00f6rt und zumindest noch eine interessante gefunden, wie man den Inhalt einer Docx-Datei auf der Konsole als Text darstellen kann.<br \/>\nDa Docx ein gezipptes Format ist, l\u00e4sst es sich mit <code>unzip MeineDatei.docx<\/code> entpacken. Im Ordner <em>word<\/em> befindet sich danach der Hauptteil des Dokuments in der Datei <em>document.xml<\/em>. Mit Hilfe von <strong>xmllint<\/strong>, das im Paket <a href=\"http:\/\/packages.debian.org\/libxml2-utils\">libxml2-utils<\/a> mitgeliefert wird, kann der Inhalt in ein Html-Format umgewandelt und z.B. mit dem Textbrowser <a href=\"https:\/\/www.gambaru.de\/blog\/2011\/06\/17\/der-universelle-browser-elinks\/\">elinks<\/a> angeschaut werden.<\/p>\n<p><code>xmllint --html document.xml &gt; document.html<\/code><br \/>\n<code>elinks document.html<\/code><\/p>\n<p>Wie schon erw\u00e4hnt geh\u00f6ren Anwendungen f\u00fcr die Konsole zum Arbeiten mit Tabellenkalkulation und Pr\u00e4sentationen <a href=\"https:\/\/www.gambaru.de\/blog\/2011\/11\/20\/textverarbeitung-tabellenkalkulation-und-prasentation-auf-der-konsole\/\">(noch) nicht zu meinen Schwerpunkten<\/a> und solange sich das nicht \u00e4ndert, werde ich auch nicht so tun als w\u00e4re es so. F\u00fcr den schnellen Blick in Office-Dokumente gen\u00fcgen mir aber die vorgestellten Programme und wer nach weiteren Ausschau halten m\u00f6chte, findet in den Quellen auf der <a href=\"https:\/\/www.gambaru.de\/blog\/software\/\">Software<\/a>-Seite und insbesondere auf <a href=\"http:\/\/www.jaredandcoralee.com\/CLIapps.html\">jaredandcoralee.com<\/a> unter der \u00dcberschrift \"Document Converter\" noch einige interessante Alternativen.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>MS-Office-Dokumente per E-Mail zu erhalten kann in der Regel nur Arbeit bedeuten. Doch bevor man sie aus Reflex oder Angewohnheit dem elektronischen M\u00fcll \u00fcberantwortet, ist es manchmal doch kl\u00fcger vorher noch einen Blick hinein zu werfen. Es k\u00f6nnte ja wichtig sein. Seit meinem Umstieg auf Linux benutze ich Freie Software, die in standardisierte Formate abspeichert. &hellip; <\/p>\n<p class=\"link-more\"><a href=\"https:\/\/gambaru.de\/blog\/2011\/11\/25\/ein-freier-blick-auf-office-dokumente\/\" class=\"more-link\"><span class=\"screen-reader-text\">\u201eEin freier Blick auf Office-Dokumente\u201c<\/span> weiterlesen<\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[6],"tags":[14,53,106,142],"_links":{"self":[{"href":"https:\/\/gambaru.de\/blog\/wp-json\/wp\/v2\/posts\/4797"}],"collection":[{"href":"https:\/\/gambaru.de\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/gambaru.de\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/gambaru.de\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/gambaru.de\/blog\/wp-json\/wp\/v2\/comments?post=4797"}],"version-history":[{"count":1,"href":"https:\/\/gambaru.de\/blog\/wp-json\/wp\/v2\/posts\/4797\/revisions"}],"predecessor-version":[{"id":10940,"href":"https:\/\/gambaru.de\/blog\/wp-json\/wp\/v2\/posts\/4797\/revisions\/10940"}],"wp:attachment":[{"href":"https:\/\/gambaru.de\/blog\/wp-json\/wp\/v2\/media?parent=4797"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/gambaru.de\/blog\/wp-json\/wp\/v2\/categories?post=4797"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/gambaru.de\/blog\/wp-json\/wp\/v2\/tags?post=4797"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}