openSUSE 11: pdf in html konvertieren - Mindfactory Forum

Ankündigung

Einklappen
Keine Ankündigung bisher.

openSUSE 11: pdf in html konvertieren

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • openSUSE 11: pdf in html konvertieren

    Für diese Aufgabe gibt es das Programm pdftohtml . Diese bekommt Ihr für openSUSE 11 schon vorkompiliert aus einem Repository. Tragt dieses Repository unter YAST -> Software -> Software-Repositories ein.

    Code:
    Protokoll: http
    Server: download.opensuse.org
    Pfad: /repositories/home:/lrupp/openSUSE_11.0/


    Nun könnt Ihr in der YAST Softwareverwaltung nach pdftohtml suchen und das Programm installieren:



    Das Umsetzen eines pdf in html geht damit ziemlich einfach vonstatten. Kopiert das zu konvertierende pdf in ein Arbeitsverzeichnis. Jetzt wechselt in der Konsole als normaler User in dieses Verzeichnis und führt folgenden Befehl aus:
    Code:
    pdftohtml -c meinedatei.pdf meinedatei.html
    Das generiert aus dem meinedatei.pdf eine html Page. Hierbei wird jede Seite als eigene Page dargestellt, welche über einen Frame auf der linken Seite alle direkt aufrufbar sind. Möchte man alle Seiten in ein einziges html ohne Frame umgesetzt bekommen, dann ruft man den Befehl mit einem Schalter auf:


    Code:
    pdftohtml -c meinedatei.pdf meinedatei.html -noframes
    Weitere Schalter kann man sich über

    Code:
    pdfthhtml -h
    anzeigen lassen. Ein Beispiel für ein von pdf nach html konvertiertes Dokument findet Ihr unter folgender URL: Eigenbau

    Ein mögliches Anwendungsgebiet könnte natürlich auch in Kombination mit einer Texterkennungssoftware und dem Scanner sein. Hier könnten Dokumente, die eventuell nur noch in Druckform vorliegen als pdf umgewandelt und dann in html konvertiert werden.

    Viel Spaß beim Basteln!

    Euer
    Gargi
Lädt...
X