So verwenden Sie LibreOffice zum Konvertieren von Dokumentformaten unter CentOS

So verwenden Sie LibreOffice zum Konvertieren von Dokumentformaten unter CentOS

Die Projektanforderungen erfordern eine gewisse Vorverarbeitung der hochgeladenen Dokumente. Wenn der Benutzer ein Dokument im doc-Format hochlädt, muss es in das docx- oder pdf-Format verarbeitet werden, damit der nachfolgende Prozess den Dokumentinhalt extrahieren kann.

Ich habe zuerst das Paket phpoffice/phpword ausprobiert und festgestellt, dass die Konvertierung von doc nicht optimal ist. Dieses Paket eignet sich eher zum Generieren von Dokumenten basierend auf Inhalten als zum Konvertieren von Dokumenten, was meinen Anforderungen nicht sehr entspricht.

Dann entdeckte ich das Open-Source-Tool LibreOffice. Nachdem ich es ausprobiert hatte, fand ich es sehr effektiv und möchte es daher mit Ihnen teilen.

Der Server ist CentOS7. Verwenden Sie yum, um LibreOffice direkt zu installieren. Es benötigt über 600 MB Speicherplatz:

# Sie können es vor der Installation löschen, um eine vorherige Installation zu verhindern. yum remove libreoffice-*
yum installiere LibreOffice

Nachdem Sie gewartet haben, bis die Installation abgeschlossen ist, bestätigen Sie die Version. Obwohl die offizielle Version 6.1 ist, ist das Yum-Paket immer noch 5.3.6, aber es gibt keine Probleme bei der Verwendung. Hier empfehle ich dennoch, dass Sie zur Installation Ihr eigenes Linux-Systempaketverwaltungstool verwenden, was viel Ärger ersparen kann.

[root@localhost /]# soffice --version
LibreOffice 5.3.6.1 30 (Build: 1)

Wenn Sie nicht wissen, wie Sie es verwenden sollen, können Sie soffice --help verwenden, um die Hilfe anzuzeigen. Es gibt viele Parameter und Anwendungsfälle. Die Formatkonvertierung ist sehr einfach:

soffice --headless --convert-to docx /opt/upload/source/123.doc --outdir /opt/upload/source

Der obige Befehl konvertiert die Datei /opt/upload/source/123.doc in das docx-Format und gibt sie im Ordner / opt/upload/source aus.

Standardmäßig:

  1. Die Ausgabedatei wird mit dem Quelldateinamen + neuer Erweiterung gespeichert;
  2. Dadurch wird die vorhandene Datei mit demselben Namen im Outdir überschrieben.

Bei einer erfolgreichen Konvertierung wird etwa Folgendes ausgegeben:

Konvertieren Sie /opt/upload/source/123.doc -> /opt/upload/source/123.docx mithilfe des Filters: MS Word 2007 XML
Überschreiben: /opt/upload/source/123.docx

LibreOffice passt den Formatfilter automatisch an das Dateiformat an. Informationen zu den unterstützten Formaten finden Sie auf der offiziellen Website.

Zusammenfassen

Das Obige ist die Einführung des Herausgebers in die Methode zur Verwendung von LibreOffice unter CentOS zur Konvertierung von Dokumentformaten. Ich hoffe, es wird für alle hilfreich sein. Wenn Sie Fragen haben, hinterlassen Sie mir bitte eine Nachricht und ich werde Ihnen rechtzeitig antworten. Ich möchte auch allen für ihre Unterstützung der Website 123WORDPRESS.COM danken!
Wenn Sie diesen Artikel hilfreich finden, können Sie ihn gerne abdrucken und dabei bitte die Quelle angeben. Vielen Dank!

Das könnte Sie auch interessieren:
  • Demonstration des Erstellens von ElasticSearch-Middleware und gemeinsamen Schnittstellen unter CentOS7 im Linux-System
  • Zusammenfassung gängiger Befehle zum Erstellen von ZooKeeper3.4-Middleware unter CentOS7

<<:  Tutorial zur Installation und Konfiguration des mysql8.0-ZIP-Pakets für Windows x64

>>:  So implementieren Sie die Kommunikation zwischen übergeordneten und untergeordneten Komponenten mit Vue

Artikel empfehlen

Natives JS zum Erstellen eines verschiebbaren Anmeldefelds

Dieser Artikel zeigt ein verschiebbares Anmeldefe...

Vue implementiert Drag-Fortschrittsbalken

In diesem Artikelbeispiel wird der spezifische Co...

Verwandte Befehle zur vollständigen Deinstallation von Nginx unter Ubuntu 16.04

nginx Übersicht nginx ist ein kostenloser, quello...

Zusammenfassung der Erfahrungen mit der Web-Frontend-Entwicklung

XML-Dateien sollten so weit wie möglich in UTF-8 ...

Ein einfaches Beispiel für die Verwendung von Vue3-Routing VueRouter4

Routenplanung vue-router4 behält den Großteil der...

Zusammenfassung des MySQL-Installationsdiagramms

Grafisches Tutorial zur Installation und Konfigur...

Einführung in die wichtigsten Browser und ihre Kernel

Trident-Kern: IE, MaxThon, TT, The World, 360, So...

Welche Funktion ist !-- -- im HTML-Seitenstil?

Hauptsächlich für Browser mit niedriger Version &l...

Über das Problem der vertikalen Zentrierung von img und span in div

Wie unten dargestellt: XML/HTML-CodeInhalt in die...

Detaillierte Erläuterung der grundlegenden Docker-Netzwerkkonfiguration

Externer Zugriff Ports nach dem Zufallsprinzip zu...