Apache Tika ist eine Bibliothek zur Dateityperkennung und Inhaltsextraktion aus Dateien verschiedener Formate. Beim Hochladen und Analysieren von Dateien auf einen Server müssen Sie häufig feststellen, ob die Dateien beschädigt sind. Wir können Tika verwenden, um festzustellen, ob die Datei beschädigt ist Maven wird wie folgt eingeführt: <Abhängigkeit> <groupId>org.apache.tika</groupId> <artifactId>tika-app</artifactId> <version>1.18</version> </Abhängigkeit> <Abhängigkeit> <groupId>xerces</groupId> <artifactId>xercesImpl</artifactId> <version>2.11.0</version> </Abhängigkeit> Wenn es einen Konflikt in den JAR-Paketen gibt, können Sie diese wie folgt einführen: <Abhängigkeit> <groupId>org.apache.tika</groupId> <artifactId>tika-Kern</artifactId> <version>1.18</version> </Abhängigkeit> <Abhängigkeit> <groupId>org.apache.tika</groupId> <artifactId>Tika-Parser</artifactId> <version>1.18</version> </Abhängigkeit> <Abhängigkeit> <groupId>xerces</groupId> <artifactId>xercesImpl</artifactId> <version>2.11.0</version> </Abhängigkeit> Verwenden Sie Tika, um festzustellen, ob die Datei beschädigt ist: Wenn das Lesen aus dem Eingabestream fehlschlägt, löst die Parse-Methode eine IOException aus. Wenn das aus dem Stream erhaltene Dokument nicht geparst werden kann, wird eine TikaException ausgelöst. Wenn der Prozessor das Ereignis nicht verarbeiten kann, wird eine SAXException ausgelöst. Wenn ein Dokument nicht analysiert werden kann, ist das Dokument beschädigt. Ausführungsprozess: öffentliche statische void main(String[] args) { versuchen { //Angenommen, sample.txt befindet sich in Ihrem aktuellen Verzeichnis Datei Datei = neue Datei("D:\\Test.txt"); boolesches Ergebnis = isParseFile(Datei); } Fang (Ausnahme e) { e.printStackTrace(); } } /** * Überprüfen Sie, ob die Datei beschädigt ist* * @param Datei Datei * @return true/false * @throws Ausnahme */ private static boolean isParseFile(File file) löst Exception aus { versuchen { Tika tika = neue Tika(); String Dateiinhalt = tika.parseToString(Datei); System.out.println(Dateiinhalt); gibt true zurück; } Fang (TikaException e) { gibt false zurück; } } Ausgabe:
Zusammenfassen Oben ist die Methode von Apache Tika, um festzustellen, ob die Datei beschädigt ist. Ich hoffe, sie wird Ihnen helfen. Wenn Sie Fragen haben, hinterlassen Sie mir bitte eine Nachricht und ich werde Ihnen rechtzeitig antworten. Ich möchte auch allen für ihre Unterstützung der Website 123WORDPRESS.COM danken! Das könnte Sie auch interessieren:
|
<<: Ant entwirft eine Vue-Tabelle, um ein vollständiges Beispiel skalierbarer Spalten zu erhalten
>>: Probleme bei der Installation von MySQL 8.0 und beim Zurücksetzen des Kennworts
Das mit CLI3 erstellte Vue-Projekt wird als Nullk...
In diesem Artikel wird der spezifische JavaScript...
CentOS 8 ist offiziell veröffentlicht! CentOS ent...
„HTML-Validierung“ bezieht sich auf die HTML-Valid...
Aus verschiedenen Gründen (einschließlich Neugier...
Code kopieren Der Code lautet wie folgt: <html...
Vorwort Normaler Geschäftsbedarf: Hochladen von B...
Gehen Sie zu https://dev.mysql.com/downloads/mysq...
Installieren Sie MySQL 8.0 docker run -p 63306:33...
Nach einer langen Zeit der Transplantation und In...
Inhaltsverzeichnis Speicherpoolübersicht 1. Nginx...
Binärprotokoll der Hauptbibliothek: # bei 2420 #1...
Inhaltsverzeichnis Vorwort Funktionale React-Komp...
Inhaltsverzeichnis Erstellen eines SSL-Zertifikat...
Negative Distanz bezieht sich auf Empathie. Vorwo...