Die Magie des tr-Befehls beim Zählen der Häufigkeit englischer Wörter

Die Magie des tr-Befehls beim Zählen der Häufigkeit englischer Wörter

Wir alle kennen den Befehl tr, mit dem Ersetzungen gelöscht und Zeichenfolgen gelöscht werden können. Im Englischen müssen wir oft die Häufigkeit von Wörtern zählen, die im Englischen vorkommen. Wenn wir die herkömmliche Methode verwenden und einen Rechner einrichten, um sie einzeln zu zählen, ist dies ziemlich zeitaufwändig. Verwenden Sie zu diesem Zeitpunkt den Befehl tr, um das Leerzeichen durch ein Zeilenumbruchzeichen zu ersetzen, und verwenden Sie dann den Befehl tr, um den Punkt, das Komma und das Ausrufezeichen nach einigen Wörtern zu löschen. Schauen Sie sich zunächst die zu ersetzende Datei this.txt an

Das Zen von Python, von Tim Peters
Schön ist besser als hässlich.
Explizit ist besser als implizit.
Einfach ist besser als komplex.
Komplex ist besser als kompliziert.
Flach ist besser als verschachtelt.
Spärlich ist besser als dicht.
Auf die Lesbarkeit kommt es an.
Sonderfälle sind nicht speziell genug, um die Regeln zu brechen.
Obwohl Zweckmäßigkeit wichtiger ist als Reinheit.
Fehler sollten niemals unbemerkt bleiben.
Sofern nicht ausdrücklich zum Schweigen gebracht.
Widerstehen Sie bei Unklarheiten der Versuchung, zu raten.
Es sollte einen – und vorzugsweise nur einen – offensichtlichen Weg geben, dies zu tun.
Obwohl dieser Weg möglicherweise nicht auf den ersten Blick offensichtlich ist, es sei denn, Sie sind Niederländer.
Jetzt ist besser als nie.
Obwohl „nie“ oft besser ist als „jetzt sofort“.
Wenn die Implementierung schwer zu erklären ist, ist es eine schlechte Idee.
Wenn die Implementierung leicht zu erklären ist, kann es eine gute Idee sein.
Namespaces sind eine wirklich tolle Idee – lasst uns mehr davon machen!

Wenn Sie für die obige Textdatei die 10 Wörter zählen möchten, die am häufigsten im Text vorkommen, können Sie den folgenden Befehl verwenden

[root@linux ~]# cat this.txt | tr ' ' '\n' | tr -d '[.,!]' | sortieren | uniq -c | sortieren -nr | head -10
10 ist
8 besser
8 als
5 bis
5 die
3 von
3 Obwohl
3 nie
3 sein
3 eins

Es ist sehr praktisch!

Zusammenfassen

Das Obige ist der vollständige Inhalt dieses Artikels. Ich hoffe, dass der Inhalt dieses Artikels einen gewissen Lernwert für Ihr Studium oder Ihre Arbeit hat. Vielen Dank für Ihre Unterstützung von 123WORDPRESS.COM. Wenn Sie mehr darüber erfahren möchten, schauen Sie sich bitte die folgenden Links an

Das könnte Sie auch interessieren:
  • So gehen Sie mit der Meldung „Vorgang nicht zulässig“ beim Löschen von Dateien in Linux um
  • Linux-Shell-Befehl zählt den Wert einer Spalte nach der Deduplizierung
  • Tipps zum Anzeigen von Verlaufsdatensätzen und Hinzufügen von Zeitstempeln in Linux
  • Mehrere Möglichkeiten, Python-Programme im Linux-Hintergrund auszuführen
  • Erstellen und Ausführen von Linux-Shell-Skripten
  • Python verwendet Paramiko zum Betrieb von Linux
  • Schritte zum Übertragen von Dateien und Ordnern zwischen zwei Linux-Servern
  • Lösungen für Dateien/Ordner, die unter Linux nicht gelöscht werden können
  • Implementierungsmethode von Android zum Ausführen von Shell-Skripten im Linux-Terminal, um das Protokoll der aktuell ausgeführten App direkt auszudrucken
  • Verwendung der Zabbix-API in einer Linux-Shell-Umgebung

<<:  Detaillierte Erläuterung der Implementierungsmethode für die Datenbank-Mehrtabellenverbindungsabfrage

>>:  Detaillierte Erklärung des Sandbox-Mechanismus von Vue3

Artikel empfehlen

Detaillierte Erklärung der Verwendung und Erfahrung mit tinyMCE

Detaillierte Erklärung der tinyMCE-Verwendung Ini...

Nutzerbedürfnisse führen zu marketingorientiertem Design

<br />Zu jedem unserer Themen bespricht das ...

So implementieren Sie eine bidirektionale Bindungsfunktion in vue.js mit reinem JS

Inhaltsverzeichnis Lassen Sie uns zunächst über d...

Prometheus überwacht MySQL mithilfe der Grafana-Anzeige

Inhaltsverzeichnis Prometheus überwacht MySQL übe...

Eine kurze Einführung in das bionische Design im Internet-Webdesign

Beim Stichwort Bionik-Design denken viele an die E...

Detaillierte Erklärung zur Verwendung des Linux-Befehls Traceroute

Mithilfe von Traceroute können wir den Pfad ermit...

Ubuntu Docker-Installation in VMware (Containererstellung)

1. Mindmap 2. So bauen Sie einen Container 2.1 Vo...

Eine kurze Diskussion über allgemeine Operationen von MySQL in cmd und Python

Umgebungskonfiguration 1: Installieren Sie MySQL ...

So fragen Sie den minimal verfügbaren ID-Wert in der MySQL-Tabelle ab

Als ich mir heute die Laborprojekte ansah, stieß ...