Einführung in die Bereitstellung des Selenium-Crawler-Programms unter Linux

Einführung in die Bereitstellung des Selenium-Crawler-Programms unter Linux

Vorwort

Ich muss das Selenium-Crawler-Programm für die Arbeit auf dem Linux-Server bereitstellen. Ich möchte dies mit Ihnen teilen. Wenn Sie interessiert sind, können Sie einen Blick darauf werfen.


1. Was ist Selen?

Selenium ist ein Tool zum Testen von Webanwendungen. Selenium-Tests werden direkt im Browser ausgeführt, genau wie bei echten Benutzern, und Crawler verwenden sie, um einige von js dynamisch geladene Daten zu crawlen

2. Nutzungsschritte

1. Bibliothek importieren

Der Code lautet wie folgt

von selenium.webdriver Chrome importieren
von selenium.webdriver.chrome.service importiere Service
from selenium.webdriver.chrome.options import Options # Verwenden Sie einen Headless-Browser from selenium.webdriver import ChromeOptions
chrome_options = Optionen()
Optionen = ChromeOptions()
options.add_experimental_option('excludeSwitches', ['enable-automation']) # => Entfernen Sie den Browser, der von der automatisierten Testsoftware gesteuert wird options.add_experimental_option('useAutomationExtension', False)
chrome_options.add_argument("--headless") # => Headless-Modus für Chrome konfigurieren chrome_options.add_argument('--no-sandbox')
chrome_options.add_argument('--disable-gpu')
chrome_options.add_argument('--disable-dev-shm-usage')

2. Testcode

Der Code lautet wie folgt:

s = Dienst(r"/home/Treiber/Chromedriver")
Treiber = Chrome(
     Dienst=s, Optionen=Chrome_Optionen
 )
 Treiber.get("https://www.baidu.com")
 drucken(diiver.title)

3. Bereitstellungsverfahren

1. Installieren Sie Chrome

Der Befehl lautet wie folgt:

yum installiere https://dl.google.com/linux/direct/google-chrome-stable_current_x86_64.rpm
Überprüfen Sie die Version von Chrome: google-chrome --version

2. Chromedriver installieren

Der Befehl lautet wie folgt:

Laden Sie die Chromedriver-Treiberadresse entsprechend der entsprechenden Chrome-Version herunter: https://npm.taobao.org/mirrors/chromedriver
Meine Versionsnummer ist: 96.0.4664.45
wget https://npm.taobao.org/mirrors/chromedriver/96.0.4664.45/chromedriver_linux64.zip 
yum install -y entpacken zip
unzip chromedriver_linux64.zip # Entpacken Sie die Zip-Datei mkdir driver #Erstellen Sie einen neuen Ordner zum Speichern des Treibers chmod 777 driver/chromedriver # Dies ist die Berechtigung. Ich gebe ihr hier 777

3. Führen Sie den Testcode aus

Erstellen Sie eine neue test.py-Datei

vi test.py 

Bildbeschreibung hier einfügen

Speichern Sie test.py und führen Sie es aus.

Bildbeschreibung hier einfügen

Vor diesem Hintergrund ist meine Anfrage erfolgreich.

Zusammenfassen

Dies ist das Ende dieses Artikels über die Bereitstellung des Selenium-Crawler-Programms unter Linux. Weitere relevante Inhalte zum Linux-Selenium-Crawler-Programm finden Sie in früheren Artikeln von 123WORDPRESS.COM oder in den verwandten Artikeln weiter unten. Ich hoffe, Sie werden 123WORDPRESS.COM auch in Zukunft unterstützen!

Das könnte Sie auch interessieren:
  • Konfigurieren Sie eine Selenium-Umgebung basierend auf Linux und implementieren Sie den Betrieb

<<:  Der Unterschied zwischen Animation und Übergang

>>:  Grundlegende MySQL-Grundlagen: Gruppierungsfunktion, Aggregatfunktion, Gruppierungsabfrage – ausführliche Erklärung

Artikel empfehlen

Ursachenanalyse und Lösung des E/A-Fehlers beim Löschen einer MySQL-Tabelle

Problemphänomen Ich habe kürzlich Sysbench verwen...

Einführung in den Prozess zum Erstellen eigener FTP- und SFTP-Server

FTP und SFTP werden häufig als Dateiübertragungsp...

So beheben Sie den MySQL-FEHLER 1045 (28000) - Zugriff wegen Benutzer verweigert

Problembeschreibung (die folgende Diskussion besc...

So installieren Sie Graphviz und beginnen mit dem Tutorial unter Windows

Herunterladen und installierenUmgebungsvariablen ...

Vue+axios-Beispielcode zum Hochladen von Bildern und Erkennen von Gesichtern

Inhaltsverzeichnis Axios-Anfrage Qs-Verarbeitungs...

Prinzip des MySQL-Indexfehlers

Inhaltsverzeichnis 1. Gründe für Indexfehler 2. S...

Detaillierte Erklärung zur Verwendung von HTML-Header-Tags

HTML besteht aus zwei Teilen: Kopf und Text ** Da...

Beispiel für eine MySQL-Datenbank-übergreifende Transaktions-XA-Operation

In diesem Artikel wird die MySQL-Datenbank-übergr...

Rsync+crontab regelmäßige Synchronisierungssicherung unter centos7

In letzter Zeit möchte ich regelmäßig wichtige in...