Im heutigen Artikel zeigen wir Ihnen, wie Sie Hotelpreise von einem der größten Aggregatoren abrufen: Google!
Inhaltsverzeichnis
Warum sollten Sie die Hotelpreise bei Google streichen?
Wenn Sie nach hotelbezogenen Schlüsselwörtern suchen, generiert Google einen eigenen, auf Hotels ausgerichteten Bereich mit Namen, Bildern, Adressen, Bewertungen und Preisen für Tausende von Hotels.
Dies liegt daran, dass Google Zugriff auf Millionen von Reise- und Hotelwebsites hat und alle diese Informationen an einem einzigen Ort zusammenfasst.
Reisende, Unternehmen und Analysten können all diese Daten für viele Anwendungsfälle nutzen:
- Preisvergleich – Vergleichen Sie die Preise auf Buchungsplattformen und Reisewebsites, um die besten Angebote zu finden.
- Datenanalyse – Analysten können Hotelpreisdaten nutzen, um Preistrends, saisonale Schwankungen und wettbewerbsfähige Preismöglichkeiten aufzudecken.
- Dynamische Preisstrategien – Unternehmen können Umsatz und Auslastung optimieren, indem sie die Preise basierend auf Nachfrage, Verfügbarkeit und Wettbewerbspreisen anpassen.
- Benutzerdefinierte Benachrichtigungen – Überwachen Sie Preissenkungen, um Kunden zu warnen oder für den persönlichen Gebrauch.
- Reise-Aggregationsdienste – Bieten Sie Benutzern eine konsolidierte Ansicht der Hotelpreise und -optionen aus verschiedenen Quellen.
- Budget und Planung – Reisende können die Übernachtungskosten vorhersehen und ihre Pläne entsprechend anpassen.
Letztendlich kann man mit Daten viele Dinge tun, aber bevor man daraus Erkenntnisse gewinnen kann, muss man ausreichend davon sammeln.
Kommen wir zum spaßigen Teil und beginnen mit dem Sammeln von Google-Hotelpreisen!
Scraping von Google-Hotelpreisen mit Node.js
In diesem Tutorial schreiben wir ein Skript, das die besten Hotelpreise in New York ermittelt, indem wir Hotelpreisdaten sammeln und dann die Hotelliste vom günstigsten zum teuersten sortieren.
1. Voraussetzungen
Um diesem Tutorial folgen zu können, müssen diese Tools auf Ihrem Computer installiert sein.
Notiz: Obwohl jeder diesem Tutorial folgen kann, empfehlen wir denjenigen, die mit Web Scraping noch nicht vertraut sind, zunächst unser JavaScript-Web Scraping-Tutorial für Anfänger zu lesen.
2. Richten Sie Ihr Projekt ein
Erstellen Sie einen Ordner für das Projekt.
mkdir google-hotel-scraper
Initialisieren Sie nun ein Node.js-Projekt, indem Sie den folgenden Befehl vom Terminal aus ausführen:
cd google-hotel-scraper
npm init -y
Der letzte Befehl erstellt eine package.json Datei im Ordner. Erstellen Sie eine Datei index.js und fügen Sie darin eine einfache JavaScript-Anweisung hinzu.
touch index.js
echo "console.log('Hello world!');" > index.js
Führen Sie die Datei aus index.js mit der Node.js-Laufzeitumgebung.
Dieser Befehl wird gedruckt Hallo Welt! im Terminal. Wenn es funktioniert, ist Ihr Projekt in Betrieb.
3. Installieren Sie die erforderlichen Abhängigkeiten
Um unseren Scraper zu erstellen, benötigen wir diese beiden Node.js-Pakete:
- Puppenspieler – zum Laden von Google Hotel-Seiten und zum Herunterladen des HTML-Inhalts.
- Cheerio – um die Hotelinformationen aus dem von Puppeteer heruntergeladenen HTML zu extrahieren.
Führen Sie den folgenden Befehl aus, um diese Pakete zu installieren:
npm install puppeteer cheerio
4. Identifizieren Sie die Informationen, die auf der Google-Hotelseite abgerufen werden sollen
Um eine Information aus einer Seite zu extrahieren, müssen wir zunächst ermitteln, welchen DOM-Selektor wir für das Targeting des HTML-Tags verwenden können.
Was wir meinen: Das Bild unten zeigt die Position des Hotelnamens und des Preises im DOM.