Dalam artikel hari ini, kami akan menunjukkan cara mendapatkan harga hotel dari salah satu agregator terbesar: Google!
Daftar Isi
Mengapa Anda harus menghapus harga hotel dari Google?
Saat Anda mencari kata kunci terkait hotel, Google menghasilkan bagian khusus yang berfokus pada hotel dengan nama, gambar, alamat, ulasan, dan harga ribuan hotel.
Hal ini karena Google memiliki akses ke jutaan situs web perjalanan dan hotel dan mengumpulkan semua informasi ini ke dalam satu tempat.
Wisatawan, pelaku bisnis, dan analis dapat menggunakan semua data ini untuk banyak kasus penggunaan:
- perbandingan harga – Bandingkan harga di platform pemesanan dan situs web perjalanan untuk menemukan penawaran terbaik.
- Analisis data – Analis dapat menggunakan data harga hotel untuk mengungkap tren harga, fluktuasi musiman, dan peluang harga yang kompetitif.
- Strategi penetapan harga dinamis – Bisnis dapat mengoptimalkan pendapatan dan pemanfaatan dengan menyesuaikan harga berdasarkan permintaan, ketersediaan, dan harga yang kompetitif.
- Pemberitahuan khusus – Pantau penurunan harga untuk memperingatkan pelanggan atau untuk penggunaan pribadi.
- Layanan agregasi perjalanan – Memberi pengguna gambaran gabungan tentang harga dan opsi hotel dari berbagai sumber.
- Anggaran dan perencanaan – Wisatawan dapat memperkirakan biaya akomodasi dan menyesuaikan rencana mereka.
Pada akhirnya, Anda dapat melakukan banyak hal dengan data, namun sebelum Anda dapat memperoleh wawasan darinya, Anda harus mengumpulkannya dalam jumlah yang cukup.
Mari kita mulai bagian yang menyenangkan dan mulai mengumpulkan harga hotel Google!
Mengikis Harga Hotel Google dengan Node.js
Dalam tutorial ini, kita akan menulis skrip untuk menemukan harga hotel terbaik di New York dengan mengumpulkan data harga hotel lalu mengurutkan daftar hotel dari yang termurah hingga termahal.
1. Persyaratan
Untuk mengikuti tutorial ini, Anda harus menginstal alat-alat ini di komputer Anda.
Catatan: Meskipun siapa pun dapat mengikuti tutorial ini, kami menyarankan mereka yang baru mengenal web scraping terlebih dahulu membaca tutorial web scraping JavaScript kami untuk pemula.
2. Siapkan proyek Anda
Buat folder untuk proyek tersebut.
mkdir google-hotel-scraper
Sekarang inisialisasi proyek Node.js dengan menjalankan perintah berikut dari terminal:
cd google-hotel-scraper
npm init -y
Perintah terakhir membuatnya paket.json File dalam folder. Buat berkas indeks.js dan tambahkan pernyataan JavaScript sederhana di dalamnya.
touch index.js
echo "console.log('Hello world!');" > index.js
Jalankan filenya indeks.js dengan lingkungan runtime Node.js.
Perintah ini akan dicetak Halo Dunia! di terminal. Jika berhasil, proyek Anda sudah aktif dan berjalan.
3. Instal dependensi yang diperlukan
Untuk membuat scraper, kita memerlukan dua paket Node.js berikut:
- Dalang – untuk memuat halaman Google Hotel dan mendownload konten HTML.
- Cheerio – untuk mengekstrak informasi hotel dari HTML yang diunduh dari Puppeteer.
Jalankan perintah berikut untuk menginstal paket-paket ini:
npm install puppeteer cheerio
4. Identifikasi informasi yang akan diambil di halaman hotel Google
Untuk mengekstrak informasi dari suatu halaman, pertama-tama kita perlu menentukan pemilih DOM mana yang dapat kita gunakan untuk menargetkan tag HTML.
Yang kami maksud: Gambar di bawah menunjukkan posisi nama hotel dan harga di DOM.