Beranda BlogPengikisan web Tambang Miliaran Pendapat Reddit: Web Scraping Reddit dan Analisis Sentimen (2024)

Tambang Miliaran Pendapat Reddit: Web Scraping Reddit dan Analisis Sentimen (2024)

oleh Kadek
Spanduk blog Reddit

Pada Januari 2024 saja, terdapat 7,57 miliar kunjungan ke Reddit. Ada 2,8 juta subreddit dengan diskusi tentang segala hal yang dapat Anda bayangkan - mulai dari r/cats hingga r/meme dan salah satu favorit pribadi kami, r/dataisbeautiful.

Angka-angka dalam miliaran dan jutaan ini menunjukkan bahwa Reddit adalah salah satu komunitas online terbesar di dunia; Hal ini menjadikannya ladang yang matang untuk ekstraksi data.

Pertanyaannya adalah bagaimana mengumpulkan data Reddit dalam skala besar dengan begitu banyak komentar, postingan, dan rangkaian pesan. Memasuki, Pengikisan web.

Baik itu melacak perdebatan populer selama beberapa dekade, memantau merek Anda di jejaring sosial, mendengarkan keluhan pelanggan, atau mengikuti perubahan budaya, mengumpulkan data dari Reddit adalah cara baru untuk mengkonsolidasikan penelitian di era demam emas. informasi.

Bersiaplah, Anda akan mengetahui betapa hebatnya data Reddit.

Apa itu Analisis Sentimen Reddit?

Katakanlah Anda ingin membeli sepasang sepatu kets Nike baru segera setelah dirilis. Untuk melakukan ini, Anda ingin mengetahui sentimen umum terhadap produk di subreddit seperti r/Nike dan /sneakers.

Anda dapat mengumpulkan data ini dengan menelusuri subreddit dan menganalisis nada postingan dan komentar - apakah sebagian besar positif, negatif, atau netral?

Ini adalah analisis sentimen Reddit. Anda akan menemukan bahwa dalam hal ini bermanfaat bagi pelanggan dan merek. Ada kemungkinan besar bahwa beberapa orang (licik) di Nike memperhatikan subreddit yang sama untuk mengetahui reaksi terhadap peluncuran produk mereka.

Mereka meneliti merek, mereka meneliti masukan Anda.

Bagaimana cara mengikis data Reddit?

Tidak ada kode? Tidak masalah. Anda tidak perlu menjadi programmer ahli untuk melakukan analisis sentimen Reddit Anda sendiri. Banyak orang menelusuri Reddit menggunakan Python, tetapi di Grespr kami berteman dengan semua orang. Terutama non-programmer.

Saat Anda menggunakan alat pengikis web tanpa kode seperti Grepsr, proses ekstraksi data disederhanakan melalui otomatisasi.

Prosesnya bekerja dalam dua cara:

  • Metode URL: Masukkan URL untuk mencari halaman tertentu dengan cepat. Scraper web secara otomatis mengumpulkan semua data yang tersedia dari suatu halaman berdasarkan URL-nya.
  • Antarmuka tunjuk dan klik: Sesuaikan bagian situs yang ingin Anda cari dengan antarmuka visual titik-dan-klik. Seret dan lepas item untuk memilih parameter data yang Anda perlukan.

Kami merekomendasikan untuk membaca dokumentasi resmi Antarmuka Pemrograman Aplikasi (API) Reddit, yang memungkinkan Anda mengakses postingan, komentar, dan informasi pengguna dari subreddit tertentu atau seluruh platform dengan tetap menghormati kebijakan Reddit.

Studi Kasus Kehidupan Nyata: Kekuatan Data Reddit

Bayangkan membuang Reddit seperti menemukan jarum di tumpukan jerami. Dari demografi yang sulit dijangkau hingga diskusi publik tidak resmi, platform anonim Reddit adalah tambang emas riset pasar.

Penasaran? Mari kita cari tahu.

1. Persepsi masyarakat terhadap ChatGPT

Latar belakang: Dalam sebuah studi dari Universitas Lingkopin, para peneliti meneliti bagaimana pengumuman publik yang besar memengaruhi frekuensi diskusi di subreddit r/ChatGPT antara peluncurannya hingga 31 Maret 2023.

Objektif: Analisis diskusi seputar ChatGPT, amati perkembangannya dari waktu ke waktu, dan identifikasi peristiwa penting yang terkait dengannya.

Metodologi: API PushShift mengumpulkan hampir 500.000 postingan ke ChatGPT Reddit. Selanjutnya, alat bernama BERTopic digunakan untuk mengetahui apa yang dibicarakan orang-orang di postingan tersebut.

Hasil: Peristiwa besar ChatGPT, seperti investasi Microsoft dan integrasi Bing, dikaitkan dengan lonjakan aktivitas Reddit dan pergeseran topik diskusi. Selain itu, seiring berjalannya waktu, kategori topik yang lebih luas seperti “pendidikan” dan “pekerjaan” mulai muncul dalam diskusi di berbagai subreddit.

Sebaliknya, percakapan tentang topik tertentu seperti “Bing” cenderung berfokus pada subreddit yang relevan secara langsung. Diskusi “Bing” meningkat sebagai tanggapan terhadap peristiwa terkait integrasi ChatGPT ke dalam mesin pencari dan tidak muncul secara alami.

Apa yang diungkapkan oleh studi kasus ini?

  • Pertama, kemampuan Reddit untuk memicu percakapan baik secara organik maupun sebagai respons terhadap peristiwa real-time di dunia sangatlah besar. A Wawasan tentang perkembangan opini publik seputar teknologi baru – mentah dan tanpa filter – sangatlah berharga Identifikasi tren sentimen dan titik pivot.
  • Kedua, Sentimen Reddit bereaksi keras terhadap perkembangan nyata. Ini berarti Anda dapat melacak minat publik hampir secara instan dengan mengamati lonjakan aktivitas Reddit.

2. Pengikisan Web Reddit untuk Tujuan Sosial – JUUL

Masih ingat JUUL? Perusahaan tersebut mendapat kecaman karena memicu krisis vaping remaja dan produknya dilarang pada Juni 2022.

Menariknya, sebuah studi tahun 2019 yang diterbitkan di JMIR Publications mengevaluasi data dari Reddit, khususnya dua subreddit, r/UnderageJuul dan r/JUUL, dan menunjukkan nilai penambangan media sosial untuk pengawasan kesehatan masyarakat.

latar belakang: JUUL dengan cepat mendapatkan popularitas di kalangan anak muda, namun metode akuisisi, preferensi, dan pola penggunaannya sebagian besar tidak diketahui.

Objektif: Telusuri Reddit untuk data media sosial guna mengisi kesenjangan pengetahuan tentang penggunaan JUUL di bawah umur.

metodologi: Para peneliti sebelumnya memilih postingan dan komentar Reddit dari 716 thread dan 2.935 komentar dari subreddit r/UnderageJuul yang sekarang dilarang.

Hasil: Ada pengguna r/UnderageJuul yang berusia 13 tahun, dengan rasa yang paling populer adalah produk resmi JUUL: mangga, mint, dan mentimun. Utas tersebut menyebutkan tujuh cara terpisah untuk mendapatkan produk JUUL. Yang paling umum adalah membeli dari pengguna Reddit lainnya.

Dengan menghapus Reddit, penelitian ini berhasil Temukan informasi penting mengenai demografi, preferensi produk, dan pendekatan akses ilegal di bagian yang terkenal sulit untuk diteliti.

Teman-teman, itulah kekuatan web scraping Reddit.

3. Bagaimana Merek Menggunakan Reddit – Laneige

Laneige adalah perusahaan kecantikan perawatan kulit Korea yang memiliki salah satu penyebutan merek tertinggi di komunitas terpopuler Reddit - r/skincarereaddiction di 2.2. juta anggota dan r/AsianBeauty dengan 1,9 juta anggota.

Seorang manajer senior di Laneige, Shrija Pandya, jelas memanfaatkan web scraping di Reddit dan pengawasan kehadiran merek Anda di platform: “Kami tahu bahwa komunitas kecantikan di Reddit sangat kuat dan mereka memiliki ketertarikan yang kuat terhadap kecantikan dan perawatan kulit.”

Laneige baru secara resmi memasuki Reddit tahun lalu dengan iklan, tetapi seperti yang akan Anda lihat, penyebutan merek di subreddit sudah ada sejak enam tahun yang lalu.

Tujuan raksasa kecantikan ini di Reddit adalah untuk mendorong kesadaran merek serta meningkatkan pertimbangan dan niat pembelian. Mereka berhasil – untuk mencapai 50 rasio klik % lebih tinggi Dan 42 Tingkat penyelesaian % lebih tinggi untuk video berdurasi enam detik sebagai tolok ukur kecantikan vertikal Reddit.

4. Pelajaran dari AMA – Audi

Reddit AMA – “Ask Me Anything” – adalah sesi dengan pakar komunitas yang mengadakan format tanya jawab untuk berinteraksi dengan pengikut di komunitas mereka. Katakanlah Lewis Hamilton menjawab pertanyaan menarik Anda tentang mobil cepat di subreddit r/Formula1. (Bisakah Anda benar-benar mengendarai mobil F1 secara terbalik?)

AMA adalah basis data yang subur untuk penambangan media sosial bagi merek, perusahaan, dan pemasar:

  • Mereka membantu Anda untuk mengukur persepsi dan reaksi masyarakat tentang layanan dan produk Anda secara real time
  • AMA Soroti titik-titik kesulitan dalam perjalanan pelanggan kalau tidak, itu tidak akan terlihat
  • Dia Perkuat hubungan dengan membangun kredibilitas dan memanusiakan merek

Audi, seperti hampir semua merek mobil besar lainnya, memiliki komunitas Reddit sendiri. Mereka menciptakan “Think Faster – AMA Tercepat di Dunia” - dengan kecepatan 130 mil per jam, masing-masing dengan segmen berdurasi 30 menit.

Tantangan bagi selebriti seperti Olivia Munn, Adam Scott, dan Issa Rae adalah menjaga keamanan makan siang mereka sambil menjawab pertanyaan secara real time melalui komentar Reddit.

Data Reddit waktu nyata Data Reddit waktu nyata
Kampanye Audi "Think Faster" bersama Adam Scott dengan kartu AMA. (Sumber: Penghargaan Shorty)

Kampanye ini sukses besar, bahkan pendiri Reddit Alexis Ohanian mentweet kegembiraannya. Ken Bracht, kepala pemasaran Audi di Amerika, mengatakan: "Sejauh pesannya, kami ingin pemirsa merasakan bagaimana rasanya berada di belakang kemudi RS 5 Coupe dengan kecepatan tinggi."

Dan oh, mereka melakukannya.

AMA telah diadakan tiga kali sejak tahun 2014 dan telah ditonton sebanyak 2 juta kali, lebih dari 6.000 komentar, dan fitur majalah yang tak terhitung jumlahnya.

Siap untuk Mengikis Web Reddit?

Reddit adalah barometer opini publik dan tren pasar, baik Anda seorang merek, pemasar, atau sekadar ingin tahu. Memantau subreddits yang relevan memberi Anda informasi terkini tentang apa yang terjadi di wilayah Anda.

Jangan lewatkan informasi demam emas abad ke-21 – mulailah dengan Grepsr hari ini!

Pos terkait

Tinggalkan Komentar