Cara ini banyak digunakan untuk para digital marketing analyst, yang mengamati trend yang sedang terjadi di belantara Twitter, baik itu di kalangan warga +62 atau mancanegara, metode terlengkapnya dengan menggunakan API twitter, namun belakangan untuk dapatkan API twitter, akun harus terdaftar dengan nomor telepon dan lain sebagainya.
Untuk mempermudah itu semua, hadirlah snscrape untuk scraping suatu keyword yang akan kita tentukan, untuk di anaconda, tinggal langsung install snscrape juga tweepy dengan pip, atau kalau tanpa anaconda jupyter notebook, butuh install pandas, snscrape dan tweepy.
pip install pandas
pip install snscrape
pip install tweepy
Logicnya sederhana, kita tentukan dulu keyword yang akan di query, lalu buat list kosong dan batasan twit yang akan digrab, biar lebih fleksibel dan efisien, kita ambil 200 twit saja, karena disini akan menampilkan akun twit, kalimat twitnya, dan waktu kapan si user nge twit.
Terus kita buat perulangan, yang kalau twit ketemu, lalu tambahkan ke list kosong tadi, lalu kita jadikan dataframe dengan pandas, kita buatkan dari tanggal, username dan list twitnya, gampang kan...kalau mau save ke file csv atau excel juga bisa cukup pakai to_csv.
import tweepyimport pandas as pdimport snscrape.modules.twitter as sntwitter
query = "Asuransi"twit = []limit = 200
for i in sntwitter.TwitterSearchScraper(query).get_items(): if len(twit) == limit: break else: twit.append([i.date, i.user.username, i.content])df = pd.DataFrame(twit, columns=['Date', 'User', 'tweet'])df.to_csv('x.csv', index=False)df = pd.read_csv('x.csv')print(df)
Akan muncul file x.csv hasil dari output program sederhana diatas, kelemahannya snscrape hanya bisa scraping twit yang tidak lebih dari 14 hari lalu. Jika bingung menggunakannya, anda cukup memesan jasa pembuatan aplikasi website untuk mengolah data dengan Creativauz.