Web Scraping Dan Penjelasanya

Halo teman-teman apa kabar ? saya akan membuat artikel tentang Web scraping

   Sebelumnya Baca Dulu :Baca dulu artikel tentang Requests

Dalam melakukan data analytics dibutuhkan sumber data terlebih dahulu. Sumber data sangat melimpah di internet baik berbentuk text maupun format lainnya. Salah satu cara untuk mendapatkan data adalah dengan teknik web scraping Web Scraping adalah cara untuk mengambil data dari halaman web ke dalam bentuk yang diinginkan seperti format csv atau json.

Web Scraping

Untuk mengambil data di halaman website kita dapat memanfaatkan class / id atribut di HTML. Contoh halaman website yang kita mengambil data quotes dari halaman webiste 

https://quotes.toscrape.com/


Lalu data yang kita akan ambil :



Inspect Element Website

Untuk mengetahui kode dari website https://quotes.toscrape.com kita bisa lakukan dengan teknik inspect element melalui browser.

Caranya klik kanan di halaman website yang ingin di inspect kemudian pilih Inspect Element atau crtl + shift + i dan akan muncul halaman kode HTML dari halaman website tersebut. Posisi halaman inspect bisa diatur disebelah kiri halaman website atau dibawah

Kita juga bisa melakukan highlight terhadap komponen website tertentu dan melihat kode spesifiknya dengan menggunakan tombol panah di pojok halaman inspector atau crtl + shift + i dan pilih halaman website yang ingin dilihat kodenya



Selanjutnya kita lihat lebih kode HTML lebih detail dari quote pertama


Quote pertama dari Albert Einstein dengan quote “The world as we have created it is a process of our thinking. It cannot be changed without changing our thinking.” diapit oleh tag <span> dengan class atribut “text“

Element author (Albert Einstein) diapit oleh tag <span> dan <small> dengan class author

Sedangkan tags quote diapit oleh tag <div> dengan class tags yang didalamnya menggunakan tag <meta> dengan class keywords

Contoh Script Data Scraping

Contoh script :


Tampilan script setelah di run :

  1. Kegunan script import requests dan from bs4 import BeautifulSoup adalah  sebagai pra syarat 

  2. Script ini di gunakan untuk meng inputkan data/atau mengambil data dari website yang ingin di ambil 

  3. Setelah meminta data lalu melakukan proses pengambilan data yang di inginkan dari website yang di tuju 

  4. Lalu setelah memproses data untuk menampilkan atau output  di gunakan script ini untuk menampilkan hasil output

     







Komentar