Halo teman-teman apa kabar ? saya akan membuat artikel tentang Web scraping
Sebelumnya Baca Dulu :Baca dulu artikel tentang Requests
Dalam melakukan data analytics dibutuhkan sumber data
terlebih dahulu. Sumber data sangat melimpah di internet baik berbentuk text
maupun format lainnya. Salah satu cara untuk mendapatkan data adalah dengan
teknik web scraping Web Scraping adalah cara untuk mengambil data dari halaman
web ke dalam bentuk yang diinginkan seperti format csv atau json.
Web Scraping
Untuk mengambil data di halaman website kita dapat
memanfaatkan class / id atribut di HTML. Contoh halaman website yang kita mengambil data quotes dari halaman webiste
https://quotes.toscrape.com/
Lalu data yang kita akan ambil :
Inspect Element Website
Untuk mengetahui kode dari website https://quotes.toscrape.com kita bisa lakukan dengan teknik inspect element
melalui browser.
Caranya klik kanan di halaman website yang ingin di inspect
kemudian pilih Inspect Element atau crtl + shift + i dan akan muncul halaman kode HTML dari halaman
website tersebut. Posisi halaman inspect bisa diatur disebelah kiri halaman
website atau dibawah
Kita juga bisa melakukan highlight terhadap komponen website
tertentu dan melihat kode spesifiknya dengan menggunakan tombol panah di pojok
halaman inspector atau crtl + shift + i dan pilih halaman website yang ingin dilihat kodenya
Selanjutnya kita lihat lebih kode HTML lebih detail dari
quote pertama
Quote pertama dari Albert Einstein dengan quote “The world
as we have created it is a process of our thinking. It cannot be changed
without changing our thinking.” diapit oleh tag <span> dengan class
atribut “text“
Element author (Albert Einstein) diapit oleh tag
<span> dan <small> dengan class author
Sedangkan tags quote diapit oleh tag <div> dengan
class tags yang didalamnya menggunakan tag <meta> dengan class keywords
Contoh Script Data Scraping
Contoh script :
Dalam melakukan data analytics dibutuhkan sumber data
terlebih dahulu. Sumber data sangat melimpah di internet baik berbentuk text
maupun format lainnya. Salah satu cara untuk mendapatkan data adalah dengan
teknik web scraping Web Scraping adalah cara untuk mengambil data dari halaman
web ke dalam bentuk yang diinginkan seperti format csv atau json.
Web Scraping
Untuk mengambil data di halaman website kita dapat memanfaatkan class / id atribut di HTML. Contoh halaman website yang kita mengambil data quotes dari halaman webiste
https://quotes.toscrape.com/
Inspect Element Website
Caranya klik kanan di halaman website yang ingin di inspect
kemudian pilih Inspect Element atau crtl + shift + i dan akan muncul halaman kode HTML dari halaman
website tersebut. Posisi halaman inspect bisa diatur disebelah kiri halaman
website atau dibawah
Kita juga bisa melakukan highlight terhadap komponen website
tertentu dan melihat kode spesifiknya dengan menggunakan tombol panah di pojok
halaman inspector atau crtl + shift + i dan pilih halaman website yang ingin dilihat kodenya
Selanjutnya kita lihat lebih kode HTML lebih detail dari
quote pertama
Quote pertama dari Albert Einstein dengan quote “The world
as we have created it is a process of our thinking. It cannot be changed
without changing our thinking.” diapit oleh tag <span> dengan class
atribut “text“
Element author (Albert Einstein) diapit oleh tag
<span> dan <small> dengan class author
Sedangkan tags quote diapit oleh tag <div> dengan
class tags yang didalamnya menggunakan tag <meta> dengan class keywords
Komentar
Posting Komentar