{Data} Survei Pendapatan Indonesia

Author

Deri Siswara

Published

August 8, 2025

Deskripsi Data

Dataset ini adalah dataset buatan/bangkitan yang diadaptasi dari Adult (Census Income) Dataset yang disesuaikan untuk konteks Indonesia. Tujuannya adalah mengklasifikasikan apakah pendapatan tahunan seorang individu > Rp100 juta berdasarkan atribut/peubah demografis. Dataset ini dapat digunakan untuk tujuan latihan/mengajar machine learning dengan konteks (domain knowledge) yang lebih mudah untuk dipahami menyesuaikan dengan kondisi sosial-ekonomi Indonesia.

📥 Download Dataset

Karakteristik ringkas:

  • Observasi: tidak ditentukan (bergantung rilis/subset)
  • Fitur: 7 fitur + 1 target (total 8 kolom)
  • Tipe fitur: Categorical, Integer, Binary
  • Tugas: Klasifikasi biner (>100juta vs <=100juta)
  • Missing values: Ya — pada jenis_pekerjaan dan pulau_asal

Informasi Peubah

Nama peubah Peran Tipe Deskripsi Nilai/Level
umur Feature Integer Umur (tahun) 17–90
jenis_pekerjaan Feature Categorical Sektor pekerjaan Swasta; Wiraswasta; PNS; Lainnya (tanpa gaji/tidak pernah bekerja)
pendidikan Feature Categorical Tingkat pendidikan Dasar (≤SD); Menengah (SMP–SMA/SMK); Diploma/S1 (D1–D4/S1, termasuk kuliah tuntas/tidak); S2+
status_perkawinan Feature Categorical Status perkawinan Belum-kawin; Kawin/menikah (termasuk tinggal terpisah); Cerai-hidup; Cerai-mati
jenis_kelamin Feature Binary Jenis kelamin Perempuan; Laki-laki
jam_kerja_minggu Feature Integer Jam kerja per minggu 1–99
pulau_asal Feature Categorical Pulau asal Jawa; Sumatera; Kalimantan; Sulawesi; Bali–Nusa Tenggara; Papua
pendapatan Target Binary Kelas target pendapatan tahunan <=100juta, >100juta