Deskripsi Data
Dataset ini adalah dataset buatan/bangkitan yang diadaptasi dari Adult (Census Income) Dataset yang disesuaikan untuk konteks Indonesia. Tujuannya adalah mengklasifikasikan apakah pendapatan tahunan seorang individu > Rp100 juta berdasarkan atribut/peubah demografis. Dataset ini dapat digunakan untuk tujuan latihan/mengajar machine learning dengan konteks (domain knowledge) yang lebih mudah untuk dipahami menyesuaikan dengan kondisi sosial-ekonomi Indonesia.
Karakteristik ringkas:
- Observasi: tidak ditentukan (bergantung rilis/subset)
- Fitur: 7 fitur + 1 target (total 8 kolom)
- Tipe fitur: Categorical, Integer, Binary
- Tugas: Klasifikasi biner (
>100juta
vs<=100juta
) - Missing values: Ya — pada
jenis_pekerjaan
danpulau_asal
Informasi Peubah
Nama peubah | Peran | Tipe | Deskripsi | Nilai/Level |
---|---|---|---|---|
umur |
Feature | Integer | Umur (tahun) | 17–90 |
jenis_pekerjaan |
Feature | Categorical | Sektor pekerjaan | Swasta; Wiraswasta; PNS; Lainnya (tanpa gaji/tidak pernah bekerja) |
pendidikan |
Feature | Categorical | Tingkat pendidikan | Dasar (≤SD); Menengah (SMP–SMA/SMK); Diploma/S1 (D1–D4/S1, termasuk kuliah tuntas/tidak); S2+ |
status_perkawinan |
Feature | Categorical | Status perkawinan | Belum-kawin; Kawin/menikah (termasuk tinggal terpisah); Cerai-hidup; Cerai-mati |
jenis_kelamin |
Feature | Binary | Jenis kelamin | Perempuan; Laki-laki |
jam_kerja_minggu |
Feature | Integer | Jam kerja per minggu | 1–99 |
pulau_asal |
Feature | Categorical | Pulau asal | Jawa; Sumatera; Kalimantan; Sulawesi; Bali–Nusa Tenggara; Papua |
pendapatan |
Target | Binary | Kelas target pendapatan tahunan | <=100juta , >100juta |