PCA & LDA untuk Deteksi Kanker Payudara

Posisi belajar

Halaman ini adalah alur belajar edukatif, bukan alat diagnosis atau rekomendasi medis otomatis.

Latar belakang deteksi kanker payudara

Dataset medis sering memiliki banyak fitur hasil pengukuran. Tantangannya adalah membuat model tetap akurat tanpa kehilangan kemampuan membaca pola penting dari data.

Wisconsin Breast Cancer Data

Dataset ini populer untuk pembelajaran klasifikasi karena berisi fitur numerik dari karakteristik sel. Pada versi belajar, setiap kelompok fitur dijelaskan sebagai sinyal yang membantu pemisahan kelas.

Kenapa data berdimensi tinggi perlu direduksi

Terlalu banyak fitur dapat membuat visualisasi sulit dan model lebih rentan terhadap noise. Reduksi dimensi membantu mencari representasi yang lebih padat.

Cara PCA membantu menyederhanakan fitur

PCA mencari arah variasi terbesar dalam data. Komponen utama membuat data lebih mudah divisualkan dan dapat menjadi input ringkas untuk model klasifikasi.

Cara LDA berbeda dari PCA

LDA menggunakan informasi label untuk mencari proyeksi yang memisahkan kelas. Karena itu LDA bersifat supervised, berbeda dari PCA yang berfokus pada variasi data tanpa melihat label.

Perbandingan hasil model

Bagian ini membaca bagaimana performa model berubah saat memakai fitur asli, PCA, atau LDA. Metrik evaluasi dipakai untuk melihat trade-off antara ringkas dan akurat.

Interpretasi visual reduksi dimensi

Visual 2D/3D membantu melihat apakah dua kelas mulai terpisah setelah transformasi. Ini membuat konsep reduksi dimensi lebih terasa, bukan sekadar rumus.

Batasan model

Dataset terstruktur tidak mewakili seluruh kondisi klinis. Model edukatif di sini tidak dimaksudkan untuk diagnosis medis.

Versi praktik di machinelearning.co.id

Versi praktik menghubungkan artikel PCA, lab PCA 2D/3D, perbandingan PCA vs LDA, dan evaluasi klasifikasi secara bertahap.