Random Forest sering disebut sebagai algoritma yang kuat untuk data tabular. Supaya manfaatnya lebih terasa, jauh lebih enak jika kita melihatnya lewat kasus yang dekat dengan kehidupan sehari-hari: risiko obesitas. Kasus ini menarik karena bukan hanya soal klasifikasi, tetapi juga bisa diteruskan menjadi langkah yang lebih aplikatif seperti meal planning.
Dalam studi Predicting risk of obesity and meal planning to reduce the obese in adulthood using artificial intelligence, data individu seperti kondisi fisik, kebiasaan makan, dan gaya hidup digunakan untuk memprediksi level obesitas. Setelah itu, hasil prediksi tersebut dapat dihubungkan dengan rekomendasi pola makan sesuai kebutuhan kalori dan makronutrien.
Inti use case-nya sederhana: model memprediksi level risiko obesitas dari data individu, lalu hasil prediksi itu dapat dipakai sebagai dasar penyusunan meal plan yang lebih terarah.
Dataset: Dari Kebiasaan Makan ke Level Obesitas
Dataset yang umum dipakai pada kasus ini adalah Estimation of Obesity Levels Based on Eating Habits and Physical Condition. Dataset tersebut berisi 2.111 record dengan 17 atribut dan target multi-kelas yang menggambarkan level status berat badan.
Level target pada visual ini disesuaikan dengan struktur kategori studi kasus, yaitu: Under weight, Normal Weight, Over Weight, Obesity Type-I, Obesity Type-II, dan Obesity Type-III. Dengan struktur seperti ini, pembaca akan langsung paham bahwa model tidak hanya menjawab obesitas atau tidak, tetapi memetakan levelnya secara bertahap.
| Kelompok Fitur | Contoh | Peran dalam Model |
|---|---|---|
| Kondisi fisik | Age, Gender, Height, Weight | Memberi gambaran dasar profil individu. |
| Kebiasaan makan | High caloric food, vegetable intake, number of meals, snacks | Membantu menangkap pola konsumsi yang berkaitan dengan obesitas. |
| Gaya hidup | Water consumption, physical activity, technology usage, transportation | Mewakili kebiasaan harian yang ikut memengaruhi risiko. |
| Target | NObeyesdad / obesity level | Kelas akhir yang diprediksi model. |
Mengapa Random Forest Cocok?
Dalam kasus obesitas, dua orang bisa memiliki tinggi dan berat badan yang mirip, tetapi level risikonya berbeda karena pola makan, aktivitas, dan riwayat keluarga yang berbeda. Random Forest cocok untuk kondisi seperti ini karena ia membangun banyak decision tree, lalu menggabungkan keputusan mereka melalui voting mayoritas.
Pada visual berikut, hasil prediksi tree juga sudah disesuaikan ke level risiko yang lebih relevan. Tree pertama dan ketiga memprediksi Obesity Type-I, sedangkan tree kedua memprediksi Normal Weight. Hasil akhirnya diambil berdasarkan suara mayoritas.

Bootstrap Sampling dan Perbaikan Visual Sampel
Salah satu sumber kekuatan Random Forest adalah keragaman data antar-tree. Keragaman ini muncul dari bootstrap sampling, yaitu teknik pengambilan sampel acak dari data training.
Pada visual bootstrap ini, urutan individu dibuat lebih rapi agar proses sampling mudah dibaca. Sampel A dan Sampel B sekarang dibuat tanpa elemen ganda yang membingungkan, sehingga visual lebih rapi untuk kebutuhan artikel.

Dari Prediksi Risiko ke Meal Planning
Bagian yang membuat use case ini menarik adalah prediksi tidak berhenti pada klasifikasi. Setelah model menentukan level risiko, hasil itu dapat diterjemahkan ke rekomendasi meal plan. Dengan begitu, machine learning tidak berhenti pada angka akurasi, tetapi bergerak menuju keputusan yang lebih bermanfaat.
Pada diagram berikut, kolom Risk Level dibuat konsisten dengan kategori target, sehingga narasi artikel dan visualnya mudah diikuti.

Penting: meal planning berbasis model sebaiknya diposisikan sebagai alat bantu edukasi atau pendukung keputusan awal, bukan pengganti dokter atau ahli gizi.
Mencoba Use Case Ini di AutoTrain ML
Kasus obesity classification sangat cocok dicoba di AutoTrain ML karena datanya berbentuk tabular, targetnya jelas, dan workflow-nya bisa dijalankan tanpa coding. Pengguna cukup mengunggah dataset, memilih target, menjalankan auto-training, lalu membandingkan performa beberapa model.
Platform AutoTrain ML mendukung upload CSV/Excel, auto model selection, hyperparameter tuning, visual evaluation, export model, dan deployment API. Ini membuat use case seperti obesity risk prediction bisa dijalankan cukup cepat, baik untuk edukasi, demo produk, maupun eksperimen awal.

Alur praktisnya: upload dataset obesity classification → pilih target NObeyesdad → jalankan auto-train → bandingkan model seperti Random Forest, Gradient Boosting, atau XGBoost → evaluasi hasil → export model atau deploy sebagai API.
Contoh Implementasi Python Jika Ingin Manual
Walaupun AutoTrain ML bisa dipakai tanpa coding, memahami versi Python tetap berguna agar pembaca paham apa yang sebenarnya terjadi di balik workflow no-code tersebut.
import pandas as pd
data = pd.read_csv("ObesityDataSet_raw_and_data_sinthetic.csv")
print(data.info())
print(data.head())from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder
X = data.drop("NObeyesdad", axis=1)
y = data["NObeyesdad"]
X = pd.get_dummies(X, drop_first=True)
label_encoder = LabelEncoder()
y_encoded = label_encoder.fit_transform(y)
X_train, X_test, y_train, y_test = train_test_split(
X, y_encoded,
test_size=0.2,
random_state=42,
stratify=y_encoded
)from sklearn.ensemble import RandomForestClassifier
model = RandomForestClassifier(
n_estimators=500,
random_state=42,
class_weight="balanced"
)
model.fit(X_train, y_train)from sklearn.metrics import accuracy_score, classification_report, confusion_matrix
y_pred = model.predict(X_test)
print("Accuracy:", accuracy_score(y_test, y_pred))
print(classification_report(y_test, y_pred, target_names=label_encoder.classes_))
print(confusion_matrix(y_test, y_pred))Kesimpulan
Random Forest sangat layak dipakai untuk kasus obesity risk prediction karena mampu menangkap interaksi kompleks antara kondisi fisik, kebiasaan makan, dan gaya hidup. Dari sana, hasil model dapat diperluas menjadi meal planning yang lebih aplikatif.
Artikel ini memakai visual yang sudah dirapikan: kategori Risk Level dibuat konsisten dengan target multi-kelas, dan diagram bootstrap sampling dibuat lebih mudah dibaca.
Sumber
- Springer / Endocrine: Predicting risk of obesity and meal planning to reduce the obese in adulthood using artificial intelligence, 2022.
- UCI Machine Learning Repository: Estimation of obesity levels based on eating habits and physical condition.
- AutoTrain ML: platform no-code untuk upload dataset, auto-train, evaluasi model, export, dan deployment API.
Ringkasan praktis
- Studi kasus Random Forest untuk memprediksi risiko obesitas dari kebiasaan makan, kondisi fisik, gaya hidup, dan menghubungkannya dengan meal planning.
- Mulai dari intuisi visual, lalu cocokkan dengan rumus, contoh, dan batasan penggunaannya.
- Gunakan roadmap belajar untuk menguji konsep setelah membaca, terutama jika artikel membahas metode atau evaluasi model.
Pertanyaan yang sering muncul
Siapa yang cocok membaca artikel ini?
Pembaca yang ingin memahami healthcare ml dengan bahasa Indonesia yang praktis, tanpa kehilangan konteks teknis penting.
Apa langkah berikutnya setelah membaca?
Coba ulang konsep dengan data kecil, bandingkan hasilnya, lalu buka artikel terkait atau roadmap belajar agar pemahaman tidak berhenti di teori.
Obesity Risk Prediction dan UCI Repository
Lanjutkan membaca pada sumber penerbit untuk mendapatkan konteks lengkap.
Buka sumber asli →