Studi kasus ML

Random Forest untuk Obesity Risk dan Meal Planning

Studi kasus Random Forest untuk memprediksi risiko obesitas dari kebiasaan makan, kondisi fisik, gaya hidup, dan menghubungkannya dengan meal planning.

Tim editorialObesity Risk Prediction dan UCI Repository16 menit baca1029 kata
Ilustrasi artikel Random Forest untuk Obesity Risk dan Meal Planning

Random Forest sering disebut sebagai algoritma yang kuat untuk data tabular. Supaya manfaatnya lebih terasa, jauh lebih enak jika kita melihatnya lewat kasus yang dekat dengan kehidupan sehari-hari: risiko obesitas. Kasus ini menarik karena bukan hanya soal klasifikasi, tetapi juga bisa diteruskan menjadi langkah yang lebih aplikatif seperti meal planning.

Dalam studi Predicting risk of obesity and meal planning to reduce the obese in adulthood using artificial intelligence, data individu seperti kondisi fisik, kebiasaan makan, dan gaya hidup digunakan untuk memprediksi level obesitas. Setelah itu, hasil prediksi tersebut dapat dihubungkan dengan rekomendasi pola makan sesuai kebutuhan kalori dan makronutrien.

Inti use case-nya sederhana: model memprediksi level risiko obesitas dari data individu, lalu hasil prediksi itu dapat dipakai sebagai dasar penyusunan meal plan yang lebih terarah.

Dataset: Dari Kebiasaan Makan ke Level Obesitas

Dataset yang umum dipakai pada kasus ini adalah Estimation of Obesity Levels Based on Eating Habits and Physical Condition. Dataset tersebut berisi 2.111 record dengan 17 atribut dan target multi-kelas yang menggambarkan level status berat badan.

Level target pada visual ini disesuaikan dengan struktur kategori studi kasus, yaitu: Under weight, Normal Weight, Over Weight, Obesity Type-I, Obesity Type-II, dan Obesity Type-III. Dengan struktur seperti ini, pembaca akan langsung paham bahwa model tidak hanya menjawab obesitas atau tidak, tetapi memetakan levelnya secara bertahap.

Kelompok FiturContohPeran dalam Model
Kondisi fisikAge, Gender, Height, WeightMemberi gambaran dasar profil individu.
Kebiasaan makanHigh caloric food, vegetable intake, number of meals, snacksMembantu menangkap pola konsumsi yang berkaitan dengan obesitas.
Gaya hidupWater consumption, physical activity, technology usage, transportationMewakili kebiasaan harian yang ikut memengaruhi risiko.
TargetNObeyesdad / obesity levelKelas akhir yang diprediksi model.

Mengapa Random Forest Cocok?

Dalam kasus obesitas, dua orang bisa memiliki tinggi dan berat badan yang mirip, tetapi level risikonya berbeda karena pola makan, aktivitas, dan riwayat keluarga yang berbeda. Random Forest cocok untuk kondisi seperti ini karena ia membangun banyak decision tree, lalu menggabungkan keputusan mereka melalui voting mayoritas.

Pada visual berikut, hasil prediksi tree juga sudah disesuaikan ke level risiko yang lebih relevan. Tree pertama dan ketiga memprediksi Obesity Type-I, sedangkan tree kedua memprediksi Normal Weight. Hasil akhirnya diambil berdasarkan suara mayoritas.

Random Forest untuk prediksi risiko obesitas
Gambar 1. Ilustrasi Random Forest untuk prediksi risiko obesitas, dengan hasil akhir ditentukan oleh voting mayoritas antar-tree.

Bootstrap Sampling dan Perbaikan Visual Sampel

Salah satu sumber kekuatan Random Forest adalah keragaman data antar-tree. Keragaman ini muncul dari bootstrap sampling, yaitu teknik pengambilan sampel acak dari data training.

Pada visual bootstrap ini, urutan individu dibuat lebih rapi agar proses sampling mudah dibaca. Sampel A dan Sampel B sekarang dibuat tanpa elemen ganda yang membingungkan, sehingga visual lebih rapi untuk kebutuhan artikel.

Bootstrap sampling pada dataset obesitas
Gambar 2. Visual bootstrap sampling yang sudah dirapikan; urutan individu pada sampel tidak lagi terduplikasi secara membingungkan.

Dari Prediksi Risiko ke Meal Planning

Bagian yang membuat use case ini menarik adalah prediksi tidak berhenti pada klasifikasi. Setelah model menentukan level risiko, hasil itu dapat diterjemahkan ke rekomendasi meal plan. Dengan begitu, machine learning tidak berhenti pada angka akurasi, tetapi bergerak menuju keputusan yang lebih bermanfaat.

Pada diagram berikut, kolom Risk Level dibuat konsisten dengan kategori target, sehingga narasi artikel dan visualnya mudah diikuti.

Alur obesity risk dan meal planning
Gambar 3. Alur lengkap dari input user, model machine learning, level risiko obesitas, hingga meal plan harian.

Penting: meal planning berbasis model sebaiknya diposisikan sebagai alat bantu edukasi atau pendukung keputusan awal, bukan pengganti dokter atau ahli gizi.

Mencoba Use Case Ini di AutoTrain ML

Kasus obesity classification sangat cocok dicoba di AutoTrain ML karena datanya berbentuk tabular, targetnya jelas, dan workflow-nya bisa dijalankan tanpa coding. Pengguna cukup mengunggah dataset, memilih target, menjalankan auto-training, lalu membandingkan performa beberapa model.

Platform AutoTrain ML mendukung upload CSV/Excel, auto model selection, hyperparameter tuning, visual evaluation, export model, dan deployment API. Ini membuat use case seperti obesity risk prediction bisa dijalankan cukup cepat, baik untuk edukasi, demo produk, maupun eksperimen awal.

Workflow AutoTrain ML untuk dataset obesitas
Gambar 4. Workflow no-code di AutoTrain ML untuk menguji dataset obesitas secara cepat, mulai dari upload data hingga export atau deployment model.

Alur praktisnya: upload dataset obesity classification → pilih target NObeyesdad → jalankan auto-train → bandingkan model seperti Random Forest, Gradient Boosting, atau XGBoost → evaluasi hasil → export model atau deploy sebagai API.

Contoh Implementasi Python Jika Ingin Manual

Walaupun AutoTrain ML bisa dipakai tanpa coding, memahami versi Python tetap berguna agar pembaca paham apa yang sebenarnya terjadi di balik workflow no-code tersebut.

import pandas as pd

data = pd.read_csv("ObesityDataSet_raw_and_data_sinthetic.csv")

print(data.info())
print(data.head())
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder

X = data.drop("NObeyesdad", axis=1)
y = data["NObeyesdad"]

X = pd.get_dummies(X, drop_first=True)

label_encoder = LabelEncoder()
y_encoded = label_encoder.fit_transform(y)

X_train, X_test, y_train, y_test = train_test_split(
    X, y_encoded,
    test_size=0.2,
    random_state=42,
    stratify=y_encoded
)
from sklearn.ensemble import RandomForestClassifier

model = RandomForestClassifier(
    n_estimators=500,
    random_state=42,
    class_weight="balanced"
)

model.fit(X_train, y_train)
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix

y_pred = model.predict(X_test)

print("Accuracy:", accuracy_score(y_test, y_pred))
print(classification_report(y_test, y_pred, target_names=label_encoder.classes_))
print(confusion_matrix(y_test, y_pred))

Kesimpulan

Random Forest sangat layak dipakai untuk kasus obesity risk prediction karena mampu menangkap interaksi kompleks antara kondisi fisik, kebiasaan makan, dan gaya hidup. Dari sana, hasil model dapat diperluas menjadi meal planning yang lebih aplikatif.

Artikel ini memakai visual yang sudah dirapikan: kategori Risk Level dibuat konsisten dengan target multi-kelas, dan diagram bootstrap sampling dibuat lebih mudah dibaca.

Sumber

  1. Springer / Endocrine: Predicting risk of obesity and meal planning to reduce the obese in adulthood using artificial intelligence, 2022.
  2. UCI Machine Learning Repository: Estimation of obesity levels based on eating habits and physical condition.
  3. AutoTrain ML: platform no-code untuk upload dataset, auto-train, evaluasi model, export, dan deployment API.
POIN PENTING

Ringkasan praktis

  • Studi kasus Random Forest untuk memprediksi risiko obesitas dari kebiasaan makan, kondisi fisik, gaya hidup, dan menghubungkannya dengan meal planning.
  • Mulai dari intuisi visual, lalu cocokkan dengan rumus, contoh, dan batasan penggunaannya.
  • Gunakan roadmap belajar untuk menguji konsep setelah membaca, terutama jika artikel membahas metode atau evaluasi model.
FAQ SINGKAT

Pertanyaan yang sering muncul

Siapa yang cocok membaca artikel ini?

Pembaca yang ingin memahami healthcare ml dengan bahasa Indonesia yang praktis, tanpa kehilangan konteks teknis penting.

Apa langkah berikutnya setelah membaca?

Coba ulang konsep dengan data kecil, bandingkan hasilnya, lalu buka artikel terkait atau roadmap belajar agar pemahaman tidak berhenti di teori.

SUMBER ASLI

Obesity Risk Prediction dan UCI Repository

Lanjutkan membaca pada sumber penerbit untuk mendapatkan konteks lengkap.

Buka sumber asli →
BACA JUGA

Artikel terkait