Ekstraksi Fitur pada Machine Learning: Tinjauan Konsep, Metode, Tren Representasi Modern, dan Arah Riset

Authors

  • Muhammad Ibnu Choldun Rachmatullah Universitas Logistik dan Bisnis Internasional

Keywords:

feature extraction, feature engineering, representation learning, self-supervised learning

Abstract

Ekstraksi fitur merupakan tahap fundamental dalam machine learning (ML) karena kualitas representasi data sangat menentukan kinerja model, stabilitas generalisasi, efisiensi komputasi, serta kemudahan interpretasi. Dalam praktik modern, ekstraksi fitur tidak lagi dipahami sekadar sebagai transformasi manual berbasis domain (misalnya statistik ringkas, transformasi frekuensi, atau reduksi dimensi), melainkan berkembang menjadi spektrum pendekatan yang mencakup representasi belajar otomatis (representation learning) dan rekayasa fitur terotomatisasi (automated feature engineering). Perkembangan ini dipercepat oleh kematangan deep learning, kemunculan paradigma self-supervised learning, dan meningkatnya kebutuhan menangani data multimodal (teks, citra, audio, deret waktu, graf, dan data tabular heterogen). Artikel tinjauan ini merangkum landasan teoretis ekstraksi fitur, taksonomi metode klasik hingga modern, kaitannya dengan tujuan pembelajaran (supervised, unsupervised, dan self-supervised), serta praktik evaluasi dan tantangan kontemporer—termasuk isu kebocoran data, pergeseran distribusi, fairness, dan interpretabilitas. Tinjauan juga menyoroti ekosistem riset terbaru pada 2021–2025 di berbagai domain, seperti pembelajaran representasi graf, link prediction berbasis fitur/feature learning, representasi geospasial multimodal, dan ekstraksi fitur deret waktu melalui arsitektur deep learning. Secara khusus, artikel ini menekankan bahwa “fitur” kini semakin dipandang sebagai objek desain end-to-end yang harus selaras dengan data, tujuan, dan batasan operasional, bukan sekadar produk sampingan pra-pemrosesan

Published

2025-04-30