Apa itu rekayasa fitur?
Fitur model adalah input yang digunakan model machine learning (ML) selama pelatihan dan inferensi untuk membuat prediksi. Akurasi model ML bergantung pada kumpulan dan komposisi fitur yang tepat. Misalnya, dalam aplikasi ML yang merekomendasikan daftar putar musik, fitur dapat mencakup peringkat lagu, lagu mana yang didengarkan sebelumnya, dan waktu mendengarkan lagu. Dibutuhkan upaya rekayasa yang signifikan untuk membuat fitur. Rekayasa fitur melibatkan ekstraksi dan transformasi variabel dari data mentah, seperti daftar harga, deskripsi produk, dan volume penjualan agar Anda dapat menggunakan fitur untuk pelatihan dan prediksi. Langkah yang diperlukan untuk merekayasa fitur mencakup ekstraksi dan pembersihan data, lalu pembuatan serta penyimpanan fitur.
Apa saja tantangan dari rekayasa fitur?
Rekayasa fitur sangat menantang karena melibatkan kombinasi antara analisis data, pengetahuan domain bisnis, dan intuisi. Saat membuat fitur, langsung membuka data yang tersedia memang mudah untuk dilakukan, namun langkah yang umumnya dilakukan adalah Anda harus memulai dengan mempertimbangkan data mana yang diperlukan dengan berbicara dengan para ahli, melakukan brainstorming, dan melakukan penelitian dengan melibatkan pihak ketiga. Tanpa melalui ini, Anda bisa saja melewatkan variabel prediktor yang penting.
Ekstraksi data
Pembuatan fitur
Penyimpanan fitur
Bagaimana AWS dapat membantu rekayasa fitur?
Dengan Amazon SageMaker Data Wrangler, Anda dapat menyederhanakan proses rekayasa fitur menggunakan satu antarmuka visual. Menggunakan alat pemilihan data SageMaker Data Wrangler, Anda dapat memilih data mentah yang Anda inginkan dari berbagai sumber data dan mengimpornya dengan satu klik. SageMaker Data Wrangler berisi lebih dari 300 transformasi data bawaan sehingga Anda dapat dengan cepat menormalkan, mengubah, dan menggabungkan fitur tanpa harus menulis kode apa pun. Setelah data Anda siap, Anda dapat membangun alur kerja ML yang sepenuhnya otomatis dengan Amazon SageMaker Pipelines dan menyimpannya untuk digunakan kembali di Amazon SageMaker Feature Store. SageMaker Feature Store adalah repositori yang dibuat khusus, tempat Anda dapat menyimpan dan mengakses fitur sehingga lebih mudah untuk memberi nama, mengatur, dan menggunakannya kembali di seluruh tim. SageMaker Feature Store menyediakan penyimpanan terpadu untuk fitur selama pelatihan dan inferensi waktu nyata tanpa perlu menulis kode tambahan atau membuat proses manual guna menjaga fitur tetap konsisten.