Apa Perbedaan Antara Machine Learning yang Diawasi dan Tanpa Pengawasan?
Machine learning (ML) yang diawasi dan tanpa pengawasan adalah dua kategori algoritma ML. Algoritma ML memproses sejumlah besar data historis untuk mengidentifikasi pola data melalui inferensi.
Algoritma pembelajaran yang diawasi melatih data sampel yang menentukan input dan output algoritme. Misalnya, data bisa berupa gambar angka tulisan tangan yang dianotasi untuk menunjukkan angka mana yang mereka wakili. Dengan data berlabel yang cukup, sistem pembelajaran yang diawasi pada akhirnya akan mengenali klaster piksel dan bentuk yang terkait dengan setiap nomor tulisan tangan.
Algoritme pembelajaran tanpa pengawasan melatih data tidak berlabel. Algoritme ini memindai melalui data baru, yang berupaya membangun hubungan penting antara input yang belum diketahui dan output yang telah ditentukan. Misalnya, algoritma pembelajaran tanpa pengawasan dapat mengelompokkan artikel berita dari situs berita yang berbeda ke dalam kategori umum seperti olahraga dan kriminal.
Teknik: pembelajaran yang diawasi vs. tanpa pengawasan
Dalam machine learning (ML), Anda mengajari komputer untuk membuat prediksi atau inferensi. Pertama, Anda menggunakan algoritma dan contoh data untuk melatih model. Kemudian, Anda mengintegrasikan model Anda ke dalam aplikasi untuk menghasilkan inferensi secara waktu nyata dan dalam skala besar. Pembelajaran yang diawasi dan tanpa pengawasan adalah dua kategori algoritma yang berbeda.
Pembelajaran yang diawasi
Dalam pembelajaran yang diawasi, Anda melatih model dengan satu set data input dan satu set data output berlabel berpasangan yang sesuai. Pelabelan biasanya dilakukan secara manual. Berikutnya adalah beberapa jenis teknik machine learning yang diawasi.
Regresi logistik
Regresi logistik memprediksi output kategoris berdasarkan satu atau lebih input. Klasifikasi binari adalah ketika output masuk ke dalam salah satu dari dua kategori, seperti “ya” atau “tidak” dan “lulus” atau “gagal”. Klasifikasi multikelas adalah ketika output cocok dengan lebih dari dua kategori, seperti kucing, anjing, atau kelinci. Contoh regresi logistik adalah memprediksi apakah seorang siswa akan lulus atau gagal di suatu kursus berdasarkan jumlah login siswa itu ke perangkat kursus.
Baca tentang regresi logistik »
Regresi linier
Regresi linier mengacu pada model pembelajaran yang diawasi yang, berdasarkan satu atau lebih input, memprediksi suatu nilai dari skala berkelanjutan. Contoh regresi linier adalah memprediksi harga rumah. Anda dapat memprediksi harga rumah berdasarkan lokasi, usia, dan jumlah kamarnya, setelah Anda melatih model pada serangkaian data latihan penjualan historis dengan variabel-variabel tersebut.
Pohon keputusan
Teknik machine learning yang diawasi pohon keputusan mengambil beberapa input yang diberikan dan menerapkan struktur if-else untuk memprediksi hasil. Contoh masalah pohon keputusan adalah memprediksi churn pelanggan. Misalnya, jika pelanggan tidak mengunjungi suatu aplikasi setelah mendaftar, model mungkin memprediksi churn. Atau, jika pelanggan mengakses aplikasi di beberapa perangkat dan waktu sesi rata-rata di atas ambang batas tertentu, model mungkin memprediksi retensi.
Jaringan neural
Solusi jaringan neural adalah teknik pembelajaran yang diawasi dengan sifat yang lebih kompleks. Untuk menghasilkan hasil yang pasti, dibutuhkan beberapa input yang diberikan dan melakukan satu atau lebih lapisan transformasi matematika berdasarkan penyesuaian bobot data. Contoh teknik jaringan neural adalah memprediksi digit dari gambar tulisan tangan.
Baca tentang jaringan neural »
Pembelajaran tanpa pengawasan
Machine learning tanpa pengawasan adalah ketika Anda memberikan data input algoritma tanpa data output berlabel. Kemudian, dengan sendirinya, algoritma mengidentifikasi pola dan hubungan di dalam dan di antara data. Berikutnya adalah beberapa jenis teknik pembelajaran tanpa pengawasan.
Pembuatan klaster
Teknik pembuatan klaster dalam pembelajaran tanpa pengawasan mengelompokkan input data tertentu bersama-sama, sehingga mereka dapat dikategorikan secara keseluruhan. Ada berbagai jenis algoritma pembuatan klaster tergantung pada data input. Contoh pembuatan klaster adalah mengidentifikasi berbagai jenis lalu lintas jaringan untuk memprediksi potensi insiden keamanan.
Pembelajaran aturan asosiasi
Teknik pembelajaran aturan asosiasi mengungkap hubungan berbasis aturan antarinput dalam set data. Misalnya, algoritma Apriori melakukan analisis keranjang pasar untuk mengidentifikasi aturan seperti kopi dan susu yang sering dibeli bersama.
Kepadatan probabilitas
Teknik kepadatan probabilitas dalam pembelajaran tanpa pengawasan memprediksi kemungkinan atau kemungkinan nilai output berada dalam kisaran apa yang dianggap normal untuk input. Misalnya, pengukur suhu di ruang server biasanya mencatat antara rentang derajat tertentu. Namun, jika tiba-tiba mengukur angka rendah berdasarkan distribusi probabilitas, data itu mungkin mengindikasikan adanya kerusakan peralatan.
Pengurangan dimensi
Pengurangan dimensi adalah teknik pembelajaran tanpa pengawasan yang mengurangi jumlah fitur dalam suatu set data. Ini sering digunakan untuk memproses data untuk fungsi machine learning lainnya dan mengurangi kompleksitas dan overhead. Misalnya, mungkin mengaburkan atau memotong fitur latar belakang dalam aplikasi pengenalan gambar.
Waktu penggunaan: pembelajaran yang diawasi vs. tanpa pengawasan
Anda dapat menggunakan teknik pembelajaran yang diawasi untuk memecahkan masalah dengan hasil yang diketahui dan yang sudah memiliki data berlabel. Contohnya termasuk klasifikasi spam email, pengenalan gambar, dan prediksi harga saham berdasarkan data historis yang diketahui.
Anda dapat menggunakan pembelajaran tanpa pengawasan untuk kasus di mana datanya tidak berlabel dan tujuannya adalah untuk menemukan pola, mengelompokkan instans serupa, atau mendeteksi anomali. Anda juga dapat menggunakannya untuk tugas eksplorasi saat tidak ada data berlabel. Contohnya termasuk mengatur arsip data besar, membangun sistem rekomendasi, dan mengelompokkan pelanggan berdasarkan perilaku pembelian mereka.
Apakah pembelajaran yang diawasi dan tanpa pengawasan dapat digunakan bersamaan?
Pembelajaran semidiawasi adalah ketika Anda menerapkan teknik pembelajaran yang diawasi dan tanpa pengawasan untuk masalah umum. Ini adalah salah satu kategori dari machine learning itu sendiri.
Anda dapat menerapkan pembelajaran semidiawasi ketika sulit untuk mendapatkan label untuk set data. Volume data berlabel Anda mungkin hanya sedikit, sebagian besar data yang ada tidak berlabel. Dibandingkan dengan menggunakan set data berlabel saja, Anda akan memiliki akurasi dan efisiensi yang lebih besar jika Anda menggabungkan teknik pembelajaran yang diawasi dan tanpa pengawasan.
Berikut adalah beberapa contoh penerapan pembelajaran semidiawasi.
Identifikasi penipuan
Dalam satu set besar data transaksional, ada subset data berlabel yang telah dikonfirmasi oleh para ahli sebagai transaksi palsu. Agar hasil lebih akurat, solusi machine learning akan pertama dilatih pada data yang tidak berlabel kemudian dengan data berlabel.
Analisis sentimen
Ketika mempertimbangkan luasnya interaksi pelanggan berbasis teks di organisasi, proses mengategorikan atau melabeli sentimen di semua saluran mungkin akan memakan biaya banyak. Sebuah organisasi dapat melatih model pada sebagian besar data yang tidak berlabel terlebih dahulu, setelah itu sampel yang telah diberi label. Dengan begini, organisasi dapat lebih yakin akan sentimen pelanggan di seluruh bisnis.
Klasifikasi dokumen
Saat menerapkan kategori ke basis dokumen yang besar, mungkin dokumen yang ada terlalu banyak untuk dilabeli secara fisik. Misalnya, tumpukan laporan, transkrip, atau spesifikasi yang tak terhitung banyaknya. Mengawali proses dengan melatih menggunakan data yang tidak berlabel dapat membantu mengidentifikasi dokumen serupa untuk pelabelan.
Ringkasan perbedaan: pembelajaran yang diawasi vs. tanpa pengawasan
Pembelajaran yang diawasi |
Pembelajaran tanpa pengawasan |
|
Apa itu? |
Anda melatih model dengan satu set data input dan satu set data output berlabel berpasangan yang sesuai. |
Anda melatih model untuk menemukan pola tersembunyi dalam data yang tidak berlabel. |
Teknik |
Regresi logistik, regresi linier, pohon keputusan, dan jaringan neural. |
Pembuatan klaster, pembelajaran aturan asosiasi, kepadatan probabilitas, dan pengurangan dimensi. |
Tujuan |
Memprediksi output berdasarkan input yang diketahui. |
Identifikasikan informasi hubungan yang penting di antara titik-titik data input. Lakukan juga pada input baru untuk menarik wawasan serupa. |
Pendekatan |
Minimalkan kesalahan antara output yang diprediksi dan label yang sebenarnya. |
Temukan pola, kesamaan, atau anomali dalam data. |
Bagaimana cara AWS membantu pembelajaran yang diawasi dan tanpa pengawasan?
Amazon Web Services (AWS) menyediakan berbagai penawaran untuk membantu proses machine learning (ML) Anda, baik yang diawasi, tanpa pengawasan, maupun yang semi-diawasi. Anda dapat membuat, menjalankan, dan mengintegrasikan solusi dengan berbagai ukuran, kompleksitas, atau kasus penggunaan.
Amazon SageMaker adalah sebuah platform lengkap untuk membangun solusi ML Anda dari tahap awal. SageMaker memiliki rangkaian lengkap model pembelajaran tanpa pengawasan prabangun, kemampuan penyimpanan dan komputasi, serta lingkungan yang terkelola penuh.
Misalnya, berikut adalah fitur SageMaker yang dapat Anda gunakan dalam pekerjaan:
- Gunakan Amazon SageMaker Autopilot untuk secara otomatis menjelajahi berbagai solusi dan menemukan model terbaik untuk set data yang Anda miliki.
- Gunakan Amazon SageMaker Data Wrangler untuk memilih data, memahami wawasan data, dan mengubah data sebagai persiapan untuk digunakan dalam ML.
- Gunakan Amazon SageMaker Experiments untuk menganalisis dan membandingkan iterasi pelatihan ML untuk memilih model yang kinerjanya paling bagus.
- Gunakan Amazon SageMaker Clarify untuk mendeteksi dan mengukur potensi bias. Dengan cara ini, developer ML dapat mengatasi bias potensial dan menjelaskan prediksi model.
Mulailah machine learning yang diawasi dan tanpa pengawasan di AWS dengan membuat akun sekarang juga.
Langkah Berikutnya dengan AWS
Pelajari cara memulai Machine Learning yang Diawasi di AWS
Pelajari cara memulai Machine Learning Tanpa Pengawasan di AWS