Machine Learning adalah proses pelatihan perangkat lunak yang disebut model untuk menghasilkan prediksi yang bermanfaat atau berguna dari kumpulan data. Model disini diartikan sebagai representasi apa yang telah dipelajari oleh Machine Learning dari data pelatihan/mengekspresikan struktur bagaimana prediksi di hitung.
Hasil yang didapatkan berupa prediksi yang belum ada sebelumnya. Misal memprediksi destinasi wisata yang paling disukai oleh wisatawan luar negeri, sehingga dihasilkan rekomendasi suatu destinasi wisata.
Dalam Machine Learning ada 3 paradikma yaitu supervised, unsupervised learning, dan semi-supervised.
Supervised learning
Supervised learning merupakan tipe Machine Learning dimana model ini menyediakan training data berlabel. Dalam bahasa Indonesia, arti Supervised learning adalah pembelajaran mesin yang diawasi karena memiliki “label” yang menunjukan mana bagian “hasil”.
Label digunakan untuk kolom jawaban. Contohnya label (secara mudah kita melihat sebagai nama kolom jawaban), misal: “result”, “jawaban”, atau “hasil”. Contoh training data berlabel lainnya:
Email yang dikirim kosong, berisi promosi tidak di inginkan, maka label yang cocok “email spam” atau “bukan spam”. Contoh lain:
Jumlah buku jumlah RAM, jumlah memory internal, resolusi layar, kolom hasil dapat diberikan label “harga smartphone”.
Selain label, ada istilah “fitur” yaitu variabel masukan untuk membuat prediksi yang di hasilkan Machine Learning.
Contoh pemanfaatan Supervised learning: mendeteksi penyakit kangker dari gambar.
Unsupervised Learning
Pada Unsupervised learning dalam bahasa Indonesia adalah “pembelajaran tanpa pengawasan”. Unsupervised bertujuan untuk mengidentifikasi pola yang memiliki makna dalam data. Jika Supervised Learning belajar dari data dengan label, maka di Unsupervised mesin harus belajar dari kumpulan data tanpa label.
Karena tidak adanya petunjuk, salah satu cara untuk mendapatkan memprediksinya adalah dengan menggunakan cluster (salah satu algoritma dalam Unsupervised Learning).
Contoh algoritme Supervised:
- Naive Bayes
- Support Vector Machines
- k-nearest neighbor algorithm
- linear regression
- linear discriminant analysis
- logistic regression
- decision trees
- Neural Networks (Multilayer perceptron)
- Similarity learning
- Fuzzy K-Nearest Neighbor
Contoh algoritme Unsupervised Learning:
- Algoritme Apriori
- Hierarchical Clustering
- Self-Organizing Map
- DBSCAN
- K-Means
- Fuzzy C-Means
Unsupervised Learning dikelompokan menjadi 2:
Clustering dan Asosiasi.
Clustering: Pengelompokan inheren dalam data seperti pengelompokan pengguna dengan perilaku pembelian, misal: Pembeli rajin, tidak rajin. Contoh dengan algoritme Clustering.
Asosiasi: Untuk menemukan aturan yang menggambarkan bagian besar dari data seperti membeli X maka juga mungkin membeli Y. Contoh Algoritme Apriori
Supervised Learning dikelompokan menjadi 2:
Classification dan Regression.
Classification: Ketika variabel hasil atau output berupa kategori. Misal: Sakit/tidak sakit, kuning, hijau, spam/tidak spam. Contoh Algoritme: Support vector machine untuk klasifikasi.
Regression: Ketika variabel output memiliki nilai seperti: Rupiah (mahal, murah, sedang), berat (berat, tidak berat, sedang), jarak (jauh, dekat, sedang). Contoh Algoritme: Linier regression untuk masalah regresi.
Contoh Algoritme yang dapat digunakan untuk keduanya (Classification atau Regression): Random forest.
Semi Supervised
Misal: Sejumlah besar data input X dan hanya beberapa yang diberi label Y.
Contoh kasus: Dicky Ibrohim menyimpan dokumen fot. Anjing, Macam, burung, manusia, sisanya tidak diberi label. Ini aadalah contoh didunia nyata yang masuk ke semi supervised.
Kita dapat menggunakan Teknik unsupervised untuk menentukan struktur dan variabel input dan juga dapat menggunakan teknik supervised untuk membuat prediksi menebak data tanpa label dengan data learning yang ada.
Pada semi Supervised, beberapa data memiliki label tetapi sebagian lainnya tidak memiliki label (campuran atara unsupervised dan supervised dapat digunakan).
Sekian dulu artikel untuk memahami mendalam tentang Supervised, Unsupervised, dan Semi Supervised (Machine Learning). Semoga bermanfaat.