Bulan lalu saya ngobrol dengan kawan yang lebih advance mempraktekkan klasifikasi teks, kemudian saya menanyakan kenapa mannequin klasifikasi saya memiliki akurasi yang tergolong rendah (hanya sekitar 50%)? Beliau menjawab “coba pakai quick textual content sama Deep Studying mas, punyaku sampai 90% lebih”.
Sebenarnya banyak faktor yang dapat menyebabkan rendahnya akurasi mannequin, tetapi saran beliau layak dicoba sekaligus belajar hal baru (bagi saya). Istilah Deep Studying sudah lama terdengar khususnya di bidang pc imaginative and prescient, hanya saja baru kali itu saya mendengar dapat digunakan untuk klasifikasi teks. Terlebih hasilnya memuaskan sebagai sebuah mannequin.
Saya mendapatkan akses ke laporan tesis beliau, dan ada beberapa istilah yang saya sorot macam SVM, NLP, Quick textual content, Deep Studying, ANN, CNN, LSTM. Praktis dari beberapa tersebut hanya SVM dan NLP yang saya kenal karena memang pernah melakukannya dengan Machine Studying tradisional.
Dari proses ini ternyata tidak serta merta saya bisa langsung mempelajari hanya bab itu saja. Gara — gara belajar Deep Studying saya harus mengulang kembali untuk mempelajari matematika dasar seperti aljabar linier, deferensial, dan probabilita.
Sekilas tentang Pemodelan
Dalam banyak literatur mannequin diartikan sebagai representasi dunia nyata. Mannequin dibuat untuk membantu manusia dalam memahami fenomena dan memperkirakan kondisi di masa depan berdasarkan informasi yang diperoleh dan pengalaman yang dimiliki.
Contoh pemodelan paling sederhana yang telah banyak dikenal adalah mannequin regresi linier. Mannequin ini menggambarkan hubungan antara paling sedikit 2 variabel yaitu variabel independen (bisa banyak variabel) biasanya dinotasikan dengan x, dan variabel dependen (umumnya hanya 1) yang dinotasikan dengan y. Hubungan keduanya digambarkan dengan persamaan garis y = mx+c (kadang berbeda sumber, berbeda penulisan, tapi intinya sama). Notasi m adalah gradien atau kemiringan garis, dan c adalah konstanta. Variabel dependen (y) adalah variabel yang diprediksi nilainya menggunakan persamaan pada variabel independen (x).
Gambar tersebut memberikan contoh plot knowledge antara ukuran mesin dengan harga. Semakin besar ukuran mesin, maka…