Data Mining – Pengertian, Algoritma, Metode, Contoh
Data mining merupakan salah satu materi yang sangat penting, dan pada kali ini kami akan memberikan pembahasan mengenai data mining mulai dari pengertian, algoritma, metode dan juga contohnya.
Pengertian Data Mining
Data mining merupakan sebuah istilah yang biasa dipergunakan guna menemukan sebuah informasi yang awalnya tidak mudah diketahui, informasi ini sendiri tersembunyi pada database.
Data mining memiliki peran untuk digunakan sebagai analisis otomatis. Atau semi otomatis dengan jumlah data yang besar yang kemudian akan diekstrak dengan menggunakan pola yang menarik.
Untuk kemudian akan ditemukan :
- Analisis cluster (kelompok catatan data)
- Deteksi anomaly (catatan yang tak biasa)
- Aturan asosiasi pertambangan (dependensi)
Untuk menemukannya, digunakan teknik database, misalnya seperti indeks spasial.
Pola ini pun nantinya bisa dilihat sebagai ringkasan yang berasal dari imput data. Imput inilah yang digunakan untuk melakukan proses analisis lanjutan.
Algoritma Data Mining
Pada sebuah proses pemecahanan masalah dan pencarian solusinya, maka terdapat beberapa klasifikasi yang digunakan, berikut ini penjelasannya :
1.) Estimasi
Estimasi digunakan pada sebuah data baru yang tidak mempunyai keputusan jika dilihat berdasarpan pada histori data yang sudah ada. Misalnya saja seperti sedang melakukan estimasi pembiayaan untuk melakukan pembangunan rumah untuk setiap kota pastinya berbeda-beda.
2.) Klastering
Klastering digunakan untuk melakukan pengelompokkan yang berbeda-beda pada data. Hampir sama dengan klasifikasi akan tetapi proses ini menggunakan tool data mining. Metode yang dipergunakan pun biasanya adalah neural network atau disebut juga dengan statistik dan analitikal hierarki cluster. Proses ini dilakukan untuk membagi item ke dalam kelompok berdasarkan dengan apa yang telah ditemukan oleh tool data mining.
3.) Prediksi
Prediksi adalah algoritma yang digunakan untuk melakukan perkiraan atau disebut pula dengan forecasting pada sebuah kejadian yang belum terjadi, atau pada peristiwa tertentu yang belum dinyatakan terjadi. Misalnya seperti yang ada pada bidang Klimatologi dan Geofisika yang memperkirakan cuaca yang ada pada suatu daerah seperti hujan, panas dan juga lainnya.
Metode Data Mining
1.) Classification
Metode ini adalah metode yang paling sering digunakan pada data mining untuk melakukan analisis pada persoalan bisnis. Contohnya seperti Churn Analysis dan juga Risk Management.
Classification ini sendiri pun merupakan cara yang dilakukan untuk mengelompokkan setiap kondisi dan juga keadaan. Karena setiap keadaan akan berisi sekelompok atribut. Salah satu yang termasuk di dalamnya adalah class attribute. Sementara itu metode ini sendiri membutuhkan sebuah model yang digunakan untuk menjelaskan class attribute.
Contoh :
2.) Clustering
Clustering ini biasanya disebut juga dengan nama segmentation. Metode ini pun biasanya digunakan untuk melakukan identifikasi dan mengelompokkan data secara alami. Data ini biasa berasal dari sebuah kasur yang berasal dari sebuah kelompok atribut. Atau bisa juga dengan cara mengelompokkan data yang mempunyai karakteristik yang mirip dengan atributnya.
Untuk lebih jelasnya coba lihat gambar yang ada di bawah ini :
Pada gambar di atas, ditunjukkan sebuah kelompok data pelanggan yang dijelaskan secara sederhana. Data ini berisikan dua atribut yaitu umur atau age dan pendapatan atau income.
Selain itu metode ini digunakan untuk mengelompokkan data ke dalam tiga segment yang dilakukan berdasarkan kedua atribut seperti di bawah ini :
- Berisikan mengenai populasi usia muda yang memiliki pendapatan rendah.
- Berisikan mengenai populasi berusia menengah yang memiliki pendapatan lebih tinggi dari yang pertama.
- Berisikan mengenai populasi berusia lebih tua dengan pendapatan yang justru relatif lebih rendah dari yang lainnya.
Metode ini bisa disebut juga dengan metode data mining yang unsupervised. Artinya data ini tidak memiliki satu pun atribut yang digunakan untuk memberikan informasi atau panduan untuk proses pembelajaran. Sehingga semua atribut imput yang ada diperlakukan dengan sama saja antara satu dengan yang lainnya.
Tak jarang clustering digunakan untuk membangun sebuah metode atau model yang digunakan lewat serangkaian pengulangan. Dan juga bisa berhenti pada saat model tersebut sudah memusat atau sudah terkumpul.
3.) Association
Metode ini memiliki nama lain yaitu basket analysis. Hal ini dikarenakan masalah bisnis yang biasanya terjadi adalah pada saat melakukan analisa tabel transaksi penjualan dan juga untuk melakukan identifikasi produk produk yang sering dibeli secara bersamaan oleh konsumen.
Contohnya saja pada saat seseorang membeli cabai maka orang tersebut akan cenderung membeli tomat juga. Nah, kesamaan antara dara yang terdapat dari data pembelian yang digunakan untuk melakukan identifikasi atau pengelompokkan kesamaan yang berasal dari sebuah produk ditambah dengan kebiasaan menjadi salah satu cara untuk menunjukkan kepentingan cross-selling.
Bisa kalian lihat dari contoh yang ada di bawah ini :
Penjelasannya :
- Jika seseorang membeli keju maka orang tersebut akan cenderung membeli susu juga.
- Jika seseorang membeli soda maka orang tersebut akan cenderung membeli jus juga.
Nah, itu dia penjelasan lengkap mengenai data mining mulai dari pengertian, algoritma, metode hingga contohnya yang kami berikan secara lengkap untuk kalian semua, semoga bermanfaat!
Artikel Lainnya :