Penambangan Data

Apa itu Penambangan Data:

Data mining adalah istilah bahasa Inggris yang dikaitkan dengan ilmu komputer yang terjemahannya adalah data mining . Ini terdiri dari fungsi yang mengumpulkan dan mengatur data, menemukan di dalamnya pola yang relevan, asosiasi, perubahan, dan anomali .

Istilah data mining pertama kali muncul pada tahun 1990 di komunitas basis data. Penambangan data adalah langkah analisis proses yang dikenal sebagai KDD ( Knowledge Discovery in Databases ), terjemahan harfiahnya adalah "Knowledge Discovery in Databases".

Penambangan data dapat dibagi menjadi beberapa langkah dasar: eksplorasi, pembangunan model, definisi pola, dan validasi dan verifikasi.

Penambangan data adalah praktik yang relatif baru di dunia komputasi, dan menggunakan pencarian informasi, kecerdasan buatan, pengenalan pola, dan teknik statistik untuk mencari korelasi antara data yang berbeda yang memungkinkan Anda untuk mendapatkan pengetahuan yang bermanfaat bagi perusahaan atau individu. Untuk sebuah perusahaan, penambangan data dapat menjadi alat penting yang meningkatkan inovasi dan profitabilitas.

Penggunaan data mining cukup umum di database besar, dan hasil akhir penggunaannya dapat ditampilkan melalui aturan, hipotesis, pohon keputusan, dendrogram, dll.

Penambangan data yang dilaksanakan dengan baik harus menyelesaikan tugas-tugas seperti: deteksi anomali, pembelajaran aturan asosiasi (pemodelan ketergantungan), pengelompokan, klasifikasi, regresi, dan peringkasan. Proses penambangan data biasanya terjadi menggunakan data yang terkandung dalam gudang data .

Ada beberapa perusahaan dan perangkat lunak yang didedikasikan untuk penambangan data, karena identifikasi pola dalam basis data semakin penting. Namun, identifikasi standar yang relevan tidak unik untuk dunia komputer. Otak manusia menggunakan proses serupa untuk mengidentifikasi pola dan memperoleh pengetahuan.

Dalam beberapa tahun terakhir, penambangan data telah banyak digunakan di bidang sains dan teknik seperti bioinformatika, genetika, kedokteran, pendidikan, dan teknik listrik.

Konsep penambangan data sering dikaitkan dengan penggalian informasi tentang perilaku orang. Karena alasan ini, dalam beberapa situasi, penambangan data menimbulkan masalah hukum dan masalah yang berkaitan dengan privasi dan etika. Meskipun demikian, banyak orang mengklaim bahwa data mining netral secara etis karena tidak memiliki implikasi etika.

Contoh Penambangan Data Nyata

Data mining sering digunakan oleh perusahaan dan organisasi untuk mendapatkan pengetahuan tentang pengguna / karyawan / pelanggan. Misalnya, di sektor publik adalah mungkin untuk memeriksa silang antara status perkawinan seorang karyawan dan gaji yang ia peroleh untuk melihat apakah ini memiliki pengaruh pada kehidupan perkawinannya.

Perusahaan seperti rantai supermarket dapat menggunakan data silang ini untuk menentukan produk yang dibeli bersama. Jika pelanggan yang membeli produk X juga membeli produk Y, mungkin ide yang bagus untuk menempatkan kedua produk di dekatnya agar lebih mudah bagi pelanggan untuk membeli.