Korelasi. KBBI Daring mendefinisikan korelasi sebagai hubungan timbal balik atau sebab-akibat. Korelasi sendiri sering disebut dalam teori probabilitas dan statistika, yang memiliki arti nilai yang menunjukkan kekuatan dan arah hubungan antara dua buah variabel acak. Lalu, apa itu korelasi dalam data mining?
Salah satu fungsi dari data mining adalah untuk menggali Frequent Pattern; untuk selanjutnya disebut FP. Menggali FP akan mengarahkan kepada ditemukannya asosiasi dan korelasi menarik diantara data. Disinilah istilah korelasi digunakan.
Penemuan hubungan FP, asosiasi, dan korelasi di antara dataset yang besar akan sangat berguna dalam pemasaran selektif, analisis keputusan, dan manajemen bisnis. Contoh aplikasinya adalah dalam analisis berbasis market yang mempelajari pola pembeli dalam berbelanja dengan mencari barang-barang yang sering diblei bersama. Setelah menggunakan aturan asosiasi yang akan memenuhi ambang batas minimum, analisa dapat dilanjutkan untuk menemukan aturan korelasi, yang akan memberikan hubungan statistik antara itemset satu dengan yang lainnya.
“The primary objective is to measure the strength or degree associatioan between two variables. Ther coefficient correlation measures this strength of (linier) association. For example we may be interested in finding the correlation (coefficient) between smooking and lung cancer, between scores of statistics and mathematic examination, between high school grades and collage grades, and so on,” (Gujarati, Damodar, 1995).
sumber :
Han, Jiawei, Jian Pei, and Micheline Kamber. Data mining: concepts and techniques. Elsevier, 2011.
http://www.mega.nu:8080/ampp/rummel/uc.htm
https://kbbi.kemdikbud.go.id/entri/korelasi
By: Millati Pratiwi (17106050030)