indridwijuanti

17106050008 – Indri Dwi juanti

Asosiasi adalah metode yang menemukan suatu kombinasi item yang muncul bersamaan. Dalam dunia bisnis sering disebut dengan “Market Basket Analysis” atau analisis keranjang belanja . Biasanya menggunakan pola “jika(if) ” mewakili antecendent dan “maka(then)” mewakili consequence, bersamaan dengan pengukuran support (nilai penunjang) dan confidence (nilai kepastian) yang terasosiasi dalam aturan . Algoritma yang masuk kedalam Asosiasi adalah Algoritma Apriori, Fp Growth.

Penting tidaknya suatu aturan assosiatif dapat diketahui dengan dua parameter, support (nilai penunjang)
yaitu persentase kombinasi item tersebut dalam database dan confidence (nilai kepastian) yaitu kuatnya
hubungan antar item dalam aturan assosiatif.

Aturan assosiatif biasanya dinyatakan dalam bentuk :
{roti, mentega} -> {susu} (support = 40%, confidence = 50%)

Yang artinya : “50% dari transaksi di database yang memuat item roti dan mentega juga memuat item susu. Sedangkan 40% dari seluruh transaksi yang ada di database memuat ketiga item itu.” Dapat juga diartikan : “Seorang konsumen yang membeli roti dan mentega punya kemungkinan 50% untuk juga membeli susu. Aturan ini cukup signifikan karena mewakili 40% dari catatan transaksi selama ini.”
Analisis asosiasi didefinisikan suatu proses untuk menemukan semua aturan assosiatif yang memenuhi syarat minimum untuk support (minimum support) dan syarat minimum untuk confidence (minimum
confidence).

Metodologi dasar analisis asosiasi terbagi menjadi dua tahap :

a. Analisa pola frekuensi tinggi
Tahap ini mencari kombinasi item yang memenuhi syarat minimum dari nilai support dalam database. Nilai
support sebuah item diperoleh dengan rumus berikut:

sedangkan nilai support dari 2 item diperoleh dari rumus berikut:

b. Pembentukan aturan assosiatif
Setelah semua pola frekuensi tinggi ditemukan, barulah dicari aturan assosiatif yang memenuhi syarat
minimum untuk confidence dengan menghitung confidence aturan assosiatif A ->B
Nilai confidence dari aturan A ->B diperoleh dari rumus berikut:

sumber :

K Means

17106050008- Indri Dwi Juanti

Algoritma K-Means merupakan algoritma klasterisasi yang mengelompokkan data berdasarkan titik pusat klaster (centroid)
terdekat dengan data. Tujuan dari K-Means adalah pengelompokkan data dengan memaksimalkan kemiripan data dalam satu klaster dan meminimalkan kemiripan data antar klaster. Ukuran kemiripan yang digunakan dalam klaster adalah fungsi jarak . Perhitungan Jarak antara data dan centroid menggunakan rumus diantaranya adalah Manhattan/City Block Distance, Euclidean Distance dan Minkowski Distance.

Karakteristik K-Means

K-Means sangat cepat dalam proses clustering
K-Means sangat sensitif pada pembangkitan centroid awal secara random
Memungkinkan suatu cluster tidak mempunyai anggota
Hasil clustering dengan K-Means bersifat tidak unik (selalu berubah-ubah) – terkadang baik, terkadang jelek
K-means sangat sulit untuk mencapai global optimum

K-Means Clustering ini secara umum dilakukan dengan algoritma dasar sebagai berikut:

Tentukan jumlah cluster
Alokasikan data ke dalam cluster secara random
Hitung centroid/rata-rata dari data yang ada di masing-masing cluster
Alokasikan masing-masing data ke centroid/rata-rata terdekat
Kembali ke Step 3, apabila masih ada data yang berpindah cluster atau apabila perubahan nilai centroid, ada yang di atas nilai threshold yang ditentukan atau apabila perubahan nilai pada objective function yang digunakan di atas nilai threshold yang ditentukan

Contoh Perhitungan K-Means :

Diketahui : jumlah cluster = 3, jumlah data = 12 , dan jumlah atribut =2

2. Perhitungan jarak pusat cluster dengan menggunakan rumus Euclidian distance

3. Pengelompokkan Data

Dari data diatas kemudian data dikelompokkan , berdasarkan jarak hasil perhitungan kemudian dilakukan perbandingan dan dipilih jarak yang terdekat antara data dan pusat cluster.

keterangan :
tanda * pada tabel diatas merupakan jarak terpendek pada Cn .

4. Menentukan Pusat Cluster Baru

Setelah diketahui anggota pada masing-masing cluster , kemudian pusat cluster baru dihitung berdasarkan data anggota di tiap-tiap cluster . sesuai dengan rumus pusat anggota cluster . Cara menghitungnya yaitu dengan menjumlahkan seluruh anggota masing-masing cluster dibagi jumlah anggotannya .

Untuk iterasi ke 2 C1,C2, C3 nya menggunakan cluster yang baru .

lakukan perhitungan yang sama untuk iterasi ke 2

untuk mencari iterasi ke 3 , lakukan langkah yang sama seperti yang telah dilakukan sebelumnya . sehingga diperoleh hasil sebagai berikut :

Iterasi akan berakhir jika titik pusat dari setiap cluster tidak berubah
lagi dan tidak ada lagi data yang berpindah dari
satu cluster ke cluster yang lain.

Untuk Perhitungan Lengkapnya dapat dilihat melalui link berikut :
https://drive.google.com/file/d/1118CfrONmu-JQBjBPxNm_TTYsJZh5fQp/view?usp=sharing

sumber : http://journal.umy.ac.id/index.php/st/article/download/708/858

https://informatikalogi.com/algoritma-k-means-clustering/

https://syafrudinmtop.blogspot.com/2015/10/contoh-perhitungan-manual-kmeans-klastering.html