Categories
Uncategorized

Preprocessing

Oleh: Achmad Ibrahim Humam – 17106050029

Data preprocessing adalah tahapan yang sangat penting dalam proses data mining. Data yang ingin diproses untuk data mining tidak selalu dalam bentuk yang ideal, maka perlu adanya data preprocessing untuk membuat data itu lebih ideal untuk diproses.

Di dalam data preprocessing, data disiapkan melalui beberapa tahap agar lebih berguna dan memiliki format yang lebih efisien. Langkah-langkah yang dilakukan dalam data preprocessing adalah kurang lebih sebagai berikut:

Sumber:
Jiawei Han, Micheline Chamber, and Jian Pei. “Data Mining Concepts and Techniques”
https://www.geeksforgeeks.org/data-preprocessing-in-data-mining/

Categories
Uncategorized

Vertical Data Format

Oleh: Achmad Ibrahim Humam – 17106050029

Banyak sekali cara dan bentuk dalam menyajikan sebuah data. Misalnya dalam metode data mining seperti Apriori dan FP-growth, keduanya sama-sama mengolah data dalam format yang umum digunakan, yaitu format TID-itemset. Dalam format TID-itemset terdiri dari ID transaksi dan itemset yang merupakan serangkaian item yang ada dalam TID transaksi. Ini dikenal sebagai horizontal data format.

Selain itu ada juga cara lain, yaitu data dapat disajikan dalam format item-TIDset, di mana item adalah nama item dan TIDset adalah serangkaian ID transaksi yang berisi item tersebut. Nah inilah yang dikenal sebagai vertical data format. Berikut contoh penyajian data menggunakan vertical data format:

ITEMSETTID SET
I1{T101,T401,T501,T701,T801,T901}
I2{T101,T201,T301,T401,T601,T801,T901}
I3{T201,T501,T601,T701,T801,T901}
I4{T201,T401}
I5{T101,T801}

Sumber:
Jiawei Han, Micheline Chamber, and Jian Pei. “Data Mining Concepts and Techniques”

Design a site like this with WordPress.com
Get started