Categories
Uncategorized

Text Mining

Seto Rahardyanto / 17106050014

Apa itu Text Mining?

Text Mining Adalah informasi baru atau informasi yang belum diketahui yang dihasilkan oleh komputer secara otomatis berdasarkan data atau sumberdaya yang berbeda-beda. Intinya adalah menghubungkan berbagai informasi yag telah diketahui untuk membuat informasi baru untuk mendukung pengembangan lebih lanjut.

Text mining bertujuan untuk menghasilkan informasi yang belum pernah ada sebelumnya dan belum pernah ditulis sebelumnya.

Perbedaan dasar dari text mining dan data mining adalah text mining datanya berupa text yang diekstrak dari bahasa natural (seeprti Bahasa Indonesia / Bahasa Inggris), sedangkan data mining sumber datanya berasal dari basisdata terstruktur.

Bagaimana Text Mining?

Terdapat 2 fase dalam melakukan text mining, yakni: pemurnian teks yang mengubah dokumen text bebas menjadi bentuk perantara, dan mengubah bentuk perantara menjadi distilasi pengetahuan yang menyimpulkan pola pengetahuan / informasi.

Bentuk perantara dapat berupa representasi grafik konseptual atau representasi data relasional

Sumber:

  1. https://www.jaist.ac.jp/~bao/MOT-Ishikawa/FurtherReadingNo1.pdf
  2. http://www.ntu.edu.sg/home/asahtan/papers/tm_pakdd99.pdf
Categories
Uncategorized

Data Transformation

Seto Rahardyanto / 17106050014

Apa itu Data Transformation?

Data Transformation adalah proses mengubah data dari format atau struktur tertentu ke format atau struktur yang lain. Tujuan transformasi data adalah agar data menjadi lebih efisien dan lebih mudah untuk diolah dan dipahami.

Bagaimana Data Transformation?

Bila disederhanakan, data transformation dapat dilakukan dalam 4 proses: interpretasi data, pengecekan kualitas pra-translasi, translasi data, pengecekan kualitas pasca-translasi.

  • Interpretasi data: mengetahui format data saat ini ada dan mengetahui format yang ingin dilakukan translasi
  • Pengecekan kualitas pra-translasi: melakukan pengecekan daata apabila ada data yang hilang atau rusak
  • Translasi data: melakukan penggantian format data (replace) dengan format yang dituju / diinginkan
  • Pengecekan kualitas pasca-translasi: mengecek data apakah ada yang rusak atau hilang saat proses translasi

Sumber:

  1. Jiawei Han, Micheline Chamber, and Jian Pei. “Data Mining Concepts and Techniques”
  2. https://blog.syncsort.com/2018/10/big-data/data-transformation-process-four-steps/
Design a site like this with WordPress.com
Get started