Data Mining

Hallo, kali ini saya akan berbagi sedikit materi mengenai Data Mining, bagi yang kuliah di Ilmu Komputer, atau Teknik Informatika pasti pernah denger kan istilah Data Mining.. Nah bagi yang pengen tahu gambaran umum mengenai Data Mining, berikut saya kasih informasinya.

PENGERTIAN DATA MINING

Data mining adalah sebuah proses untuk menemukan pola atau pengetahuan yang bermanfaat secara otomatis dalam data yang berjumlah banyak dengan menggunakan teknik atau metode tertentu.

Menurut Han, dan Kamber (2006) data mining merupakan pemilihan atau “menambang” pengetahuan dari jumlah data yang banyak. Data mining sering dianggap sebagai bagian dari Knowledge Discovery in Database (KDD) yaitu sebuah proses mencari pengetahuan yang bermanfaat dari data, proses Knowledge Discovery  terdiri dari tahapan sebagai berikut :

  1. Data cleaning

Proses cleaning mencakup antara lain membuang duplikasi data, memeriksa data yang inkonsisten, dan memperbaiki kesalahan pada data seperti kesalahan cetak (tipografi).

  1. Data integration

Pada tahap data integration dilakukan pengecekan kombinasi data terhadap data yang berasal dari banyak sumber.

  1. Data selection

Pemilihan (seleksi) data dari sekumpulan data operasional perlu dilakukan sebelum tahap penggalian informasi. Data hasil seleksi yang akan digunakan untuk proses data mining disimpan dalam suatu berkas terpisah dari basis data operasional.

  1. Data transformation

Merupakan proses transformasi pada data yang telah dipilih, sehingga data tersebut sesuai untuk proses data mining. Proses ini merupakan proses kreatif dan sangat tergantung pada jenis atau pola informasi yang akan dicari dalam basis data. Kadang-kadang transformasi data dan konsolidasi dilakukan sebelum proses seleksi data, khususnya dalam kasus data warehousing. Reduksi data juga dapat dilakukan untuk mendapatkan representasi yang lebih kecil dari data asli tanpa mengorbankan integritasnya.

  1. Data mining

Pemilihan tujuan dari proses KDD misalnya klasifikasi, regresi, clustering, dll. Proses data mining adalah proses mencari pola atau informasi menarik dalam data terpilih menggunakan teknik dan metode tertentu. Pemilihan metode atau algoritma yang tepat sangat bergantung pada tujuan dan proses KDD secara keseluruhan.

  1. Pattern evalution

Proses yang mengidentifikasi pola yang benar-benar menarik yang mewakili pengetahuan berdasarkan beberapa ukuran tindakan meliputi hipotesa sebelumnya.

  1. Knowledge presentation

Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan.

TUGAS-TUGAS DATA MINING

Menurut Han dan Kamber (2001), tugas data mining berdasarkan fungsinya dikategorikan menjadi dua yaitu deskriptif dan prediktif. Data mining secara deskriptif bertugas mengkarakteristik properti data pada basis data, sedangkan tugas data mining prediktif yaitu membuat prediksi berdasarkan kesimpulan dari data yang ada. Fungsionalitas data mining dideskripsikan sebagai berikut :

  1. Asosiasi

Asosiasi adalah proses menemukan aturan asosiasi yang didapatkan dari frekuensi suatu atribut pada sekumpulan data

  1. Deskripsi Konsep / Kelas

Deskripsi konsep / kelas memberikan ringkasan yang jelas dan tepat dari sekumpulan data. Deskripsi dapat diperoleh dari karakteristik data dan diskriminasi data atau kedua-duanya.

  1. Klasifikasi

Klasifikasi merupakan proses pencarian sekumpulan model atau fungsi yang menggambarkan dan membedakan kelas atau konsep data dengan maksud menggunakan model tersebut sebagai prediksi terhadap kelas atau obyek dimana label kelas tersebut tidak diketahui.

  1. Analisa Klaster

Berbeda dengan klasifikasi, klasterisasi merupakan unsupervised learning. Dalam klasterisasi, label kelas tidak didefinisikan terlebih dahulu.

  1. Analisa Outlier

Outlier adalah objek data yang tidak memenuhi model dan persyaratan secara umum. Obyek data outlier berbeda dan tidak konsisten dengan data set yang ada. Kebanyakan metode data mining menganggap outlier sebagai sampah.

DATA PREPROCESSING

Menurut Han dan Kamber (2006), data preprocessing merupakan proses persiapan data yang dilakukan dengan tujuan menyesuaikan kondisi data agar sesuai dengan kebutuhan pada proses analisis (data mining). Data preprocessing memakan waktu paling lama diantara proses-proses pencarian pengetahuan (knowledge discovery). Data preprocessing diperlukan karana data yang dimiliki sering kali tidak lengkap, tidak konsisten, banyak terjadi perulangan data yang tidak perlu, dan memuat anomali atau error. Metode pada data preprocessing yaitu :

  1. Pembersihan Data (Data Cleaning)

Data cleaning bertujuan melengkapi atau menghapus data yang tidak lengkap, menghilangkan data noise, mengidentifikasi atau menghapus anomali, dan mengatasi masalah konsisten data.

  1. Integrasi Data (Data Integration)

Integrasi data adalah suatu teknik mengkombinasikan data dari beberapa sumber dalam satu tempat penyimpanan, misalnya gudang data (data warehouse). Sumber tersebut bisa berupa multiple database, data cube atau file-file.

  1. Transformasi Data (Data Transformation)

Data mentah perlu dilakukan proses transformasi untuk meningkatkan performanya. Dalam transformasi data, data diubah menjadi bentuk yang bisa ditambang.

  1. Reduksi Data (Data Reduction)

Data yang kompleks akan membutuhkan waktu yang lama untuk menambang. Teknik reduksi data sangat membantu mereduksi data yang kompleks tanpa mengurangi integritas dari data yang asli dan tidak mengurangi kualitas informasi yang dihasilkan.

Sumber:
Han, J. dan Kamber, M., 2001, Data Mining: Concepts and Techniques.USA: Morgan Kaufamann, Academic Pers.
Han, J. dan Kamber, M., 2006, Data Mining: Concepts and Techniques-Chapter 2. USA: Elsevier.
http://globallavebookx.blogspot.co.id/2015/01/pengertian-definisi-dan-fungsi-data.html

Analisis dan Perancangan Sistem Informasi

KONSEP DASAR SISTEM

Murdick dan Ross (1993) mendefinisikan sistem sebagai seperangkat elemen yang digabungkan satu dengan yang lainya untuk suatu tujuan bersama.

Sementara definisi sistem dalam kamus Webster’s Unbriged adalah elemen-elemen yang saling berhubungan da membentuk satu kesatuan atau organisasi.

Menurut Scott (1996), sistem terdiri dari unsur-unsur seperti masukan (input), pengolahan (processing), serta keluaran (output).

Gambar 1. Model Sistem

Gambar di atas menunjukkan bahwa sistem atau pendekatan sistem minimal harus mempunyai empat komponen, yakni masukan, pengolahan, keluaran, dan balikan atau control.

Sementara Mc/Leod (1995) mendefinisikan sistem sebagai sekelompok elemen-elemen yang terintegrasi dengan maksud yang sama untuk mencapai suatu tujuan. Sumber daya mengalir dari elemen output dan untuk menjamin prosesnya berjalan dengan baik maka dihubungkan dengan mekanisme control. Untuk lebih jelasnya elemen sistem tersebut dapat digambarkan dengan model sebagai berikut :

Gambar 2. Model hubungan elemen-elemen sistem

Schronderberg (1997) dalam Suradinata (1996) secara ringkas menjelaskan bahwa sistem adalah:

  1. Komponen-komponen yang saling berhubungan satu sama lain
  2. Suatu keseluruhan tanpa memisahkan komponen pembentuknya
  3. Bersama-sama dalam mencapai tujuan
  4. Memiliki input dan output yang dibutuhkan oleh sistem lainya
  5. Terdapat proses yang mengubah input menjadi output
  6. Menunjukkan adanya entropi
  7. Memiliki aturan
  8. Memiliki subsitem yang lebih kecil
  9. Memiliki deferensiasi antar subsistem
  10. Memiliki tujuan yang sama meskipun mulainya berbeda.

PENGERTIAN SISTEM INFORMASI

Untuk memahami pengertian sistem informasi, harus dilihat keterkaitan antara data dan informasi sebagai entitas penting pembentuk sistem informasi. Data merupakan nilai, keadaan, atau sifat yang berdiri sendiri lepas dari konteks apapun. Sementara informasi adalah data yang telah diolah menjadi sebuah bentuk yang berarti bagi penerimanya dan bermanfaat dalam pengambilan keputusan saat ini atau mendatang (Davis, 1995).

Mc Leod (1995) mengatakan bahwa informasi adalah data yang telah diproses, atau data yang memiliki arti.

Sistem Informasi Manajemen (SIM) dapat didefinisikan sebagai suatu alat untuk menyajikan informasi dengan cara sedemikian rupa sehingga bermanfaat bagi penerimanya (Kertahadi, 1995). Tujuanya adalah untuk menyajikan informasi guna pengambilan keputusan pada perencanaan, pemrakarsaan, pengorganisasian, pengendalian kegiatan operasi subsistem suatu perusahaan dan menyajikan sinergi organisasi pada proses (Murdick dan Ross, 1993).

PENGERTIAN ANALISIS DAN PERANCANGAN SISTEM

Analisis sistem didefinisikan sebagai bagaimana memahami dan menspesifikasi dengan detail apa yang harus dilakukan oleh sistem. Sistem desain diartikan sebagai menjelaskan dengan detai bagaimana bagian-bagian dari sistem informasi diimplementasikan.

Analysis : mendefinisikan masalah –> From requirements to specification

Design : memecahkan masalah –> From specification to implementation

TUJUAN ANALISIS 

  • Menentukan kelemahan dari proses-proses bisnis pada sistem lama untuk bisa menentukan kebutuhan dari sistem baru
  • Menentukan tingkat kelayakan kebutuhan sistem baru tersebut ditinjau dari beberapa aspek, diantaranya ekonomi, teknik, operasional, dan hukum.
  • Menjawab pertanyaan-pertanyaan berikut :
    • Siapa yang akan menggunakan sistem?
    • Sistem yang dikembangkan akan seperti apa?
    • Apa yang bisa dikerjakan sistem?
    • Kapan sistem akan digunakan?

TAHAPAN ANALISIS SISTEM

Identify

Yaitu mengidentifikasi masalah yang meliputi :

      • Mengidentifikasi Penyebab Masalah
      • Mengidentifikasi Titik Keputusan
      • Mengidentifikasi Personil-Personil Kunci

Contoh Mengidentifikasi Masalah:

Untuk kasus PT Suka Maju di system pengendalian pemasaran dan penjualan, subyek – subyek masalah yang terjadi :

      • Langganan mengeluh karena pelayanan kurang baik dan barang yang dikirim sering tidak sesuai
      • Banyak piutang tidak tertagih Pengendalian manajemen kurang efektif

Mengidentifikasi Penyebab Masalah:

      • Langganan mengeluh karena pelayanan kurang baik dan barang yang dikirim sering tidak sesuai
          Penyebab :

        • Pelayanan yang kurang baik kepada pelanggan
        • Barang yang dikirim sering tidak sesuai
      • Banyak piutang tidak tertagih
          Penyebab :

        • Evaluasi pemberian kredit yang kurang benar
        • Penagihan piutang yang tidak efektif
      • Pengendalian manajemen kurang efektif
          Penyebab :

        • Kurang tersedianya laporan yang berkualitas

Mengidentifikasi Titik Keputusan:

    • Pelayanan yang kurang baik kepada pelanggan
        Titik keputusan :

      • “Penanganan order langganan” dibagian order penjualan.
      • “Proses pembuatan order penjualan” dibagian order penjualan.
      • “Proses evaluasi kredit” di bagian kredit.
      • “Proses pengambilan barang” di gudang.
      • “Proses pembuatan dokumen pengiriman” dan laporan pengiriman di bagian pengiriman.
      • “Proses pembuatan faktur” di bagian billing.
    • Barang yang dikirim sering tidak sesuai
        Titik Keputusan :

      • “Kebenaran data di faktur” di bagian billing.
      • “Kelengkapan faktur yang didukung dengan laporan pengiriman” di bagian billing.
    • Evaluasi pemberian kredit yang kurang benar.
        Titik Keputusan :

      • “Dukungan informasi untuk pemberian kredit” di bagian kredit.
    • Kurang tersedianya laporan yang berkualitas
        Titik Keputusan :

      • “Proses pembuatan laporan” di bagian akuntansi

Mengidentifikasi Personil-Personil Kunci

Understand

yaitu memahami kerja dari sistem yang ada

Memahami kerja dari sistem yang ada meliputi :

  • Menentukan Jenis Penelitian
  • Merencanakan Jadual Penelitan
  • Membuat Penugasan Penelitian
  • Membuat Agenda Wawancara
  • Mengumpulkan Hasil Penelitian

Contoh :

Analyze

yaitu menganalisis hasil penelitian meliputi :

  • Menganalisis kelemahan sistem
  • Menganalisis kebutuhan informasi pemakai

Report

yaitu membuat laporan hasil analisis. Tujuanya adalah :

  • Tujuan Pelaporan bahwa analisis telah selesai dilakukan
  • Meluruskan kesalhan pengertian mengenai apa yang telah ditemukan dan dianalisis oleh analis system tetapi tidak sesuai menurut manajemen
  • Meminta pendapat-pendapat dan saran-saran dari pihak manajemen
  • Meminta persetujuan kepada pihak manajemen untuk melakukan tindakan selanjutnya (dapat berupa meneruskan ke tahap desain system atau menghentikan proyek bila dipandang tidak laya lagi)

 

 

Sumber :

Fatta, Hanif A. 2007. Analisis & Perancangan Sistem Informasi. Andi : Yogyakarta