Minggu, 19 Juni 2011

Fuzzy Clustering

JAN29

Fuzzy clustering adalah salah satu teknik untuk menentukan cluster optimal dalam suatu ruang vektor yang didasarkan pada bentuk normal euclidian untuk jarak antar vektor. Fuzzy clustering sangat berguna bagi pemodelan fuzzy terutama dalam mengindentifikasi aturan-aturan fuzzy. Metode clustering merupakan pengelompokan data beserta parameternya dalam kelompok – kelompok sesuai kecenderungan sifat dari masing-masing data tersebut (kesamaan sifat).  
Ada beberapa algoritma clustering data, salah satu diantaranya adalah Fuzzy C-Means. Fuzzy C-Means adalah suatu teknik peng-cluster-an yang mana keberadaannya tiap-tiap titik data dalam suatu cluster ditentukan oleh derajat keanggotaan. Teknik ini pertama kali diperkenalkan oleh Jim Bezdek pada tahun 1981. 
Konsep dari Fuzzy C-Means pertama kali adalah menentukan pusat cluster, yang akan menandai lokasi rata-rata untuk tiap-tiap cluster. Pada kondisi awal, pusat cluster ini masih belum akurat. Tiap-tiap titik data memiliki derajat keanggotaan untuk tiap-tiap cluster. Dengan cara memperbaiki pusat cluster dan derajat keanggotaan tiap-tiap titik data secara berulang, maka akan dapat dilihat bahwa pusat cluster akan bergerak menuju lokasi yang tepat. Perulangan ini didasarkan pada minimasi fungsi obyektif yang menggambarkan jarak dari titik data yang diberikan kepusat cluster yang terbobot oleh derajat  keanggotaan titik data tersebut. 
Output dari Fuzzy C-Means merupakan deretan pusat cluster dan beberapa derajat keanggotaan untuk tiap-tiap titik data. Informasi ini dapat digunakan untuk membangun suatu fuzzy inference system.
Fuzzy C-Means diperkenalkan pertama kali oleh JIM BEZDEK pada tahun 1981. Fuzzy C-Means adalah suatu teknik clustering data dimana tiap data dalam suatu cluster ditentukan oleh derajat keanggotaannya.

Terdapat beberapa perbedaan yang mendasar antara teknik clustering klasik dengan teknik clustering fuzzy yaitu pada partisi clustering yang bersifat klasik, suatu data hanya menjadi anggota pada satu cluster saja, sedangkan pada partisi fuzzy suatu data bisa menjadi anggota pada dua cluster yang berbeda. Hal ini disebabkan karena nilai keanggotaan suatu data pada partisi fuzzy terletak pada interval 0 sampai dengan 1.



Konsep Fuzzy C-Means :

1. Penentuan pusat cluster yang menandai lokasi rata-rata untuk tiap cluster, dengan kondisi awal tidak akurat.
2. Tiap data memiliki derajat keanggotaan untuk masing-masing cluster.
3. Dengan perulangan yang didasarkan pada minimisasi fungsi obyektif, pusat cluster dan nilai kenaggotaan diperbaiki. Sehingga lokasi cluster bisa berada pada posisi yang benar.

Rumus Fuzzy C-Means :

1. Buat matriks partisi awal secara acak, dengan ketentuan jumlah setiap kolom pada matrik harus sama dengan 1




2. Hitung Pusat Cluster, dg persamaan :


Ket : V = Pusat ClusterW = pangkat atau pembobot ( W > 1 )
3. Perbaiki derajat keanggotaan setiap anggota


dengan mencari jarak (d) antara pusat dan data


4. Tentukan nilai kriteria berhenti.


Nilai kriteria berhenti merupakan perubahan yang terjadi pada matrik partisi pada iterasi sekarang dengan iterasi sebelumnya.

Jika nilai kriteria berhenti lebih besar atau sama dengan selisihnya maka hentikan proses, tetapi jika tidak kembali ke PERUMUSAN 2 (hitung pusat cluster).

2 komentar:

  1. mau nanya dong untuk datanya emang harus matrik?? bingung saya soal datanya soalnya..

    BalasHapus
  2. mau tanya apabila ada tabel data trdiri dari 5 baris 3 kolom mau dibuat 2 matriks nah itu bagaimana ya mas?

    BalasHapus