TOTO HARYANTO

Sedikit goresan menebar manfaat …..

Archive for the 'Data Mining' Category

Antara Ciri dan Principal Componen Analysis (PCA)

Posted by totoharyanto on 26th March 2016

Jumat, 25 Maret 2016

Alhamdulillah atas izin Alloh subhanahuwata’ala malam menjelang pagi ini masih bisa meluangkan waktu untuk menulis dan berbagi.  Ada yang tidak biasa ketika dua minggu terakhir ini saya diminta untuk mengajar salah mata kuliah dengan topik Principal Component Analysis (PCA). Saya menyadari bahwa topik ini butuh persiapan lebih. Mengapa ? Karena justru menurut saya mahasiswa harus memahami dahulu apa filosofi dari PCA ini. Atas bantuan koordinator  (Pak Aziz Kustiyo-Nuhun ya Pak) saya mendapatkan delapan lembar bahan untuk dipelajari.

Materi PCA diberikan dalan dua kali pertemuan. Pertemuan pertama adalah penjelasan apa itu PCA, hubungan antara PCA dengan variabel/fitu/ciri/atribut dari suatu data. Pertama juga sekaligus menjelaskan kepada mahasiswa bahwa adanya ekivalensi antara ragam suatu Y yang merupakan kombinasi linear dari variabel X1 dan X2  dengan hasil dari at S x a.

Berbicara mengenai PCA maka, saya sampaikan bahwa salah satu persan dari PCA adalah kemampuannya untuk melakukan reduksi dimensi dari data yang kita miliki. Artinya jika kta memiliki sejumlah ciri dari data dengan jumlah yang sangat besar, kita dapat mengurangi berdasarkan informasi proporsi yang kita inginkan. Dengan demikian, meksipun tentunya ada trade-off antara berkurangnya informasi ciri atau efisiensi proses komputasi.

Berbicara tentang ciri juga saya bertanya kepada mahasiswa. Mengapa ciri itu penting ? Salah satu mahasiswa yang saya tunjuk mejawab : “Agar kita dapat mengidentifikasi sesuatu Pak.”.  “Jawaban yang bagus, saya katakan”. Jadi teringat faidah dari salah seorang ustadz. Jika murid menjawab banar  berilah apresiasi agar menambah semangat.

Ternyata memang di dalam kehidupan nyata pun, ciri itu memiliki peran yang penting. Banyak yang Alloh jelaskan dalam Al Qur’an. Jika kita menyimak Awal surat Al Mukminin :

قَدْ أَفْلَحَ الْمُؤْمِنُونَ (١) الَّذِينَ هُمْ فِي صَلاتِهِمْ خَاشِعُونَ (٢) وَالَّذِينَ هُمْ عَنِ اللَّغْوِ مُعْرِضُونَ (٣) وَالَّذِينَ هُمْ لِلزَّكَاةِ فَاعِلُونَ (٤)وَالَّذِينَ هُمْ لِفُرُوجِهِمْ حَافِظُونَ (٥) إِلا عَلَى أَزْوَاجِهِمْ أوْ مَا مَلَكَتْ أَيْمَانُهُمْ فَإِنَّهُمْ غَيْرُ مَلُومِينَ (٦) فَمَنِ ابْتَغَى وَرَاءَ ذَلِكَ فَأُولَئِكَ هُمُ الْعَادُونَ (٧) وَالَّذِينَ هُمْ لأمَانَاتِهِمْ وَعَهْدِهِمْ رَاعُونَ (٨) وَالَّذِينَ هُمْ عَلَى صَلَوَاتِهِمْ يُحَافِظُونَ (٩) أُولَئِكَ هُمُ الْوَارِثُونَ (١٠) الَّذِينَ يَرِثُونَ الْفِرْدَوْسَ هُمْ فِيهَا خَالِدُونَ (١١

Artinya :

1. Sungguh beruntung orang-orang yang beriman,
2. (yaitu) orang yang khusyu’dalam shalatnya,
3. dan orang yang menjauhkan diri dari (perbuatan dan perkataan) yang tidak berguna,
4. dan orang yang menunaikan zakat,
5. dan orang yang memelihara kemaluannya,
6. Kecuali terhadap istri-istri mereka atau hamba sahaya yang mereka miliki; maka sesungguhnya mereka tidak terceIa.
7. Tetapi barang siapa mencari di balik itu, maka mereka itulah orang-orang yang melampaui batas.
8. dan (sungguh beruntung) orang yang memelihara amanat-amanat dan janjinya,
9. serta orang yang memelihara shalatnya.
10. Mereka itulah orang yang akan mewarisi,
11. (yakni) yang akan mewarisi (surga) Firdaus. Mereka kekal di dalamnya.

Ayat tersebut menjelaskan ciri-ciri dari orang mukmin. Dalam surat Al Baqoroh di awal surat disebutkan ciri dari porang yang bertaqwa. Begitu pula Rasulullah Muhammad shallallahu alaihi wasallam  ketika didatangi malaikat jibril dalam wujud manusia yang berbaju putih dengan rambut yang hitam (Lihat Hadits ke-2 Arbain An Nawawi). Malaikat Jibril bertanya mengenai kapan terjadinya hari kiamat. Maka Rasulullah Muhammad shallallahu alaihi wasallam menjawab bahwa yang ditanya tidaklah lebih tahu dari pada yang bertanya. Intinya kapan hari kiamat adalah rahasia Alloh subhanahuwata’ala . Oleh karena itu Malaikat Jibril bertanya mengenai ciri-ciri hari kiamat lantas Rasulullah Muhammad shallallahu alaihi wasallam pun menjawabnya.

Dalam kita Tauhid (Syaharah Syaikh Sholeh Fauzan) terdapat ciri-ciri orang yang masuk syurga tanpa hisab dan adzab yaitu orang tidak minta diruqyah, tidak minta diobati dengan cara kay (besi panasa), tidak melakukan tathoyur dan bertawakal kepada Alloh subhanahuwata’ala.  Bahkan ketika ditanya siapa golongan yang selamat,Rasulullah Muhammad shallallahu alaihi wasallam tidak menjawab “Fulan” atau “Alan” tetapi menjawab ciri-ciri nya yaitu siapa saja yang aku berada di atasnya dan di atas jalan para sahabatu.

Semoga bermanfaat.
Bismika Allahuma amutu wa ahya …


Posted in Data Mining | No Comments »

Multimedia Mining dan Multimedia Retrieval

Posted by totoharyanto on 30th December 2009

Toto Haryanto [G651080091]

Multimedia Mining

Proses akuisisi data mutimedia, kebutuhan akan media penyimpanan kerap kali dibutuhkan. Di sisi lain, jika data multimedia ini dianalisa, akan didapatkan banyak informasi yang diperoleh. Multimedia mining sangat erat dengan prose penggalian infomasi yang implisit dari data multimedia yang tersimpan.(Kotsiantis ). Multimedia mining lebih dari sekedar perluasan dari bidang data mining yang merupakan interdisplin dari berbagai disiplin seperti computer vision, multimedia retrieval, teks mining, machine learning dan data mining itu sendiri.
Multimedia mining mampu secara otomatis melakukan ekstraksi secara semantik informasi yang sangat berarti (knowledge) pada berkas multimedia. Dengan latar belang inilah, sejumlah metode diusulkan untuk melakukan pengukuruan sederhana dari aspek-apsek dalam berkas mutimedia. Sebagai contoh warna hitogram untuk gambar, estimasi energi untuk data audio dan peringkasan program Televisi (Automatic Summarization of TV Program).
Secara umum, sistem basis data multimedia menyimpan sejumlah besar informasi dalam objek yang berbeda, mulai dari teks, gambar dan suara. Oleh karena itu, diperlukan suatu tools yang mampu untuk menangani relationships komponen yang terdapat di dalam data multimedia itu. Pada multimedia mining, umunya dilakukan praproses terlebih dahulu dari masing-masing komponennya untuk memperbaiki kualitas datanya. Setelah itu, data multimedia melalui proses transformasi dan ekstraksi fitur yang bervariasi untuk dapat membangkitkan fitur penting dari data multimedia tersebut.

Proses Multimedia Mining
Menurut Kotsiantis et. al, proses multimedia mining dapat digambarkan pada Gambar 1 sebagai berikut:

Gambar 1 Model proses Multimedia Mining

Pada Gambar 1 dapat dijelaskan sebagai berikut. Data multimedia yang terdiri dari komponen teks, gambar dan audio mengalami proses ekstraksi fitur yang tentunya akan berbeda tekniknya. Sebagai contoh, untuk data teks akan dihasilkan token, dengan prose tokenisasi, data gambar, ekstraksi fitur dilakukan dengan kuantiasasi histogram, dan data suara ekstraksi fitur dilakukan dengan MFCC. Adapun ekstraksi fitur pada video, dapat dilihat dari jenis videoanya apakah produced video, raw video atau medial video. Setelah proses ekstraksi fitur dilakukan untuk setiap komponen pada data multimedia, berikutnya adalah dilakukan proses seleksi fitur untuk mendapatkan fitur yang mampu memberikan informasi dominan terhadap data. Tahap berikutnya adalah proses pelatihan atau training untuk mendapatkan model data yang representatif. Proses mendapatkan model dapat dilakukan dengan model klasifikasi, klastering atau model asosiasi.

Multimedia Retrieval
Multimedia Retrieval adalah bagian dari disiplin ilmu temu kembali informasi atau Information Retrieval yang difokuskan pada data multimedia. Temu kembali pada basis data multimedia biasanya mencakup kombinasi dari jenis data teks dan image (Bagherjeiran, et.al,). Karena pada Multimedia retrieval tidak hanya memiliki satu jenis objek data, maka model temu kembali (retrieval) yang dilakukan adalah temu kembali berbasis isi (content based Information Retrieval) karena pada data multimedia tidak hanya aspek teks saja yang bisa dijadikan sebagai kueri. Dengan kata lain ada aspek selain teks yang bisa dijadikan sebagai kuaeri seperti audio atau gambar. Adapun arsitektur dalam content based Information Retrieval untuk data multimedia dapat dilihat pada Gambar 2 (Wei & Li, 2004)


Gambar 2. Arsitektur Content Based Information Retrieval

Apabila dilihat, proses ekstraksi fitur dilakukan baik pada multimedia mining maupun pada multimedia retrival. Namun terdapat beberapa perbedaan yang ada antara multimedia mining dan multimedia retrieval. Berikut adalah perbedaannya.

Perbedaan Mendasar Multimedia Mining dan Multimedia Retrieval


Pada multimedia mining memiliki cakupan yang lebih luas bila dibandingkan dengan multimedia retrieval. Dengan kata lain, multimedia retrieval sebagai salah satu bagian dari multimedia mining.
Pendekatan yang dilakukan pada multimedia mining adalah data driven sedangkan pada multimedia retrieval adalah goal driven. Artinya pada multimedia mining lebih menekankan pada proses analisa data multimedia sehingga dapat menggali pengetahuan dari data tersebut. Adapun multimedia retrieval, lebih menekankan pada relevansi data multimedia yang ditemukembalikan.
Pada multimedia mining, dapat diketahui pola dan karakteristik dari data tersebut dengan adanya training set sehingga proses prediksi data sangat memungkian untuk dilakukan. Namun pada multimedia retrieval tidak dapat dilakukan karena proses yang terjadi adalah mengetahui hasil temu kembali berdasarkan kueri yang ada.

Referensi
Bagherjeiran A, N .S. Love C Kamath, Estimating Missing Features to Improve Multimedia Retrieval. Lawrence Livermore National Laboratory, Livermore, CA 94551
S. Kotsiantis, D, Kanellopoulos dan P. Pintelas. Multimedia Mining. University of Patras, Patras 26 500, Greece,
Wei C H, C T Li.2004. Design of Content-based Multimedia Retrieval.Department of Computer Science
University of Warwick Coventry CV4 7AL, UK


Posted in Data Mining | 2 Comments »