it’s just my step

Just another WordPress.com weblog

1. Pendahuluan

Posted by nonasahla pada Juli 18, 2009

Latar belakang masalah

Suksesnya penelitian mengenai penggunaaan Algoritma Genetika(GA) untuk menemukan suatu solusi dalam Information Retrieval(IR) mendorong para ahli mencoba hal baru lagi. Sebenarnya, GA bukan hal baru lagi dalam Information Retrieval, karena sebelumnya Gordon sudah menyarankan representasi posting diterapkan sebagai kromosom, dan menggunakan algoritma ini untuk memilih indexing yang  baik. Yang et al. menyarankan penggunaan GA dalam User Relevance Feedback untuk memilih bobot term yang dicari dalam query. Morgan dan Kilgour menyarankan pertengahan antara user dan IR sistem dalam pemilihan term yang dicari dari thesaurus dan kamusnya. Boughanem et al. , Horng dan Yeh dan Vrajitoru meneliti GA untuk IR dan mereka menyarankan sebuah rekombinasi baru dan operator mutasi. Vrajitoru juga meneliti efek dari ukuran populasi dalam kemampuan pembelajarannya dan menyimpulkan ukuran populasi sangat penting[1]. Dan untuk penelitian ini, penulis mengadopsi penggunaan GA untuk User Relevance Feedback tidak murni untuk menghasilkan keyword solusi yang akan digunakan dalam IR.

Information Retrieval adalah sistem yang digunakan untuk menyimpan suatu informasi yang mana dibutuhkan untuk diindex, dicari dan diambil berdasarkan query yang dibutuhkan user. Query dan dokumen akan dilakukan proses indexing dan kemudian dimatching(dicari kemiripannya). Query dan dokumen akan dimodelkan ke IR dengan pendekatan vector space model(vsm). Dalam vsm dokumen akan dipandang sebagai vector dalam ruang n dimensi disertai dengan bobotnya, dimana n adalah term berbeda yang merupakan konten dari dokumen koleksi. Query juga demikian, sehingga akan bisa diukur tingkat kemiripannya, dan  akan bisa diketahui rangking dari hasil pencarian berdasarkan perhitungan vsm.  Kebanyakan sistem IR menggunakan sebuah atau beberapa keyword untuk mengambil dokumen yang berhubungan. Keyword tersebut akan dicocokan ke dalam dokumen koleksi dan kemudian mengambil dokumen hasil pencocokan dan dilakukan perankingan.

GA adalah algoritma probabilitas yang mensimulasikan mekanisme seleksi alam dari kehidupan organisme dan biasanya digunakan menyelesaikan masalah yang mempunyai solusi yang mahal[1]. Sebuah keyword dalam IR direpresentasikan sebagai sebuah gen, dokumen sebagai individu dan kumpulan dokumen yang dianggap relevan direpresentasikan sebagai populasi awal dalam Algoritma Genetika. Fungsi fitness dalam Algortima Genetika digunakan sebagai fungsi evaluasi dalam pemilihan dokumen yang relevan terhadap keyword. Untuk meneliti pengaruh dari beberapa fungsi fitness terhadap hasil pencarian, maka penelitian terhadap metode Cosine, Dice, Overlap dilakukan dalam Tugas Akhir ini. Pemilihan model kromosom menggunakan representasi binary yang dikonversikan ke representasi real.

Hasil proses matching antara query dan dokumen akan didapatkan dokumen training. Dokumen training yang diambil sebanyak 15 dokumen, yang kemudian digunakan untuk  proses  GA. Hasil proses GA akan didapatkan kromosom terbaik yang terdiri dari keyword-keyword solusi untuk digunakan lagi dalam IR. Hasil matching kedua, kemudian dokumen tersebut di-retrieve. Untuk memberikan dokumen secara terurut kepada user, maka dokumen retrieval hasil pencarian tersebut diurutkan menurut tingkat kemiripannya, disebut juga sebagai rank document retrieval. Penggunaan fungsi fitness yang berbeda-beda pada Algoritma Genetika ditujukan untuk mempermudah user mencari dokumen yang relevan. Dengan adanya tingkat kemiripan dokumen yang berbeda-beda hasil implementasi dari ketiga fungsi fitness, maka user bisa memilih sesuai dengan kebutuhan. Pengujian dokumen retrieval menggunakan Recall. Precision, dan non-IAP (non Interpolated Average Precision). Pada Tugas Akhir ini, sistem yang dibangun oleh penulis diberi nama FreeGeneticSystem. FreeGeneticSystem berbasis web, dengan maksud kemudahan di kemudian hari jika menginginkan diimplementasikan sistem secara online.

Tinggalkan Balasan

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Ubah )

Twitter picture

You are commenting using your Twitter account. Log Out / Ubah )

Facebook photo

You are commenting using your Facebook account. Log Out / Ubah )

Connecting to %s

 
Ikuti

Get every new post delivered to your Inbox.