1. MODDEL MESIN PENCARI DOKUMEN BAHASA INDONESIA, STUDI EFEKTIFITAS PADA VECTOR SPACE MODEL ALGORITMA STEMMING POTER PEMBOBOTAN FREKUENSI TERM BERBANDING FREKUENSI TERM DALAM PENCARIAN DAN FUNGSI KESAMAAN COSINE
- Author
-
Malese Lp
- Subjects
Information retrieval ,Engineering ,bepress|Engineering ,Computer science ,Architecture ,query, Information Retrieval, studi efektifitas vektor model, algoritma steming poter, fungsi kesamaan cosine ,PsyArXiv|Engineering Psychology ,FOS: Civil engineering - Abstract
Seiring dengan semakin berharganya nilai sebuah informasi dan semakin banyak sumber-sumber informasi, maka semakin banyak pula kebutuhan manusia untuk dapat menemukan informasi yang sesuai keperluannya dengan cepat. Information Retrieval (Perolehan Informasi) merupakan suatu pencarian informasi(biasanya berupa dokumen) yang didasarkan pada suatu query (inputan user) yang diharapkan dapat memenuhi keinginan user dari dokumen yang ada. Dua aspek penting dalam konsep Information Retrieval yang diterapkan dalam sebuah perancangan mesin pencari yaitu repesentasi dari informasi dan pengukuran yang akan mengukur nilai kesamaan antara dua obyek. Informasi yang dapat direpresentasikan menjadi sebuah obyek yang direpresentasikan dalam berbagai bentuk dan model (heterogeneous). Keadaan ini mengakibatkan bahwa pencarian untuk suatu obyek informasi yang diinginkan akan dapat dipetakan kepada beberapa obyek informati yang dinilai relevan. Relevansi dua informasi di-ukur dari keberadaan kata kunci (keyword) dan bobotnya. Konsekuensi logis atas keadaan ini adalah bahwa dalam melakukan pencarian obyek yang diinginkan, ditemukan terdapat ketidakpastian (uncertainly) terhadap penggunaan keyword pada query oleh pengguna dengan keberadaan keyword pada dokumen. Pada penelitian ini akan difokuskan pada studi efektifitas vektor model dengan menggunakan algoritma steming poter untuk membentuk kata-kata menjadi sebuah kata baku serta pembobotan frekuwensi term untuk menentukan tingkat kepentingan setiap indeks term dalam sebuah dokumen dan fungsi kesamaan cosine dalam mengukur kemiripan queri dengan dokumen. Hasil pengujian nilai kualitas rata-rata precesion dan recall bahwa untuk semua bentuk query pencarian dokumen mempunyai nilai precesion 100% artinya baik pencarian berdasarkan bentuk query isi, judul dan dokumen mempunyai precesion yang baik sedangkan hasil pengujian recall menunjukkan hasil yang berbeda, dimana pencarian berdasarkan bentuk queri isi dokumen menempati recall tertinggi sebesar 90%, sedangkan pencarian berdasarkan bentuk queri judul dokumen dengan nilai recall 70% dan pencarian berdasarkan bentuk query dokumen menempati posisi terendah dengan recall 33%.
- Published
- 2022
- Full Text
- View/download PDF