Mohon tunggu...
La ode afdal munifa
La ode afdal munifa Mohon Tunggu... mahasiswa

tetap semangatt

Selanjutnya

Tutup

Bahasa

Kuliah aljabar linear dan pemanfaatan sistem temu kembali informasi dalam pencarian dokumen menggunakan metode vektor space model

1 Mei 2025   21:48 Diperbarui: 1 Mei 2025   21:48 72
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.
Lihat foto
Gambar 1. ilustrasi dokumen dan query dalam ruang vektor

Jadi pada kuliah kali ini mata kuliah aljabar linear yang di bawakan 0leh bapak Natalis Ransi, S.Si., M.Cs. membahas tentang pengunaan model ruang vektor Model ruang vektor (vector space model) adalah pendekatan matematis yang digunakan secara luas dalam bidang pemrosesan informasi dan penambangan teks, terutama dalam sistem pencarian informasi (information retrieval). Model ini merepresentasikan dokumen dan kueri sebagai vektor dalam ruang berdimensi banyak.

 

Model ruang vektor adalah pendekatan representasi data dalam bentuk vektor berdimensi banyak yang digunakan secara luas dalam bidang pemrosesan bahasa alami (NLP), khususnya dalam sistem temu kembali informasi atau pencarian dokumen. Dalam model ini, setiap dokumen atau kueri dipetakan sebagai sebuah vektor dalam ruang multidimensi, di mana setiap dimensi merepresentasikan sebuah kata unik (term) yang terdapat dalam keseluruhan korpus atau koleksi dokumen. Nilai pada masing-masing dimensi biasanya menunjukkan bobot atau pentingnya kata tersebut dalam dokumen tertentu, dan bobot ini sering kali dihitung menggunakan metode Term Frequency-Inverse Document Frequency (TF-IDF). TF mencerminkan seberapa sering suatu kata muncul dalam dokumen, sedangkan IDF mencerminkan seberapa jarang kata tersebut muncul dalam keseluruhan dokumen, sehingga gabungan keduanya memberi penilaian yang seimbang antara frekuensi lokal dan global dari sebuah kata.

Dilanjutkan dengan contoh penerapannya, termasuk persamaan yang digunakan untuk kasus yang dimaksud. Berikut rangkuman materi yang saya bawakan

  • Defenisi ruang vektor
  • mengukur kemiripan dokumen menggunakan cosine similarity
  • langkah umum penerapan ruang vektor untuk kemiripan dokumen
  • contoh kasus
  • interpretasi hasil

Jadi judul yang saya ambil dari jurnal ialah pemanfaatan sistem temu kembali informasi dalam pencarian dokumen menggunakan metode vektor space model. berikut adalah sebagian isi jurnal tersebut:

ABSTRAK:

Seiring banyaknya dokumen menyebabkan berkembangnya teknologi, penyimpanan dokumen dalam bentuk file semakin banyak digunakan. Akan tetapi, file-file dokumen tersebut akan terus bertambah setiap harinya dan untuk mencari informasi dari isi file-file tersebut akan menjadi sulit. Untuk itu perlu diterapkannya metode ilmu pencarian yang dikenal dengan temu kembali informasi (Information Retrieval). Salah satunya metode dalam sistem temu kembali adalah Vector Space Model. Pada metode VSM sebelum melakukan pencarian dokumen akan dilakukan indexing dengan memecah isi teks dari dokumen-dokumen tersebut menjadi index term. Index term ini yang akan digunakan untuk proses pencarian. Proses pembentukan index term dari teks yang terdapat di dalam dokumen akan melalui beberapa tahapan yaitu parsing, text preprocessing , penghitungan bobot , dan juga pengukuran kesamaan (Similarity Measure).

pendahuluan:

Perkembangan jaman hingga saat ini sangat berdampak besar terhadap kehidupan sekarang. Salah satu hal yang berubah adalah cara menggunakan data sebagai informasi pada era big data sekarang ini. Dengan semakin banyaknya jumlah dokumen yang beredar saat ini menimbulkan sebuah masalah untuk melakukan pencarian yang diinginkan dengan cepat dan akurat baik pada media online melalui internet (search engine,e-library) ataupun offline (sistem penyimpanan pada komputer). meskipun saat ini beberapa e-library sudah menerapkan algoritma untuk pencariannya seperti algoritma boolean search namun hal itu belum cukup akurat untuk proses pencarian karena tidak dapat mengenali dokumen-dokumen yang paling relevan atau cukup relevan (pure exact match).

Salah satu metode dalam temu balik informasi (Information Retrieval) untuk mendapatkan dokumen yang relevan berdasarkan query adalah Vector Space Model. Vector Space Model (VSM) adalah metode untuk mengetahui tingkat kedekatan atau kesamaan (similarity) term dengan cara pembobotan term. Dokumen dipandang sebagai sebuah vektor yang memiliki magnitude (jarak) dan direction (arah). Metode Vector Space Model ini merepresentasikan suatu dokumen dan query dalam sebuah bentuk vektor. Rlevansi sebuah dokumen ke sebuah query didasarkan pada kesamaan di antara vektor dokumen dan vektor query. Dalam merepresentasikan dalam sebuah vektor dibutuhkan bobot term dari dokumen ataupun query. Term dapat berupa kata, frase, atau unit hasil indexing lain dalam suatu dokumen sebagai gambaran dari isi setiap dokumen tersebut.

HALAMAN :
  1. 1
  2. 2
  3. 3
Mohon tunggu...

Lihat Konten Bahasa Selengkapnya
Lihat Bahasa Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun