Monday, May 23, 2011

Latent Semantic Indexing

Latent Semantic Indexing
oleh Michael Marshall

LSI adalah suatu metodologi untuk klasifikasi dokumen otomatis. Itu menguji semua kata dalam semua dokumen dari sebuah badan tulisan dan menghitung pengukuran kesamaan untuk setiap dokumen atau untuk istilah individu. Hal ini dapat mengukur sangat akurat yang dokumen dalam badan tulisan benar-benar relevan dengan frase pencarian bahkan jika itu frase pencarian tidak muncul dalam dokumen. Mengukur relevansi adalah komponen kunci dari algoritma peringkat mesin pencari. Ketika mesin pencari menggunakannya, LSI dapat memiliki dampak yang signifikan terhadap peringkat halaman web Anda.

Bagaimana sebuah mesin pencari membedakan antara informasi yang relevan dan informasi tidak relevan? Beberapa mesin pencari menggunakan LSI untuk mencapai tujuan ini. LSI membantu meningkatkan kinerja mesin pencari di tiga tugas penting: recall, presisi, dan peringkat. Recall adalah mendapatkan semua informasi relevan yang tersedia untuk pencarian Anda. Precision semakin hanya informasi yang relevan dengan pencarian Anda. Peringkat semakin semua informasi memesan dengan cara yang berarti - dari yang paling relevan dengan sedikit, misalnya.