Having trouble viewing this page?
Tutorial Latent Semantic Indexing
Wie funktioniert LSI?
- Termgewichtung (global, lokal):
mit Hilfe der üblichen Verfahren des Information Retrieval werden die Terme des behandelten Korpus gewichtet.
- SVD (Singular Value Decomposition)
ist ein Verfahren aus der linearen Algebra. Dabei wird die Term-Dokument-Matrix in drei neue Matrizen aufgespalten. Daraufhin kann man die Dimensionen der Originalmatrix auf 500-1000 Dimensionen reduzieren.
Die Suche läuft über diese neue Matrix.