Having trouble viewing this page?
Tutorial Latent Semantic Indexing
LSI: Pro und Contra
- Vorteile
- Konzeptsuche — individuelle Suchwörter eignen sich nur bedingt, das Thema eines Dokuments zu erfassen
- Probleme mit Polysemie und Synonymie werden vermieden
- → Precision- und Recall-Werte steigen
- Laufzeit: N2 × m3 bleibt durch kleines m (hoher Wert für k) halbwegs überschaubar
- Nachteile
- Änderungen der Dokumentensammlung kommen teuer zu stehen (Abhilfe: folding-in)
- Laufzeit: N2 × m3 ist für große Dokumentensammlungen oder häufige Updates zu hoch
- Idealer Wert für k ist bisher nur empirisch zu ermitteln