Wie funktioniert LSI?
Beispiel für Term-Dokument-Matrix (TDM):
d1 | d2 | d3 | d4 | d5 | d6 | d7 | d8 | d9 | |
human | 1 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 |
interface | 1 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 |
computer | 1 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 |
user | 0 | 1 | 1 | 0 | 1 | 0 | 0 | 0 | 0 |
system | 0 | 1 | 1 | 2 | 0 | 0 | 0 | 0 | 0 |
response | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 0 | 0 |
Am,n= (aij) |
m= Terme in Zeilen |
n= Dokumente in Spalten |
aij= i Terme in Dokument j |
Hier im Beispiel sind viele Zellen mit 0 gefüllt - typisch für eine Term-Dokument-Matrix, d.h. diese Matrix ist spärlich besetzt. Ergebnis: riesige Matrix (viele Dimensionen)