LSA

Analisi Semantica Latente. Si tratta di un metodo per la rappresentazione di uno spazio semantico multidimensionale, con un numero di dimensioni molto grande, costruito su base matematica contando da un algoritmo che riceve in input un certo numero di testi, e calcola quanto spesso alcune parole compaiano nei testi vicino alle altre.

Il risultato è un insieme di termini e aggregati di termini che possiedono un valore vettoriale, e che possono essere confrontati fra loro. Il coseno dell’angolo formato dai vettori che rappresentano i termini che si confrontano dà la misura della somiglianza (vicinanza semantica) dei termini.

L’analisi semantica latente è stata ideata da Polson… e viene usata, in lingua inglese, in un grande numero di applicazioni. Una demo online che consente di comparare espressioni inglesi è presente sul sito dell’università del Colorado.

La LSA è usata nel modello dell’information-foraging di Pirolli e Card, come strumento per calcolare il profumo dell’informazione degli elementi verbali in una pagina web.

Non sono noti esperimenti per validare il modello in lingue diverse dall’inglese.