We stand with Ukraine

Il Festival di Sanremo e la tecnologia semantica

13 Febbraio 2011

14 feb 2011

Expert System ha analizzato con la propria tecnologia semantica Cogito i testi delle canzoni dell’edizione 2011 del Festival di Sanremo.

 

La domanda al centro dell’analisi è stata questa: che cosa si può capire da un insieme di canzoni senza sentirne la musica e se si rinuncia all’emozione di un’esibizione dal vivo per limitarsi a tritare semplicemente quanto i cantanti affermano nelle proprie canzoni?

 

“Qualche anno fa abbiamo sviluppato un’analisi linguistica automatica delle canzoni di Sanremo per un’edizione del Dopofestival” ha spiegato Marco Varone, Presidente e Direttore dello sviluppo tecnico di Expert System. “E da lì, ci è venuta l’idea di ripetere l’esperienza. Abbiamo quindi scaricato i testi delle canzoni e li abbiamo fatti macinare al nostro motore di ricerca. Nel leggere l’analisi automatica, ci siamo lasciati trasportare da alcune scoperte curiose, abbiamo fatto qualche confronto con un paio di vecchie edizioni del Festival, giocando sull’identificazione delle parole più usate e divertendoci a immaginare il perché di qualche scelta. Il tutto per curiosità, a tempo perso, ma sfruttando le potenzialità della tecnologia semantica, quindi con precisione e accuratezza e in tempi veramente rapidissimi.”

 

Le canzoni in concorso all’edizione del 2011 del Festival di Sanremo sono 25. Tra i verbi, grandi protagonisti sono: sapere: 42 volte in 7 canzoni, volere: 35 volte in 11 canzoni, fare: 28 volte in 13 canzoni, cercare: 26 volte in 6 canzoni, sentire: 25 volte in 10 canzoni, chiamare: 23 volte ma in solo 2 canzoni, andare: 20 volte in 5 canzoni, vedere: 19 volte in 7 canzoni.

 

A proposito di vedere, occhi è in cima alla lista dei nomi più usati (citando dalle canzoni: gli “occhi possono perdersi nel vuoto”, “sognano giorni di libertà” e “non sanno mentire”). Mare, cielo e giorno si contendono le scene posizionandosi in alto nella classifica, a pari merito con 17 presenze. La gara geografica è vinta da Napoli, che ricorre per ben 18 volte (ma sempre nella stessa canzone) contro Romagna (“mia”, naturalmente) e “nebbia padana”, entrambe citate solo una volta in due canzoni diverse.

 

Ma qual è il nome in cima alla lista, quello usato di più? Amore, naturalmente, che ricorre 44 volte in 10 canzoni.

 

“Indubbiamente il Festival di Sanremo è un evento ricco di stimoli, se non altro dal punto di vista linguistico è già così. Certo servirebbe un’analisi semantica più approfondita per capire se l’amore del 2011 sarà più “fuoco”, “forza” oppure “maledetto” o sempre un po’ a rischio di esser confuso col “sesso”, ma per questo vi rimandiamo alla lettura integrale dei testi o all’ascolto delle canzoni!”

Ah… l’amore, leggi il post di Marco Varone, CTO di Expert System, dedicato all’analisi semantica delle canzoni di Sanremo 2011