Analisi e commento della lingua usata dai candidati nella campagna elettorale 2008 (a partire dal corpus di discorsi e programmi)

sabato 15 marzo 2008

Introduzione

Questo è il primo post del blog Le parole delle elezioni 2008. Il blog ha lo scopo di analizzare e commentare il lessico, e, più in generale, la lingua usata dai candidati nel corso della campagna elettorale per le elezioni politiche del 13-14 aprile 2008, ed è strettamente collegato col sito Le parole delle elezioni 2008. In questo sito sono consultabili i testi dei discorsi e dei programmi elettorali del 2008; di ciascuno di essi è disponibile il tagcloud (le parole più frequenti visualizzate come una nuvola di tag), ma soprattutto l'insieme di tutti i testi è inserito in un corpus, etichettato e annotato per categoria grammaticale (ad ogni parola è associata automaticamente la categoria grammaticale di appartenenza, ad es. nome, verbo, aggettivo, ecc.). L'intero corpus elettorale può essere interrogato per singola parola, espressione di più parole, lemma, e le interrogazioni possono avvenire su più livelli (ad es., la sequenza nome + aggettivo solo nei discorsi di un candidato). La metodologia di raccolta, etichettatura ed interrogazione del corpus è stata sviluppata all'interno dell'insegnamento di Linguistica informatica del Dipartimento di Scienze del Linguaggio, Università per Stranieri di Perugia. Il blog si propone di analizzare e discutere, nel corso della campagna elettorale, i dati estratti dalle interrogazioni del corpus.
Al blog e alla pagina di interrogazioni del corpus è stata anche affiancata una pagina realizzata in collaborazione con Wikio, il motore di ricerca di Wikipedia. Da questa pagina potranno essere visualizzati i grafici aggiornati della presenza dei vari candidati sul web e dei diversi temi in discussione durante la campagna elettorale.