L’importanza dei Social e della Opinion Mining: il caso Molisana

Quand’è che un contenuto può veramente essere considerato virale? L’analisi del caso de “La Molisana” secondo le reazioni sul web e i social network.

Un post su Facebook, Twitter o Instagram, qualche visualizzazione, qualche commento. I like aumentano, le visualizzazioni pure. Le prime condivisioni, un po’ di re-posting,re-tweeting e di sharing su varie piattaforme. Ecco che, in un attimo, una semplice opinione è virale. Niente di più facile e ormai l’onda mediatica non si può più fermare.

La viralità è la “capacità di diffondersi in modo particolarmente veloce e capillare, utilizzando i nuovi mezzi di comunicazione”. Al giorno d’oggi, tramite i Social Networks, raggiungere la viralità è alla portata di un click. Basta pubblicare il post “giusto” ed ecco che il gioco è fatto. Migliaia, se non milioni, di persone iniziano a discutere dell’argomento, fino al diffondersi su altri mezzi di comunicazione e, se si è stati fortunati, la notizia finisce pure in prima tv su qualche telegiornale.

Ma è davvero così? Quand’è che un contenuto può veramente essere considerato virale? Ma soprattutto, tutti i contenuti virali sono da considerarsi importante? Ciò che è successo a inizio Gennaio 2021 all’azienda italiana produttrice di pasta, La Molisana, ci mostra ancora una volta come sia estremamente facile raggiungere la viralità ma allo stesso tempo anche che questa svanisce in un attimo. La rilevanza di un contenuto virale dunque può essere facilmente misurata tramite una valutazione del suo perdurare in rete.

Inoltre, la viralità spesso fornisce a pareri e opinioni più rilevanza di quanto essi non abbiano realmente. A tal proposito, è opportuno al giorno d’oggi essere in grado di analizzare i contenuti semantici presenti sul web in modo accurato e con tempestività. È qui che l’Opinion Mining arriva in nostro soccorso per aiutarci a valutare le opinioni espresse sui social network.

Il caso Molisana in breve

Data Mining Molisana

Le ricerche Google (in rosso) e quelle Wikipedia (in blu) impennano. Mai l’azienda ebbe un interesse così elevato sul web.

Data Mining Molisana

A conclusione della vicenda, l’azienda, tacciata di apologia di fascismo, si scusa e decide di ritirare il formato di pasta incriminato (due in realtà Abissine e Tripoline) dal commercio.

I temi di discussione online

Innanzitutto, è molto importante capire dove i commenti e le opinioni della gente sulla pasta dell’azienda italiana si sono diffuse. Come si evince dal grafico sottostante, la viralità del fenomeno in questione si è estesa, come spesso accade, solo al mondo dei social network (rappresentati da Twitter in questo caso). Al contrario, sugli altri mezzi di comunicazione digitali non vi è stato un grande interesse mediatico sull’argomento. Inoltre, appare evidente come la durata della viralità dell’argomento sia estremamente limitata: l’elevato interesse verso il tema è svanito dopo soli due giorni (grafico precedente sui volumi).

Data Mining Molisana

Altrettanto importante è l’individuazione dei temi principali trattati in relazione all’azienda Molisana durante il periodo in analisi. Estremamente rilevante in questo contesto è capire, non solo quali siano le tematiche di interesse, ma anche quanto queste siano considerate “trendy”, e soprattutto quanto la loro “trendiness” sia duratura. È facile intuire che temi molto discussi ma poco trendy sono difficilmente virali. Tuttavia, un tema virale non può prescindere dall’essere molto discusso. Nel caso in analisi, il tema più rilevante che emerge è ovviamente l’accostamento tra l’azienda e la pasta prodotta con i concetti di fascismo e colonialismo.

Data Mining Molisana

Il livello di discussione di ciascun tema e di trendiness, come detto, non sono le uniche caratteristiche da tenere in considerazione. È altrettanto importante capire quanto perdura l’interesse su ciascun topic possibilmente virale. Tuttavia, nel caso Molisana il livello di trendiness dei vari hashtag virali è crollato dopo solo un paio di giorni (grafico sottostante contenente la tagcloud per il periodo 7-9 Gennaio 2021).

Data Mining Molisana

Il sentiment

Gli algoritmi di intelligenza artificiale ci permettono poi di estrarre dal contenuto semantico presente sul web e sui social, le opinioni espresse dalla gente. Tuttavia, i testi provenienti da Social Network e altre fonti del mondo Web sono solitamente dominati da “rumore” (indipendentemente da quanto accurata sia la tecnica di data-crawling utilizzata) dove per rumore si intendono quei testi che, pur utilizzando parole rilevanti per descrivere i temi di interesse, non riguardano effettivamente i topic in analisi. La maggior parte degli algoritmi o delle tecniche di text mining sono progettate per analizzare corpus di testi che non presentano rumore, e quando ciò accade faticano in quanto si basano sulla classificazione individuale dei singoli testi per ottenere la stima della distribuzione aggregata delle opinioni. Anche le tecniche di NLP (Natural Language Processing), inoltre, si rivelano essere poco accurate quando il contesto dell’analisi non è ben definito, così come non lo sono il vocabolario e la grammatica dei termini utilizzati, e falliscono nell’identificazione di costrutti semantici complessi (quali ad esempio ironia e sarcasmo).

Data Mining Molisana

Dunque, l’utilizzo di algoritmi adeguati per analizzare i dati presenti sui social network è fondamentale per poter ottenere risultati accurati e affidabili.
Innanzitutto, è stato analizzato il sentiment de La Molisana dall’1 Gennaio 2020 al 10 Gennaio 2021 e, come si evince dal grafico dell’andamento temporale, non emergono eventi degni di nota. I pareri online che riguardo l’azienda di pasta italiana sono rimasti pressoché costanti durante tutto l’anno, con una stabile preponderanza del sentiment positivo rispetto a quello negativo.

Data Mining Molisana

Anche a inizio Gennaio 2021 (periodo evidenziato dal cerchio in rosso), in occasione dello scandalo delle Abissine rigate, non si nota nulla di particolarmente significativo. Si e’ proceduto dunque ad analizzare il sentiment focalizzandosi sul periodo di interesse, 4-9 Gennaio 2021, e i risultati sono decisamente inaspettati.

Da un punto di vista aggregato (grafico a torta), il sentiment nei confronti dell’azienda è molto positivo, quasi 61% con uno scarto di oltre 32% sul sentiment negativo. Ciò’ evidenzia che l’accanimento sui social non è poi stato così rilevante. I commenti negativi nei confronti del brand hanno scatenato una tipica reazione contraria, di solidarietà e sostegno verso la Molisana.

Data Mining Molisana

L’andamento temporale del sentiment nei giorni in questione è un’evidenza eclatante di questa positività. Nei primi giorni dello scandalo, quando il volume di post e commenti nei confronti de La Molisana è esploso, il sentiment positivo è sempre stato ben al di sopra del 50%, raggiungendo addirittura il 75% il 6 Gennaio. Al contrario, il sentiment negativo è rimasto entro il 30% nei primi giorni ed è invece cresciuto molto il giorno 7 Gennaio, quando il volume dei commenti era ormai crollato. Due giorni dopo, il 9 Gennaio, il sentiment positivo era nuovamente sopra la soglia del 50%. Evidenziando ancora una volta la brevissima durata della viralità di questo scandalo.

Data Mining Molisana

Le lezioni dal caso Molisana

Cosa abbiamo appreso dall’analisi delle opinioni sui social riguardanti il caso Molisana?
Innanzitutto, spesso la rapidità con la quale un contenuto diventa virale e’ spesso direttamente proporzionale alla velocità con la quale l’interesse verso quello stesso tema svanisce completamente. L’elemento fondamentale che indirizza un’azienda su quali decisioni di comunicazione prendere, dunque, non è la viralità in sé ma la sua durata e quanto questa generi effettivamente degli effetti sul web, siano essi positivi e/o negativi.

Estremamente rilevante è riuscire ad intercettare per tempo la nascita di nuovi temi virali. Un monitoraggio continuo con strumenti di opinion mining è essenziale al giorno d’oggi per riuscire ad individuare con precisioni le nuove tendenze del momento e poter cavalcare o fronteggiare in tempo.

Risulta essere altrettanto importante capire dove i contenuti si stanno diffondendo, non solo il quando. Se ne parla solo sui social oppure esiste una vera e propria diffusione del tema su tutti i mezzi digitali (social, news, blog, forum, ecc)?

Infine, è fondamentale avere a disposizioni strumenti di analisi accurati ed efficaci, in grado di capire le reali opinioni espresse sul web. Utilizzare metodi automatici di analisi del testo, che non tengono conto delle complessità linguistiche presenti sui social può portare a prendere decisioni sbagliate. Se questa analisi fosse stata condotta con algoritmi automatici non supervisionati il risultato sarebbe stato il seguente.

Data Mining Molisana

Probabilmente, se La Molisana avesse avuto a disposizione i giusti strumenti per analizzare le opinioni della gente, la vicenda si sarebbe potuta concludere in modo differente, magari senza la necessità di ritirare dal mercato interi stock del prodotto incriminato.

T-Voice si occupa di opinion mining, sentiment analysis e topic discovery e sfrutta algoritmi di artificial intelligence supervisionati con l’obiettivo di offrire una panoramica precisa di opinioni e sentimenti condivisi tramite web e social network.

I Video di Blogo