Se volete scoprire come ha fatto e soprattutto, come avviene dettagliatamente la cosa, raccontata con un tono che passa più volte dallo scientifico al poetico, potete consultare l'articolo che ha da poco pubblicato a questo link, e che vi riporto qui a seguire.
Sempre a questa pagina potete vedere il profilo professionale dell'Autore.
Incipit
Ci sono momenti in cui il caso scioglie, con un colpo di mano, situazioni irrisolvibili, intrecciando storie che in teoria non dovrebbero incrociarsi e dipanando così il tutto.
Questo post nasce da uno di questi casi.
La sera del 18 maggio, in treno, come sempre, davo un’occhiata a twitter, in attesa della partenza. D’un tratto un paio di tweet di amici con hash #mcctest hanno attirato la mia attenzione. Non persone qualsiasi, ma membri del gruppo Gilda35, “gruppo di satira dadaista sul professionismo di internet”, “esimi ricercatori” nonché profondi conoscitori della Rete. Se la Gilda35 si muove in gruppo ci sono solo due cose che si possono fare: o si osserva lo spettacolo, o si diventa parte dello stesso. All’improvviso, mentre guardavo scorrere quel flusso di tweet, mi sono reso conto che #mcctest era in Trending Topic. Dal treno, a parte fare qualche retweet, si poteva poco, ma quel flusso prodotto da account noti per me era ordinato, quindi arrivato a casa ho iniziato ad analizzarlo per capire come era finito in Trending Topic: la contemporanea presenza delle directioners (fan della boyband OneDirection) con #italythanksoned e più tardi in serata anche degli hash della trasmissione Amici (#amici, #antonino, #annalisa) in Trendic Topic erano perfetti per un’ analisi comparata. Trovare il tempo per analizzare una serie di flussi “giusti” e tirare così fuori una formula semplice per capire come funzionano i trending topic era una cosa che volevo fare da un po’.
Il primo passo: pochi dati, ma buoni
Con tutti i dati della serata in mano, alla fine sono riuscito ad identificare una grandezza che Twitter potrebbe usare per calcolare chi mettere come Trending Topic:
Come è facile capire, queste ultime tre grandezze non sono indipendenti tra loro, ad esempio il numero totale di twittatori unici non può essere superiore al numero totale di tweet e anche la media dei follower dipende dall’ insieme dei follower stessi. Nel contesto dei Trending Topic, dove vince temporaneamente chi ha ɸ più alto, anch’esso può essere considerato una variabile, e quindi in generale può essere più utile andare a considerare su tutta Twitter (dimenticandoci per il momento del valore del meme) la funzione:
Ci sono cinque variabili: quindi questa è una funzione in uno spazio a 5 dimensioni, dove 2 variabili sono discrete, cioè definite come numeri naturali (il numero di tweet, il numero dei twittatori unici), due sono numeri reali ma non possono assumere tutti i valori dati i vincoli (la funzione e i followers medi), e infine il tempo, che come è solito fare va in una sola direzione. Con i vincoli tra le variabili, diventa una superficie in uno spazio a 5 dimensioni: non è facile raccontarla, per non dire disegnarla.
Giù nel profondo: le dimensioni che non si possono vedere
Si dice che Internet è liquida. Io preferisco dire fluida, perché i fluidi oltre che essere liquidi, possono essere anche gas o plasma. Il senso comune associa ai fluidi comportamenti esclusivamente irregolari e disordinati e caotici, mentre essi possono avere delle strutture regolari e ben delimitate: nel mare ci sono le correnti, nell’ atmosfera ci sono le perturbazioni e al loro interno le nuvole. In qualche caso il comportamento dei fluidi può addirittura essere predetto con sufficiente precisione, senza nemmeno l’ausilio di supercomputer e di analisi di grosse moli di dati: è da qualche millennio che i pescatori sanno quando stanno per cambiare le maree.
Le specificità di Twitter sono legate all’osservabilità di chi fruisce dei contenuti. Poiché non è un social network e il suo meccanismo di propagazione è broadcast (come le tv via etere), tutto ciò che in condizioni standard è osservabile e quindi misurabile sono i segnali che gli utenti mandano, ossia i loro tweet. Più o meno come la vecchia TV: c’è bisogno di avere un certo numero di TV con un rilevatore per effettuare le misurazioni Auditel.
Immaginiamo un piano diviso in celle, in cui il contenuto di ogni cella è un meme, ossia un’unita di informazione riconoscibile, una parola ricorrente nelle conversazioni (ad esempio nella figura di seguito gli hashtag “#europei2012”, “#legge194”, “#pessoa”) e l’ altezza della perturbazione del piano è in qualche modo collegato a quanto è importante per Twitter quel flusso di messaggi prodotti sul meme.
Twitter ha un engine che analizza in near real time tutti i tweet e calcola quali sono i dieci che devono emergere nei trending topic. Questo calcolo deve essere fatto con una formula piuttosto semplice, poiché deve essere calcolata in continuazione, non può occupare molte risorse e deve essere fatto su tutti i tweet sufficientemente vicini nel tempo. Deve inoltre dipendere solo da grandezze scalari dei tweet esistenti sul meme (non può dipendere dalla struttura della rete dei followers). Deve inoltre garantire stabilità su un intervallo di fruizione ragionevole per l’ esperienza umana: deve essere trasparente ai glitch, ossia non può dipendere da picchi perturbativi veloci nel tempo (ad es. un tweet di un utente con 100.000 follower + un retweet di un altro utente con altri 100.000 follower). Questo comporta anche che ogni item di attività su un meme deve esistere per un certo tempo prima di poter andare in trending topic.
Su quel piano (che è un piano solo per il momento, perché stiamo semplificando la struttura dell’algoritmo) ogni collinetta, ogni perturbazione, è una di quelle superfici a 5 dimensioni che abbiamo visto prima. Una perturbazione è l’insieme dei tweet con lo stesso hashtag, è quindi l’insieme delle conversazioni che trovano il loro significato intorno all’ hashtag, che “ruotano” intorno all’ hashtag. Una cosa fluida che ruota all’interno di un altro fluido ha un nome preciso: è un vortice.
Esistono 2 regimi differenti:
1. Quando i tweet con un certo hashtag sono visibili solo a coloro che hanno twittato con quel meme e ai loro follower diretti, l’hashtag è a dominio di visibilità limitato o locale.
2. Quando il meme è arrivato in trending topic e quindi è visibile a tutti il dominio di visibilità è globale (per il momento dimentichiamo che esistono i Trending Topic nazionali e poi quello globale)
Nel primo caso, il meme deve essere sostenuto dall’azione congiunta del gruppo che lo promuove, il cui scopo è quindi quello di allargare il network in maniera percolativa (ossia cercando di coinvolgere altri twittatori attraverso i loro follower). Nel secondo caso, il meme è visibile a tutti, quindi tutti coloro che sono interessati all’argomento del meme possono contribuire col meme giusto.
Le immagini precedenti mostrano in maniera qualitativa (le dimensioni reali continuano ad essere cinque…) un vortice in accrescimento che ingloba quelli vicini (a volte capita che lo stesso evento nasca con più di un hashtag, ad un certo punto decadono tutti meno uno, che risulta poi l’ unico usato) Il vortice continua ad allargarsi coinvolgendo più persone, poi si stabilizza e alla fine si spegne.
Una volta arrivato nei Trending Topic, il destino del vortice dipende dalla tipologia del meme.
Poiché Twitter non è un social network, ma un news network , nel caso in cui il meme è associato ad un argomento di interesse pubblico la forma ed il comportamento del vortice continuerà ad essere lo stesso precedente e continuerà ad accrescersi di contenuti e di nuovi twittatori (ad esempio #europei2012, #terremoto, monti alla camera ….).
Ma c’ è un secondo tipo di vortice che può generarsi: il vortice toroidale (detto anche ad anello). Il video mostra i vortici toroidali generati in natura da delfini, balene e vulcani (clicca sull’immagine per vedere il video).
Come se non ci fossero sufficienti motivi per desiderare di essere dei delfini ….
Un vortice ad anello su Twitter ha una struttura chiusa su se stessa e sui twittatori che continuano ad alimentare il meme, riuscendo a mantenerlo in TT, ma senza riuscire a coinvolgere altre persone. In questo caso è l’argomento del meme che è a dominio limitato, ossia interessa solo ad una community circoscritta, per quanto grande. Questo è quello che ottengono i beliebers (i fan di Justin Bieber) e i directioners (i fan degli OneDirection) quando giocano. Portare in Trending Topic un hashtag è la quotidiana sfida epica (per usare le parole di Jane McConigal) di questi due gruppi di fans. In questo caso sono le logiche fandom a governare tutto: il grafico di seguito mostra l’andamento dei tweet dell’ hashtag #twitcamvalebise e i livelli di ingaggio di un non ristretto gruppo di persone (40 persone hanno twittato più di 20 volte su un totale di 700 partecipanti) mostrano che tutto questo è stato generato per una giusta causa. Il senso era: “ragazzi, sto in webcam, fatemi arrivare in TT” (circa 2800 tweets il 4 giugno ed altri 1200 il giorno dopo).
Questo tipo di community-activities evolvono per conto loro, indipendentemente da quello che succede intorno, proprio come gli anelli dei delfini.
Ritorno in superficie
La formula mostrata sopra, che si è rivelata vera tutte le volte che ho provato a verificarla, non mette in evidenza che a parità di valore di flusso ɸ generato, i Trending Topic prediligono stream di hashtag con molti twittatori unici, rispetto agli stream con twittatori con grosso numero di followers. Ciò è sicuramente causato dalla necessità di avere una struttura di Trending Topic non fortemente oscillante. Un pensiero che ho in mente da parecchio, ma non ho avuto modo di verificare è legato al “potere di influenza” degli account coi molti followers nel calcolo dei Trending Topic, ossia al peso che essi hanno nel contribuire. La mia mente corre ad una predizione (sbagliata) della teoria dell’ elettromagnetismo classico, la formula di Rayleigh-Jeans, meglio nota come catastrofe ultravioletta. La formula predice che all’equilibrio termico la densità di energia di un corpo nero è proporzionale alla sua temperatura e alle frequenze (al quadrato). Rapportandolo a Twitter, un utente con molti, molti follower dovrebbe “per sua natura”contribuire molto, molto ai TT: ma non è quello che si osserva in pratica. In fisica la questione fu risolta da Plank, che introdusse i quanti di energia i quali a loro volta portarono in maniera naturale alla modifica della funzione di distribuzione di energia. Il pensiero che ho in testa mi dice che per mantenere stabilità ai TT il peso del contributo di un utente prima deve crescere, poi deve stabilizzarsi se non addirittura diminuire sui grandissimi numeri. D’altra parte, Twitter è una rete quantistica…
Ros
Posta un commento
Lasciate un Vostro commento nel riquadro apposito!
Grazie e al prossimo Post!