Cum Twitter oferă oamenilor de știință o fereastră către fericirea și sănătatea umană

De la lansarea sa publică în urmă cu 10 ani, Twitter a fost folosit ca o platformă de rețea socială între prieteni, un serviciu de mesagerie instant pentru utilizatorii de smartphone-uri și un instrument promoțional pentru corporații și politicieni.

Dar a fost, de asemenea, o sursă neprețuită de date pentru cercetătorii și oamenii de știință - ca și mine - care doresc să studieze modul în care oamenii simt și funcționează în cadrul sistemelor sociale complexe.

Analizând tweet-uri, am reușit să observăm și să colectăm date despre interacțiunile sociale ale milioane de oameni „în sălbăticie”, în afara experimentelor de laborator controlate.

Ne-a permis să dezvoltăm instrumente pentru monitorizarea emoții colective ale populațiilor mari, găsi cele mai fericite locuri din Statele Unite și mult mai mult.

Deci, cum a devenit Twitter o resursă atât de unică pentru oamenii de știință sociali de calcul? Și ce ne-a permis să descoperim?


innerself abonare grafică


Cel mai mare cadou al Twitter pentru cercetători

Pe 15 iulie 2006, Twittr (așa cum se știa atunci) public a lansat ca „serviciu mobil care ajută grupurile de prieteni să respingă gândurile aleatorii prin SMS”. Abilitatea de a trimite gratuit textele de grup cu 140 de caractere i-a determinat pe mulți adoptanți timpurii (inclusiv eu) să folosească platforma.

Cu timpul, numărul de utilizatori a explodat: de la 20 milioane în 2009 la 200 milioane în 2012 și 310 milioane astăzi. În loc să comunice direct cu prietenii, utilizatorii le-ar spune pur și simplu adepților lor cum s-au simțit, au răspuns la știri pozitiv sau negativ sau ar sparge glume.

Pentru cercetători, cel mai mare cadou al Twitter-ului a fost furnizarea de cantități mari de date deschise. Twitter a fost una dintre primele rețele sociale majore care a furnizat eșantioane de date prin ceva numit Interfețe de programare a aplicațiilor (API), care permit cercetătorilor să interogheze Twitter pentru anumite tipuri de tweets (de exemplu, tweets care conțin anumite cuvinte), precum și informații despre utilizatori .

Acest lucru a dus la o explozie de proiecte de cercetare care exploatează aceste date. Astăzi, o căutare Google Scholar pentru „Twitter” produce șase milioane de accesări, comparativ cu cinci milioane pentru „Facebook”. Diferența este deosebit de izbitoare, având în vedere că Facebook are aproximativ de cinci ori mai mulți utilizatori decât Twitter (și este cu doi ani mai în vârstă).

Politica generoasă de date a lui Twitter a dus, fără îndoială, la o publicitate gratuită excelentă pentru companie, deoarece studiile științifice interesante au fost preluate de mass-media de masă.

Studierea fericirii și sănătății

Datele recensământului tradiționale fiind lente și costisitoare de colectat, fluxurile de date deschise, cum ar fi Twitter, au potențialul de a oferi o fereastră în timp real pentru a vedea schimbările populației mari.

Universitatea din Vermont Laboratorul de povești computaționale a fost fondată în 2006 și studiază problemele de matematică aplicată, sociologie și fizică. Din 2008, Story Lab a colectat miliarde de tweets prin feed-ul „Gardenhose” al Twitter, un API care transmite în timp real un eșantion de 10% din toate tweet-urile publice.

Am petrecut trei ani la Computational Story Lab și am avut norocul să fac parte din multe studii interesante folosind aceste date. De exemplu, am dezvoltat un hedonometru care măsoară fericirea Twittersphere în timp real. Concentrându-ne pe tweet-urile geolocalizate trimise de pe smartphone-uri, am reușit Hartă cele mai fericite locuri din Statele Unite. Poate în mod surprinzător, am găsit Hawaii va fi cel mai fericit stat și viticultor Napa cel mai fericit oraș pentru 2013. 

O hartă cu 13 milioane de tweet-uri SUA geolocalizate din 2013, colorate de fericire, cu roșu care indică fericirea și albastru care indică tristețe. PLOS ONE, autor furnizatO hartă cu 13 milioane de tweet-uri SUA geolocalizate din 2013, colorate de fericire, cu roșu care indică fericirea și albastru care indică tristețe. PLoS ONE, Autor furnizat.Aceste studii au avut aplicații mai profunde: corelarea utilizării cuvintelor Twitter cu datele demografice ne-a ajutat să înțelegem modelele socio-economice de bază din orașe. De exemplu, am putea lega utilizarea cuvintelor cu factori de sănătate precum obezitatea, așa că am construit un lexicocalorimetru pentru a măsura „conținutul caloric” al postărilor pe rețelele de socializare. Tweet-urile dintr-o anumită regiune care menționau alimente bogate în calorii au crescut „conținutul caloric” al acelei regiuni, în timp ce tweet-urile care menționau activitățile de exerciții fizice ne-au redus valoarea. Am constatat că această măsură simplă se corelează cu alte valori de sănătate și bunăstare. Cu alte cuvinte, tweet-urile ne-au putut oferi un instantaneu, la un moment dat, al stării generale de sănătate a unui oraș sau regiune.

Folosind bogăția datelor Twitter, am reușit și noi vezi tiparele de mișcare zilnice ale oamenilor cu detalii fără precedent. Înțelegerea modelelor de mobilitate umană, la rândul său, are capacitatea de a transforma modelarea bolilor, deschizând noul domeniu al epidemiologie digitală.

Pentru alte studii, am analizat dacă călătorii exprimă o fericire mai mare pe Twitter decât cei care stau acasă (răspuns: da) și dacă indivizii fericiți tind să rămână împreună într-o rețea socială (din nou, o fac). Intr-adevar, pozitivitatea pare a fi coaptă în limba însăși, în sensul că avem mai multe cuvinte pozitive decât cuvinte negative. Nu a fost cazul doar pe Twitter, ci într-o varietate de medii diferite (de exemplu, cărți, filme și ziare) și limbi.

Aceste studii - și mii de alții ca ei din întreaga lume - au fost posibile numai datorită Twitter.

Următorii 10 ani

Deci, la ce ne putem aștepta să învățăm de la Twitter în următorii 10 ani?

Unele dintre cele mai interesante lucrări implică în prezent conectarea datelor din rețelele sociale cu modele matematice pentru a prezice fenomene la nivel de populație, cum ar fi focarele de boală. Cercetătorii au avut deja un anumit succes în creșterea modelelor de boli cu date Twitter pentru a prognoza gripa, în special cea FluOutlook platformă dezvoltată de Universitatea Northeastern și Institutul pentru Schimb Științific.

Cu toate acestea, rămân o serie de provocări. Datele din rețelele sociale suferă de un „raport semnal-zgomot” foarte scăzut. Cu alte cuvinte, tweet-urile relevante pentru un anumit studiu sunt adesea înecate de „zgomot” irelevant.

Prin urmare, trebuie să fim conștienți continuu de ceea ce a fost supranumit „hubris de date mari”Atunci când dezvoltați noi metode și nu fiți prea încrezători în rezultatele noastre. Conectat cu acest lucru ar trebui să fie scopul de a produce predicții interpretabile „cutie de sticlă” din aceste date (spre deosebire de predicții „cutie neagră”, în care algoritmul este ascuns sau nu este clar).

Datele din rețelele sociale sunt adesea criticate (destul de) pentru că sunt mici, eșantion nereprezentativ a populației mai largi. Una dintre provocările majore pentru cercetători este de a afla cum să ia în considerare astfel de date înclinate în modele statistice. In timp ce mai mulți oameni folosesc rețelele sociale în fiecare an, trebuie să încercăm în continuare să înțelegem părtinirile din aceste date. De exemplu, datele tind să reprezinte în continuare persoanele mai tinere în detrimentul populațiilor mai în vârstă.

Doar după dezvoltarea unor metode mai bune de corecție a prejudecății, cercetătorii vor putea face predicții pe deplin încrezătoare din tweet-uri.

Despre autor

Lewis Mitchell, lector în matematică aplicată, Universitatea din Adelaide

Acest articol a fost publicat inițial Conversaţie. Citeste Articol original.

Cărți conexe

at InnerSelf Market și Amazon