Ha nagy mennyiségű adathoz szeretnénk jutni, a Survey kutatások mellett ma már más megoldásokat is használhatunk. Egy ilyen lehetséges új út, a digitális térben keletkező adatok felhasználása. A digitális adatok egy részét a felhasználók osztják meg, tweetek vagy posztok formájában, a kedvenc helyeiket megjelölve, reagálva egymásra a közösségi médiában, értelmezve a híreket, kommentálva a barátaik posztjaira. A digitális adatok másik fele azonban nem szándékosan keletkezik, ilyen például a felhasználók geo-lokációjának rögzítése az okostelefonok által. Kétségkívül az egyik legizgalmasabb digitális adatforrás a közösségi média. A közösségi média elemzése egy folyamatosan fejlődő iparág. Ennek az adat-tengernek a kiaknázása csak most kezdődik, ami azt jelenti, hogy jelenleg több a kérdésünk, mint a válaszunk. Mik a legjobb módszerek a közösségi média adatok elemzésére? Mennyire általánosíthatók az eredmények? Mi a következménye annak, hogy egy algoritmusok által szabályozott környezetben keletkeznek az adatok? A tervezett projekt ezekre a kérdésekre igyekszik majd válaszolni egy kísérleti Facebook vizsgálat segítségével, valamint nyilvános oldalakon található Facebook posztok elemzésén keresztül. A kutatás abban is új tudást hoz majd, hogy mik a leginkább ígéretes szövegelemzési módszerek ezen a területen.

Magyarországon jelenleg megközelítőleg 5.2 millió ember használja a Facebookot, ami azt jelenti, hogy az aktív internethasználók közel 90%-nak van profilja a közösségi oldalon. Ennek ellenére kevés olyan kutatás van, ami FB adatokra épül, a közösségi média aktivitást felhasználó kutatások jellemzően inkább Twitter adatokból indulnak ki. Ezzel a trenddel szakítva, a projektünk arra próbál választ adni, hogyan használhatók fel a Facebook adatok a társadalom-kutatásokban. A projektben a következő célokat tűzzük ki:

  • Módszertani keretrendszer: Kidolgozunk egy olyan módszertani keretrendszert, ami lehetővé teszi a közösségi média adatok hatékony elemzését.
  • A nyilvános oldalakon elérhető FB adatok megbízhatósága: A nyilvános oldalakon posztolt FB adatokat (ezeket megvásároljuk a projektben) összehasonlítjuk a kísérleti FB kutatásunk adataival. Ez az összehasonlítás lehetővé teszi a különböző adatforrások közötti hasonlóságok és különbségek azonosítását, ami a posztolási szokásokról nagyon fontos információkat fog nekünk szolgálni, valamint arra is lehetőséget ad, hogy a nyilvános oldalakon található FB adatok kutatási szempontból vett megbízhatóságát is meg tudjuk vizsgálni. 
  • Szöveganalitika: Különböző szöveganalitikai módszereket fogunk tesztelni, hogy kiválaszuk a közösségi média elemzés során leginkább használható megoldásokat. A célunk egy olyan módszertani keretrendszer kidolgozása is ami abban segít, hogy milyen szöveganalitikai módszereket lehet és érdemes kombinálni ahhoz, hogy a legtöbbet kihozzunk az adatainkból.