Як ми з’ясували, які твіти є достовірними

Дослідники з Джорджійського технологічного інституту розробили нову мовну модель, яка показує, які слова та фрази позитивно чи негативно впливають на довіру до світових подій, про які повідомляється у Twitter.

Дослідження, яке відсканувало 66 мільйонів твітів щодо майже 1400 реальних подій, свідчить про те, що слова мільйонів людей у ​​соціальних мережах можуть запропонувати значну інформацію про достовірність події, навіть коли подія все ще триває.

"Протягом останніх років було проведено багато досліджень щодо довіри до соціальних мереж, але дуже мало відомо про те, які типи слів або фраз створюють сприйняття довіри під час швидко розгортаються подій", - сказала Танушрі Мітра, доктор технічних наук з Джорджії. кандидат, який керував дослідженням.

Команда вивчала твіти щодо світових подій у 2014 та 2015 роках, зокрема поява Еболи у Західній Африці, напад Charlie Hebdo у Парижі та смерть Еріка Гарнера у Нью-Йорку.

Дослідники попросили людей оцінювати дописи щодо їхньої достовірності (від "напевно точних" до "безумовно неточних"). Потім команда подала слова в модель, яка розділила їх на 15 різних мовних категорій. Класифікація включала позитивні та негативні емоції, живоплоти та підсилювачі, а також тривогу.

Потім комп'ютер Georgia Tech вивчив ці слова, щоб визначити, чи є твіти достовірними чи ні. Це відповідало думкам людей приблизно 68 відсотків часу, що на відсоток значно перевищувало випадкову базову лінію у 25 відсотків.

"Твіти з прискореними словами, такими як" незаперечний ", та позитивні емоційні терміни, такі як" охочий "та" приголомшливий ", були розцінені як дуже надійні", - сказала Мітра. «Слова, що вказують на позитивні настрої, але глузують над непрактичністю події, такі як« ха »,« усмішка »або« жарт », були визнані менш вірогідними. Так само були слова-хедж, включаючи "певний рівень" і "підозрюваний".

Більша кількість ретвітів була пов’язана з нижчими показниками довіри.Вважали, що відповіді та ретвіти з більшою довжиною повідомлень є більш надійними.

"Можливо, більша довжина повідомлень надає більше інформації або міркувань, тому їх розглядають як більш надійних", - сказала вона. "З іншого боку, більша кількість ретвітів, які оцінюються нижче за достовірність, може представляти спробу викликати колективні міркування під час кризи або невизначеності".

Хоча модель ще не розгортається, дослідники заявляють, що з часом можуть розробити додаток, який зможе обчислити сприйнятливу надійність події під час її розгортання в соціальних мережах.

"У поєднанні з іншими сигналами, такими як теми подій або структурна інформація, наш лінгвістичний результат може стати важливим складовим елементом автоматизованої системи", - сказав д-р Ерік Гілберт, радник Мітри та доцент Школи інтерактивних обчислень у Джорджії Тех.

“Twitter є частиною проблеми поширення неправдивих новин в Інтернеті. Але це також може бути частиною рішення ".

Джерело: Джорджійський технологічний інститут

!-- GDPR -->