Настрій США вимірюється за допомогою Twitter, 2006-2009

Група дослідників опублікувала простий аналіз слів із 300 мільйонів твітів (ви знаєте, ті короткі, 140 оновлень статусу, що надходять від осіб) із Twitter, і виявили щось дивовижне - люди щасливіші у вихідні, а також до і після роботи. Так, саме так - люди щасливіші, коли не працюють!

Трем дослідникам з Північно-Східного університету та двом з Гарвардської медичної школи прийшли до цих приголомшливих висновків.

Зараз, оскільки дослідники насправді не розглядали 300 мільйонів твітів окремо, настрій кожного твіту був таким висновок використання списку слів ANEW - Affective Norms for English Words - система оцінки слів, яка дає нормативні емоційні оцінки для слів англійської мови. Такі види аналізів є непрямими та грубими вимірами - вони можуть відзначити лише дуже великі тенденції, оскільки вони не обов’язково є надійними.

Клацніть, щоб переглянути відео та прочитати більше.

Наприклад, такий аналіз не може врахувати такі речі, як сарказм, подвійні негативи чи протилежні значення в людській мові (що може бути особливо поширеним у неформальних послугах соціальних мереж, таких як Twitter). "Ненавиджу цей сонячний день", наприклад, дослідники можуть оцінити як негативний, хоча насправді це, ймовірно, позитивний твіт. Оскільки дослідники не сказали, ми не маємо можливості дізнатися, скільки з цих видів твітів могло бути неправильно класифіковано.

Іншим обмеженням даних (і цікаво зазначити, що оскільки це не було опубліковано в рецензованому журналі, дослідники не згадують про обмеження своїх даних чи методології) є те, що воно також надає інформацію про місцезнаходження лише тим користувачам, які дозволили Twitter розміщувати своє географічне розташування. Тож чи жителі на південному заході США більше твітують? Або вони просто більш відкриті для включення цієї функції у Twitter? Це здається очевидним альтернативним поясненням.

Досить було створити круте відео, яке, я впевнений, обійдемо в Інтернеті (відео, яке також показує, що ми, мабуть, не дуже задоволені, поки спимо). Графіки також показують, що "настрій" Західного узбережжя відстає приблизно на 3 години від настрою Східного узбережжя - дивовижна кореляція з фактичною різницею в часі між двома узбережжями нашої нації.

Вибачте, але коли я бачу подібні дані, які стверджують очевидне, я просто не можу не почухати голову і не здивуватися, чому п’ять дослідників витратили десятки (сотні?) Годин на аналіз 300 мільйонів твітів. Вони чесно думали, що знайдуть щось вражаюче в таких «даних»? Існує так багато інших областей психічного здоров’я та реальної епідеміологічної роботи, які заслуговують на увагу дослідників, це просто здається марною тратою деяких очевидно розумних, перспективних дослідників.

!-- GDPR -->