Чи може Twitter передбачити вибори? Ще ні

Дослідження, опубліковане минулого тижня, свідчить про те, що під час аналізу 435 виборів до Палати представників США у 2010 р. частота ім'я кандидата, зазначене у Twitter, може бути використано для прогнозування результатів виборів.

Але ось шалена річ - неважливо, що сказано про кандидата - позитивну, негативну чи нейтральну. Важливим було те, наскільки ім’я кандидата писали прихильники, вороги чи просто випадково.

Дослідники могли передбачити результат у 404 з 435 рас - вражаючий рівень прогнозування - 92,8 відсотка.

Але є улов ... і це великий.

Те, що стаття та її співавтор соціолог Університету Індіани Фабіо Рохас не змогли взяти до уваги (або, принаймні, визнати у всій своїй пресі з цієї теми), було простою статистичною ймовірністю. На 19 з 23 останніх виборів 90 відсотків діючих президентів перемогли на перевиборах.

Тож дослідники покращили нашу існуючу базу прогнозів на 2,8 відсотка. Не зовсім гідний новин, якщо його поставити в таку перспективу.

Члени влади - з їхнім існуючим визнанням імен у своїх районах та добре змазаною машиною для збору коштів - зазвичай мають невеликі труднощі з переобранням.

Я не перший запропонував це альтернативне пояснення результатів дослідників, як зазначив Стюарт Ротенберг:

Мало хто з авторитетних політологів прийме твердження Рохаса, що: "Нові дослідження в галузі інформатики, соціології та політології показують, що дані, отримані з платформ соціальних медіа, дають точне вимірювання громадської думки".

"Ніхто, кого я знаю, не говорить нічого близького до цього", - написав Майкл С. Льюїс-Бек, заслужений професор політології Ф. Уенделл Міллер в Університеті Айови та відомий авторитет як в американській політиці, так і в прогнозуванні виборів. в електронному листі мені цього тижня.

Трохи непокоїть те, що Рохас, соціолог, схоже, навіть не обговорює альтернативні пояснення своїх висновків у своїй статті (посилання нижче). Вчені несуть відповідальність представляти свої висновки громадськості таким чином, що також розкриває обмеження їхніх досліджень - що включає згадування, чому ці попередні результати можуть не витримати під час тестування в більш гострих суперечках або не національних політичних гонках.

Справжнім випробуванням цієї системи прогнозування буде те, коли вона використовується в перегонах, де посада не є настільки надійним предиктором. Можливо, Сенат або більше місцевих рас (наприклад, губернаторства). Це може бути хорошим дослідженням, але де стриманість у обговоренні результатів? Де перевірка обґрунтованості щодо раціональності висновків? Де подальше дослідження, яке демонструє ці результати, насправді можна узагальнити для інших виборів?

До цього моменту Twitter може бути швидким способом виміряти температуру виборів. А може і ні.

Але я думаю, що останнє, чим Twitter хоче бути відомим, - це соціальна мережа, де вміст того, що ви публікуєте, насправді не має значення.

!-- GDPR -->