Статья
5241 14 ноября 2017 13:05

Как большие данные изменят социологию

Социологам часто ставят в вину тот факт, что они за счет своих старых методов исследования не смоги предсказать ни Brexit, ни победу Трампа. Соцопросы больше фиксируют не некую реальность, а лишь сиюминутные настроения граждан. Наука, надо сказать, уже подвергается масштабным изменениям, и сейчас очевидно размежевание на «популярную социологию» и «социологию больших данных». Что будет с наукой и как социологи будут изучать общество в ближайшее время?

Слишком много информации

Если попытаться грубо разделить все исследовательские методы социологов, то мы получим две большие группы: методы сбора и методы анализа информации. И если раньше сбор эмпирических данных для социологов представлял проблему, то в эпоху больших данных внимание концентрируется именно на методах анализа информации. У понятия Big Data даже одно из определений, которое предложил редактор издания O'Reilly Media Майк Лукидис, звучит следующим образом: «большие данные — это данные, размер которых представляет проблему для анализа традиционными методами». То есть, сегодня сложнее не собрать информацию, а качественно ее проанализировать.

И современная социология уходит именно в эту область, в область анализа больших данных и автоматизированного сбора имеющейся в сети информации. Ведь каждый из нас ежедневно генерирует огромное количество данных: тексты, фото, видео. В них содержатся наши оценки, наши мысли и мнения по самым разным вопросам. Сегодня, чтобы понять, что люди думают о любом политике, не нужно спрашивать их об этом напрямую, достаточно проанализировать социальные сети. Это будет не только эффективнее, но на выходе мы получим гораздо более точный результат.

Например, согласно большинству соцопросов, победу на президентских выборах в США должна была одержать Хиллари Клинтон, но этого не произошло. По одной из версий, главной причиной стали изменения в поведении людей: они думают одно, а под запись говорят совершенно другое (сторонники Трампа боялись признаться в своем выборе из-за возможного осуждения со стороны окружающих). Если устранить эффект наблюдателя (интервьюера), то респондент может поменять свой ответ. Именно поэтому анализ постов, комментариев и лкйков в социальных сетях (где взаимодействие происходит опосредованно) оказывается значительно эффективнее. Аналитики больших данных любят повторять, что они анализируют не слова человека (хотя и их тоже), а его действия (лайки,и репосты).

Выборка не нужна?

В социологии есть хрестоматийный случай, который доказал бесполезность увеличения выборки исследования после достижения определенного количества респондентов, а также важность научной строгости при формировании самой выборки.

В 1936 году влиятельный на тот момент американский журнал «The Literary Digest» опубликовал результаты самого масштабного почтового опроса. Темой опроса стали президентские выборы в США. Согласно результатам, уверенную победу должен был одержать республиканец Альфред Лэндон (55%), демократу Франклину Рузвельту отдавали только 41% голосов. Но результаты голосования были абсолютно другими. Рузвельт набрал 60,8% голосов, а Лэндон только 36,5%. Но почему возникла такая ошибка? Ведь практически 20 лет до этого «The Literary Digest» довольно удачно справлялся с прогнозированием результатов выборов.

В 1936 году сработал принцип «хотели как лучше, а получилось как всегда». Издание решило опросить каждого четвертого американца, и направило более 10 миллионов опросных листов по почте. Гипотеза исследователей заключалась в том, что чем больше число опрошенных, тем выше точность полученных результатов. Всего в издание вернулось 2,3 миллиона анкет, что даже по нынешним меркам считалось бы огромным достижением (например, выборка для всероссийского опроса у ВЦИОМа составляет 1800 респондентов). Но случай 1936 года показал, что количество респондентов никак не влияет на качество получаемых результатов, если были нарушены правила формирования выборки. Нерепрезентативная выборка, пусть даже размером 2,3 миллиона, дает нерепрезентативные данные.

Но в условиях, когда вы можете анализировать не часть, а всю генеральную совокупность, проблема формирования выборки отпадает сама собой. А современные технологии позволяют узнать мнение всей генеральной совокупности, особенно в тех странах, где уровень проникновения сети приближается к 100%.

Разделение науки и опросной социологии

Конечно, традиционные опросные методы сбора данных (анкетирование и интервьюирование) в социологии продолжают сохраняться, но их доля с каждым годом уменьшается. Значит ли это, что в скором времени вся социология уйдет в анализ больших данных? Нет. Во-первых, существуют области, которые все еще лучше поддаются исследованию, например, за счет экспертного интервьюирования. Во-вторых, проникновение сети пока не достигло таких масштабов, чтобы полностью отказаться от традиционных методов сбора данных. Тем не менее, некоторые тенденции этой дихотомии проявляются уже сейчас.

С каждым годом разрыв между опросной социологией и наукой становится все больше. Опросная социология зачастую становится инструментом политической борьбы и служит интересам заказчика. Прелесть опросной социологии заключается в том, что она дает простые ответы на сложные вопросы: условные 69% выступают за Путина, 64% являются православными и так далее. Читателю это понять довольно просто. Куда сложнее рассматривать, например, огромные графы пользователей социальных сетей, которые положительно или отрицательно высказывались по поводу фильма «Матильда», сколько из них православных, а сколько атеистов и т.д.

Поэтому социология как наука все больше и больше будет уходить в область анализа больших данных, а опросная социология в сферу политической конкуренции: формирующие опросы, дезинформация и прочие методы работы.

Михаил Карягин, политолог
© 2008 - 2024 Фонд «Центр политической конъюнктуры»
Сетевое издание «Актуальные комментарии». Свидетельство о регистрации средства массовой информации Эл № ФС77-58941 от 5 августа 2014 года, Свидетельство о регистрации средства массовой информации Эл № ФС77-82371 от 03 декабря 2021 года. Издается с сентября 2008 года. Информация об использовании материалов доступна в разделе "Об издании".