«Подводные камни» в проведении социологических опросов. Часть 2

Рассмотрим ситуацию, описанную в первой части статьи. Во время избирательной компании в 1936 году был проведен опрос людей, чьи имена были взяты из телефонной книги и реестра автомобилей. Всего было разослано около 10 млн. листов с опросом. Но ответ был получен только по 2,4 листам.

На основе этой информации был сделан прогноз о результатах выборов. Но он оказался неверным. Почему? Рассмотрим этот вопрос подробнее. В процессе прогнозирования были допущены две серьезные ошибки: 1. Была неправильно определена статистическая совокупность; 2. Не было учтено уклонение от ответов.




Люди, имена которых были найдены в телефонной книге или реестре автомобилей, в 1936 году относились к более обеспеченному слою населения, в отличие от другой части респондентов. Разница такого характера присуща статистической совокупности. Большое количество избирателей не входит в телефонную книгу, список членов клуба или автомобильный реестр. Статистическая совокупность была определена неверно из-за уклона в сторону более состоятельных людей. Обеспеченные слои населения в основном были приверженцами республиканцев. В те годы существовала «взаимосвязь» между партийными предпочтениями и доходами людей. Менее обеспеченные слои населения поддерживали Демократическую партию.

Пример смещения (ошибки) в процессе выборки

Статистики классической школы дают определение «смещению» как постоянной ошибки в одном направлении. Не имеет значения практически, кого бы вы выделили из статистической совокупности, которая взята из «Литературного дайджеста», так как есть большая вероятность того, что на президентских выборах может быть избран именно состоятельный человек. Статистические данные были получены большей частью от состоятельных людей, а мнение избирателей с низким доходом учтено не было. А в 1936 году низкий доход имела большая часть населения. В то время около 9 миллионов граждан были безработными.

Проведение социологического опроса, организованного «Литературным дайджестом», не могло объять все слои населения. Избиратели того времени, как и сегодня, голосуют за кандидатов «по своему карману», т.е. за тех, кто выступает за их интересы. Нужно отметить, что Джордж Гэллап предсказал победу Рузвельта, сделав выборку из 50 тыс. человек. Он создал статистическую совокупность, которая состояла из разных слоев населения. Выборка «Литературного дайджеста» охватывала 2,4 млн. человек. Она является прекрасными примером того, что неверно составленная статистическая совокупность не способна дать объективную информацию лишь за счет увеличения масштабов выборки.

Уклонение от ответов

Следующей проблемой, возникшей на пути «Литературного дайджеста», стало то, что из 10 млн. человек в опросе приняли участие только 2,4 млн. респондентов. Обеспеченные люди тех лет отвечали на разную корреспонденцию охотнее, чем представители бедных слоев населения. 7,6 млн. людей, которые отказались принимать участие в опросе, относились к группе более низкого экономического статуса. А 2,4 млн. респондентов являлись обеспеченными людьми.

Исследование, проведенное Лэндоном, представляет данную ситуацию следующим образом: «Если уровень ответов низкий (как в выше описанном опросе – 24%), то информация, полученная в ходе опроса, не является объективной. Это тот тип отбора, когда исключаются люди, не ответившие на полученную корреспонденцию».

Резюме и выводы

Если работать со статистической совокупностью, значительно отличающейся от «идеальной», на основе которой нужно делать выводы, то это приведет к серьезным ошибкам в анализе имеющихся данных. Потребуется много времени на определение «идеальной» статистической совокупности и на составление правильной выборки. Ежедневно мы слышим, например, о ценовой политике (для привлечения покупателей), основанной на «выборочной» информации, полученной в ходе опроса потребителей. Статистическая совокупность, как правило, должна включать мнение не только покупателей, но и тех людей, которые не покупают и не используют продукцию определенной компании, не смотря на то, что они могли бы иметь отношение к рынку и реагировать на изменение цен.

Нужно быть всегда начеку, чтобы определить неправильную статистическую совокупность. Расчеты, сделанные на базе неверной выборки, интервальное оценивание и статистические тесты не дадут эффективных результатов, если неверно определена статистическая совокупность. Нельзя относиться предвзято к отсутствию ответов. Школа Wharton провела исследование, в результате которого был сделан вывод: «Люди, участвующие в социологических опросах, отличаются от тех, кто их игнорирует. Отличие это состоит не только в отношении их к таким мероприятиям; оно имеет более глубокий смысл».