К основному контенту

Исследовательский опрос и доверительный интервал

В изучении данных опросов статистические методы применяются для работы со случайными выборками и позволяют оценить степень достоверности полученных данных.

Что такое доверительный интервал?

Доверительный интервал - это предел погрешности, с которой исследователь бы столкнулся в случае, если бы мог задать вопрос каждому представителю целевой группы и получил бы тот же ответ, что в случае опроса выборки.

Например, если исследователь использовал доверительный интервал равный 4, а 60% участников опроса ответили "Порекомендовал бы другу", он может быть уверен, что примерно между 56% и 64% участников всей целевой группы также бы ответили "Порекомендовал бы другу", если бы им задали тот же вопрос. Доверительный интервал в этом случае составляет +/-4

Что такое уровень достоверности?

Уровень достоверности - это выражение уверенности исследователя в данных, полученных в результате опроса. Уровень достоверности выражается в процентах и говорит о том, насколько репрезентативной выборка является в контексте всей целевой группы. Наиболее часто используемое значение уровня доверия составляет 95%. Связанная концепция называется статистическая значимость.

Уверенность исследователя в подходе к изучению и реализации, а также понимание существующих ограничений в значительной мере основана на трех важных переменных: размер выборки, частота ответов и размер целевой группы. Исследователи давно согласились, что эти переменные должны быть тщательно рассмотрены на этапе планирования исследования.

Размер выборки

Если говорить в общем, то большие выборки предоставляют данные, которые репрезентативны в конктексте целевой группы. Широкий доверительный интервал говорит о меньшей достоверности данных, поскольку существует большая погрешность. Широкий доверительный интервал - это, как хеджирование ставок. Существует связь между доверительным интервалом и размером выборки, но эта зависимость нелинейна. Исследователь не может в два раза уменьшить доверительный интервал, лишь удвоив размер выборки. 

Частота ответов

Точность, с которой данные выборки отражают целевую группу, также зависит от процента респондентов, которые дали прямой ответ или же ответили неопределенно. Чем больше респондентов дали прямой ответ, например, "Очень доволен", тем более уверен исследователь может быть в этих ответах. 

Разброс данных

Следует помнить, что разброс (данные по краям нормальной кривой) в целевой группе с большой вероятностью находится на том же уровне, что и в самой выборке. Чем меньше частота - тем меньше изменчивость. 

Размер целевой группы

Размер целевой группы не является важным фактором до тех пор, пока исследователь работает с достаточно маленькой и хорошо известной группой (настолько маленькой, что все ее участники известны исследователю).

Система креативного исследования указывает на следующее: 

"Математическая вероятность доказывает, что численность группы не имеет значения, если размер выборки не превышает нескольких процентов от общего размера изучаемой группы. Это означает, что выборка из 500 человек полезна, как в изучении штата 150,000,000, так и в изучении города 100,000".

Создание репрезентативной выборки может быть дорогостоящим и долгим. Исследователям всегда приходится выбирать между уровнем достоверности, который они хотят получить и степенью точности, которой они должны достичь, а также доверительным интервалом, который они могут себе позволить. 

Размер выборки в качественных исследованиях

Качественные исследования по своей натуре несут описательный характер и не фокусируются на цифрах. Однако опасения относительно погрешности выборки остаются актуальными. Как правило, если выборка представляет целевую "вселенную", темы и паттерны исследования будут отражать большую группу, представлющую интерес для исследователя. Если выборка репрезентативна и достаточно велика, тогда увереннеость в точности полученных данных существенно возрастает. 

Определение размера выборки в исследовательких опросах

Когда дело доходит до определения размера выборки, для качественных и количественных исследований применяют разные правила. В основном, чтобы быть уверенным в данных, полученных с помощью качественного опроса, исследователь должен иметь представление о том, как эти данные будут использоваться. Полученные данные могут служить базой для описание этнографического исследования или быть использованы для определения релевантных переменных, которые в дальнейшем могут быть изучены на предмет наличие кореляций с помощью количественных методов. 

Размер выборки в количественных опросах

Количественные исследования часто включают сравнения сегментов рынка или подгрупп целевого рынка. Поскольку количественные исследования основаны на цифрах, определение удобного размера выборки может быть довольно простым - для каждой важной группы исследователь надеется опросить примерно 100 респондентов. Это число - рекомендация, которая не является абсолютной. Исследователь должен учесть число значимых переменных для определения размера выборки. 

Проводя опрос в рамках исследования рынка, цель - сделать вывод, опираясь на выборку, что вероятно будет справедливо для целевой "вселенной". Выборка предоставляет данные, опираясь на которые исследователь может оценить степень вероятности нахождения неизвестного параметра в рамках целевой группы. 


Что такое доверительный интервал
Изучение количественных исследований основано на изучении нормальной симметричной кривой, которая в сознании исследователя представляет целевую "вселенную". Репрезентативная выборка позволяет исследователю вычислить оценочный диапазон значений, которые вероятно включают неизвестное значени или параметр, представляющий интерес. Этот оценочный диапазон значений представляет участок нормальной кривой и выражается в виде десятичной дроби или в процентах.

Нормальная кривая и вероятность

Нормальная симметричная кривая - визуальное выражение вероятности. Давайте рассмотрим простую эвристику: большое количество шаров может падать между двумя листами по одному за раз. Каждый шар проходит через то же отверстие, что и предыдущий, а затем падает между любыми вертикальными параллельными разделителями, которые отделяют стопки шариков, когда они останавливаются. Через несколько часов шарики сформировали форму нормальной кривой. Кривая немного меняется по мере того, как каждый вновь введенный шар попадает в массу шаров, которые прибыли первыми. Но в целом симметричность кривой очевидна и она образовалась естественным образом, без какого-либо воздействия со стороны наблюдателей. Искривленная форма, образованная шарами, отражает вероятность того, что большая часть шаров упадет в центр и останется там. Остальные шары распределятся по краям кривой, некоторые окажутся на самом краю, но их число будет невелико.

Эта нормальная кривая близка к концепции выборки. Каждый раз, когда шар падает в коробку Галтона, конфигурация стопок шаров будет немного отличаться. Но с течением времени форма кривой не сильно изменится и паттерн сохранится.

Источник: https://www.thebalance.com/surveys-research-confidence-intervals-2297097

Комментарии

Популярные сообщения из этого блога

Методы анализа данных опроса

Теперь, когда вы получили результаты опроса и составили план анализа данных, настало время копнуть поглубже. Вот четыре основных этапа эффективного анализа данных: 1. Посмотрите на главные вопросы вашего исследования 2. Скопируйте таблицу и отфильтруйте результаты 3. Подсчитайте результаты 4. Сделайте выводы

Сколько людей должно принять участие в опросе, чтобы данные были репрезентативными

Отличный вопрос. Если у вас нет калькулятора расчета размера выборки, у нас есть супер-удобная таблица с ответами. Чтобы использовать эту таблицу, вам нужно задать себе лишь два вопроса: