Исследования помогают маркетологам лучше понимать аудиторию и рынок. Например, выяснить, какой продукт выпустить или какой сегмент клиентов самый перспективный. Но опросить или проанализировать поведение всех клиентов сложно, особенно если база большая. Поэтому нужна репрезентативная выборка — небольшая часть аудитории, результаты исследования которой можно распространить на остальных. В статье разберём, что означает репрезентативная выборка, зачем нужна и как правильно её формировать.
Что значит репрезентативная выборка
Простыми словами репрезентативная выборка — это часть аудитории, которая точно отражает состав всей базы. Например: если среди клиентов 60% женщин и 40% мужчин, то в выборке будут люди в этих же пропорциях. Тогда выводы из исследования можно распространить на всю аудиторию.
Чтобы понять, как это работает, нужно разобраться с двумя понятиями.
- Генеральная совокупность — это все люди, которых нужно изучить. Например, покупатели интернет-магазина за год или пользователи, которые видели рекламу.
- Репрезентативная выборка — это часть генеральной совокупности, которую можно изучить. Проанализировать всю совокупность сложно, дорого и долго, особенно если это десятки и сотни тысяч людей. Поэтому берут часть и делают выводы на её основе.
Какие выборки являются репрезентативными: те, что повторяют структуру генеральной совокупности. Если в базе много людей старше 45 лет, а в опросе среди трёхсот человек их почти нет — данные будут искажены. Не потому, что выборка маленькая, а потому что она некорректная.
Именно поэтому количество людей для исследования не так важно, как её качество и соответствие реальной базе. Поэтому фраза «мы опросили тысячу человек» не гарантирует, что результат будет верный. Важнее, насколько эта тысяча похожа на всю аудиторию.
Чем репрезентативная выборка отличается от случайной
Случайная выборка — это когда каждый участник базы имеет равный шанс попасть в исследование. Например: алгоритм случайно выбирает 500 email-адресов из базы в 50 тыс. и отправляет им опрос. Это удобно, но не гарантирует точности — случайным образом могут попасться преимущественно мужчины из Москвы, когда они составляют лишь 20% от базы. Тогда данные окажутся смещёнными, а исследование — некорректным.
Выборка считается репрезентативной, если состав участников подбирается намеренно — так, чтобы повторять структуру всей аудитории. Если в базе 60% женщин, в выборке их тоже должно быть 60%.
Где и как репрезентативную выборку используют в маркетинге
Протестировать гипотезы. Перед тем как вложиться в новый товар или услугу, маркетологи проверяют гипотезы на небольшой выборке. Например, есть гипотеза: клиенты готовы платить на 20% больше за доставку в день заказа. В этом случае можно предложить такую функцию части клиентам и нанять под эту задачу отдельного курьера. Это позволит оценить спрос до запуска услуги.
Изучить поведение и мотивацию аудитории. Провести глубинные интервью или качественные опросы нескольких клиентов. В этом случае важно не брать тех, кто сам согласился. Как правило, это самые лояльные клиенты и их поведение не соответствует среднестатистическому покупателю.
Провести продуктовые исследования. Например, протестировать новую упаковку, интерфейс или услугу. В этом случае выборка должна отражать реальных пользователей, а не только продвинутых. Например, опытный пользователь интуитивно разберётся в неудобном интерфейсе, а новичок — нет. Если в тест попали только первые, продукт не будет оптимизирован под менее опытных пользователей.
Исследовать узнаваемость бренда. Можно обратиться к группе людей, похожим на целевую аудиторию, и узнать, насколько они знакомы с брендом в целом и его продуктами в частности.
Какой может быть выборка и какую обычно используют маркетологи
Выборки различаются по двум параметрам: как отбирают участников и как они связаны между собой. Первый параметр определяет, насколько можно доверять результатам и распространять их на всю аудиторию. Второй — влияет на чистоту эксперимента и то, насколько группы влияют друг на друга. Разберём каждый из них.
Виды репрезентативной выборки аудитории
По методу отбора: вероятностная и невероятностная. Представьте, что нужно опросить клиентов магазина. Можно пойти двумя путями:
- Разместить анкету в соцсетях и опросить всех, кто откликнулся — это невероятностная выборка. Провести такой анализ можно быстро, но выводы делать сложнее — непонятно, насколько эти люди похожи на всю аудиторию.
- Случайно выбрать людей, но следить, чтобы среди них было столько же женщин, мужчин или жителей разных городов, сколько в реальной аудитории. Это вероятностная выборка — результатам можно доверять.
То есть в первом случае вероятность, что опрошенные будут похожи на всю генеральную совокупность, гораздо ниже, чем во втором.
По связи между участниками: независимая и зависимая. Если в исследовании участвуют разные люди в разных группах — это независимая выборка. А если одни и те же люди участвуют в исследовании дважды — это зависимая выборка.
Предположим, нужно понять, какой дизайн письма сработает лучше. Маркетолог может запустить A/B-тест: сделать два варианта рассылки и отправить её небольшой группе получателей. В этом случае письма получат разные люди — это пример независимой репрезентативной выборки. Если маркетолог покажет коллегам первый вариант письма, потом внесёт какие-то изменения и покажет ещё раз — это будет зависимая выборка. Те же люди, но сравнивают результат до и после.
Проще говоря: независимая — это разные люди, зависимая — одни и те же люди в разное время или в разных условиях.
Какую выборку обычно используют маркетологи
В маркетинге чаще используют вероятностную независимую выборку.
Вероятностная даёт результаты, которые можно распространять на всю аудиторию. Вы знаете, кто попал в исследование и в каких пропорциях, а значит, можете доверять выводам. Невероятностная выборка такой уверенности не даёт: непонятно, насколько откликнувшиеся люди похожи на остальных.
Независимая выборка удобна тем, что разные группы не влияют друг на друга. Например: если один и тот же человек сначала видит вариант А, а потом вариант Б, то его оценка будет искажена. Потому что он сравнивает, а не оценивает каждый вариант независимо. Когда группы разные, этой проблемы нет.
Поэтому большинство маркетинговых исследований строятся именно на вероятностной независимой выборке: опросы, A/B-тесты, кастдевы. Это не самый быстрый метод репрезентативной выборки, но довольно надёжный.
Провести опрос или A/B-тест рассылки можно с помощью маркетинговой платформы Sendsay. У неё есть отдельные инструменты под каждую задачу:
- Для опросов есть специальные формы, которые можно разместить на сайте или добавить в рассылку. Если письмо отправлять через Sendsay, то результаты сохраняются в карточку опрошенного подписчика. Эти данные пригодятся для персонализации коммуникации.
- Для A/B-теста тоже есть инструмент, который позволяет автоматизировать исследование. Достаточно сделать два разных письма, выбрать базу получателей и указать критерии победы: OR, CTR или что-то другое. Sendsay отправит рассылку, соберёт статистику и, при желании маркетолога, автоматически отправит лучшее письмо оставшейся базе.
Как сформировать репрезентативную выборку
Разберём на конкретном примере: есть интернет-магазин с клиентской базой в 40 тыс. клиентов. Нужно понять, почему люди уходят после первой покупки. Разберём пошагово, как сделать репрезентативную выборку для опроса.
Шаг 1. Решите, кого именно изучаете
Все клиенты не подходят, поэтому нужно подумать, кто именно нужен. Например:
- сделал одну покупку и больше не возвращался;
- совершил менее двух заказов;
- купил в последние полгода.
Чем точнее опишете группу, тем корректнее будет результат исследования.
Шаг 2. Посмотрите, однородная ли у вас аудитория
На этом шаге нужно понять, насколько сильно клиенты отличаются друг от друга. От этого будет зависеть принцип отбора людей для статистически репрезентативной выборки. Так, если все клиенты примерно одинаковые, подойдёт и случайный отбор. Но если внутри базы есть разные группы, случайная выборка не подойдёт.
Например: две третьих базы — женщины 35+ лет, треть — мужчины 30+. Если взять случайных 400 человек, мужчины могут не попасть в выборку или попасть в слишком маленьком объёме. И маркетолог не узнает, из-за чего эти люди перестали покупать. А ведь это 33% процента целевой аудитории.
В таком случае нужно разделить базу на сегменты и из каждого взять пропорциональную часть для репрезентативной выборки. Из всех женщин должно быть 66% респондентов, из всех мужчин — 33%. Тогда каждая группа будет представлена в нужном количестве.
Шаг 3. Посчитайте, сколько людей нужно опросить
Размер выборки зависит от размера базы, погрешности и того, насколько хотите быть уверенными в результате.
Как правило, исследования проводят с такими вводными: доверительный интервал 95%, погрешность ±5%. Это значит, если опрос показал, что 60% клиентов недовольны доставкой, реальная цифра по всей базе будет 55–65% с учётом погрешности. Вероятность такого результата — 95%, то есть очень высокая.
Если использовать такие вводные, то репрезентативная выборка не требует большого количества людей. Так, если база:
- до тысячи → опросить примерно 278 человек;
- 10 тыс. → примерно 370;
- 40 тыс. → примерно 381.
Чтобы не считать вручную, можно воспользоваться готовыми калькуляторами: SurveyMonkey или Qualtrics.
При росте базы не сильно меняется объём репрезентативной выборки. Это нормально, так как при заданной точности её размер почти не зависит от размера базы. Это как анализ крови: врачу не нужно брать литр крови у крупного человека и каплю у худого. Одинаковый объём — одинаковая точность.
Шаг 4. Отберите участников случайным образом
Частая ошибка — взять удобных для опроса людей: кто сам написал в поддержку, активных подписчиков или просто новых клиентов. Это не случайная выборка, а смещённая — в этом случае на результаты исследования полагаться не стоит.
Случайный отбор означает, что у каждого равные шансы попасть в исследование. Поэтому не нужно вручную отбирать более удобных людей, лучше доверить всё случаю. Сделать это можно по-разному. Например, в Excel есть функция СЛЧИС(), которая присваивает каждому контакту случайное число. Затем можно взять всех людей, которые получили число от 10 до 100.
Шаг 5. Проверьте репрезентативность выборки
Какая выборка считается репрезентативной — отражает структуру базы и собрана в достаточном объёме.
Поэтому после отбора сравните выборку с исходной базой по ключевым параметрам: пол, возраст, география, давность покупки, смотря что важно для вашего исследования. Эти данные обычно есть в CRM, рекламном кабинете или в аналитике сайта. Большого расхождения быть не должно. Если есть — скорее всего, в отборе нарушился принцип случайности.
Далее нужно проверить погрешность и уровень доверия, а затем сопоставить их с объёмом выборки. Помимо этого, стоит задать вопросы, которые помогут оценить характеристики репрезентативной выборки:
- Правильно ли определена генеральная совокупность?
- Люди выбраны случайно или взяли тех, кого удобнее опросить?
- Достаточен ли размер репрезентативной выборки для статистически значимых выводов?
В каком случае выборка нерепрезентативна: частые ошибки
Есть смещение по полу, возрасту или другим характеристикам. Например, разместили опрос в Telegram-канале, и его заполнили в основном женщины до 35 лет. Но если база для анализа на 60% состоит из мужчин, результаты исследования не будут отражать всю аудиторию.
Данные собраны только в одном канале. Подписчики email-рассылки, клиенты из офлайн-магазина, посетители сайта — это разные группы с разным поведением. Если опросить только одну из них, критерии репрезентативной выборки будут не соблюдены.
Люди отобраны неслучайным образом. Если разослать опрос по всей базе и получить лишь 200 ответов из нужных 500, то исследование нельзя назвать правильным. Скорее всего, ответившие — самые лояльные или самые недовольные клиенты. Чтобы избежать этого, можно предлагать бонус за прохождение опроса для дополнительной мотивации: промокод, подарок, баллы программы лояльности.
Слишком маленькая выборка. Если у вас 40 тысяч клиентов, делать выводы на основе опроса 100 человек нельзя — это недостаточный процент для репрезентативной выборки. Чтобы получить релевантные данные, нужно опросить около 400 человек.
Главное о репрезентативной выборке в маркетинге
Репрезентативной называется выборка, где есть аудитория, которая наиболее полно отражает всю исследуемую базу. Для получения репрезентативной выборки нужно:
- определить структуру своей аудитории — какие есть сегменты;
- выяснить соотношение сегментов относительно базы в целом;
- случайным образом взять пропорциональное количество людей из каждого сегмента;
- убедиться, что размер выборки правильный и достаточный для значимых выводов.
Если выборка не отражает реальную аудиторию, выводы будут неточными независимо от того, сколько людей в ней участвовало. Именно поэтому качество данных важнее их объёма. Тысяча ответов от смещённой выборки даст меньше пользы, чем четыреста ответов от правильно отобранных респондентов.