Что понимается под репрезентативностью получаемых данных

Репрезентативность

Также репрезентативность можно определить как свойство выборочной совокупности представлять параметры генеральной совокупности, значимые с точки зрения задач исследования.

Связанные понятия

Упоминания в литературе

Связанные понятия (продолжение)

Надёжностью называется один из критериев качества теста, его устойчивость по отношению к погрешностям измерения. Различают два вида надёжности — надёжность как устойчивость и надёжность как внутреннюю согласованность.

Качественный метод исследования – это метод сбора, обработки и анализа информации об индивидах. Объектом интереса качественных исследований являются индивиды как исполнители социальных ролей. Предметом исследования качественных исследований является «характер исполнения роли (вариации социального выбора)».

В когнитивной науке под когнити́вными искаже́ниями понимаются систематические ошибки в мышлении или шаблонные отклонения, которые возникают на основе дисфункциональных убеждений, внедрённых в когнитивные схемы, и легко обнаруживаются при анализе автоматических мыслей. Существование большинства когнитивных искажений было описано учёными, а многие были доказаны в психологических экспериментах.

Групповáя поляризáция — психологический феномен расхождения по разным полюсам мнений участников дискуссии во время принятия группового решения. Величина разброса конечных вариантов напрямую зависит от первоначальных позиций участников. То есть, чем дальше от середины находились их мнения в начале дискуссии, тем сильней будет проявляться феномен. Важно разделять «поляризацию» и «экстремизацию». Поляризация — явление, при котором решение члена группы смещается к ранее выбранному им полюсу; при экстремизации.

Источник

Репрезентативность данных

Репрезентативность – представительность, насколько полно представлены все типы изучаемых явлений и объектов. Она определяет исторический масштаб исследования. Пример – описание дворянских имений в дворянском земельном банке. Репрезентативен ли этот источник для изучения поместного хоз-ва в России? Нет, но зато будет репрезентативен для изучения дворянского хоз-ва.

Качественная репрезентативность определяется тем, в какой мере показатели, на основе которых изучаются соответствующие явления и процессы, отражают именно те черты и свойства, которые характеризуют внутреннюю суть этих явлений и процессов. Поэтому важно на основе содержательной интерпретации исследовательской задачи отобрать именно такие, представительные, показатели, без которых нельзя правильно раскрыть суть исследуемых явлений и процессов. При этом в исследовании, основанном на привлечении источников, содержащих большое число данных, эффективным является выявление наиболее существенных из них путем предварительной экспериментальной обработки небольшой выборочной совокупности объектов.

Количественная репрезентативность выражается в том, что показателей должно быть достаточно для получения надежных, т.е. имеющих необходимую точность, численных значений признаков, характеризующих изучаемые явления и процессы.

Когда исследователь имеет данные, характеризующие все объекты изучаемой совокупности, и подвергает их сплошной обработке, проблемы количественной репрезентативности показателей не существует. Однако, как

правило, историк имеет дело либо со слишком большим объемом данных,

которые трудно подвергнуть сплошной обработке, либо с немногими сохранившимися сведениями. В том и другом случае он работает с выборочными данными: либо с собственно выборкой, сформированной самим исследователем, либо с так называемой «естественной выборкой».

Достоверность данных

Ошибки измерения имеют различную природу.

Ошибки измерения делятся на ошибки регистрации количественных значений признаков и ошибки исчисления.

Ошибки регистрации могут быть систематическими и случайными.

1. Случайные. Имеют разнонаправленный характер. История бытования источника может выдать эти случайные ошибки. В случае, когда историк работает с массовыми статистическими данными, кот характеризуют массовые исторические объекты, применение кол методов направленных на выявление закономерностей развития изучаемых объектов позволяет нивелировать или уменьшать погрешности и случайные ошибки.

2. Систематические связаны с неким преднамеренным искажением (занижением завышением) данного показателя и данной мысли, то есть с определенными субъективными интересами у т.н. творца источника.

Для определения достоверности конкретно-исторических данных, зафиксированных в источниках, необходимо установить:

— каковы были представления о сущности изучаемых явлений в период создания исторических источников;

— кто (учреждение или лицо) и с какой целью проводил сбор;

— откуда поступали сведения;

— кто непосредственно собирал их;

— как обрабатывались и обобщались первичные данные;

— какова была система проверки данных и т.д.

Ясно представляя себе недостатки данных, следует искать пути повышения их информативной отдачи. При этом важно иметь в виду, что многие количественные показатели, отличающиеся значительными погрешностями, которые нельзя использовать для характеристики абсолютных значений изучаемых признаков, могут быть основой для получения весьма точных относительных сравнительных данных

Корреляционный анализ

Кол методы позволяют решать проблему достоверности статистических данных с помощью метода корреляционного анализа. Задача, стоящая перед историком, сводится к тому, что если историк имеет в своем распоряжении данные, позволяющие ему выделить историю происхождения этого источника и провести сравнение на предмет достоверности или найти упоминание этого источника в других – проблем нет.

При содержательном анализе взаимосвязей часто необходимо не только оценить тесноту связи между изучаемыми признаками, но и определить степень воздействия одного признака на другой. Для решения этой задачи используется коэффициент детерминации

Корреляционный анализ – совокупность методов математической статистики, позволяющих обнаружить корреляционную зависимость между случайными величинами или признаками и оценить значимость этой связи.

Идея проверки состоит в системном подходе к изучению различных объектов социально-экономической истории, а именно – это представление о том, какова структура системы изучаемого объекта (помещ хоз-ва, аграрного строя и т.д.) и о характере взаимосвязей между элементами этой структуры. Пример проверки достоверности статистических данных – это корр анализ данных о сельскохоз наемных рабочих и группы источников (перепись 1897 и комиссия 1901).

Определим степень корреляционной зависимости между доходом и размерами помещичьего хозяйства в России на рубеже XIX-XX вв. по сведениям о размерах (в десятинах) и доходах (в тыс. руб.) десяти помещичьих имений

Априори ясно, что доходность имения росла вместе с увеличением его размеров. Однако доходность имения, помимо его размеров, определялась еще качеством земли, состоянием хозяйства, деловыми способностями его владельца, близостью рынка, уровнем агротехники и другими факторами

Источник

Простыми словами о выборке

Что понимается под репрезентативностью получаемых данных. Смотреть фото Что понимается под репрезентативностью получаемых данных. Смотреть картинку Что понимается под репрезентативностью получаемых данных. Картинка про Что понимается под репрезентативностью получаемых данных. Фото Что понимается под репрезентативностью получаемых данных

Привет. Я UX-исследователь в СКБ Контур. Чаще всего в работе я использую качественные методы исследований — глубинные интервью и модерируемые юзабилити-тестирования. Количественные исследования без подготовленной инфраструктуры со стороны разработки более ресурсозатратные, поэтому самостоятельно их провести сложнее.

Но самое сложное для меня в проведении количественного исследования — это выборка. Мне ближе гуманитарная сторона исследовательской работы, поэтому разобраться в выборке сложнее, чем в техниках ведения интервью. Если у тебя такая же проблема, эта статья будет полезна.

Ниже я попробовала просто рассказать о выборке, репрезентативности и методах отбора при проведении количественного исследования.

Что понимается под репрезентативностью получаемых данных. Смотреть фото Что понимается под репрезентативностью получаемых данных. Смотреть картинку Что понимается под репрезентативностью получаемых данных. Картинка про Что понимается под репрезентативностью получаемых данных. Фото Что понимается под репрезентативностью получаемых данных

Выборка и репрезентативность

Опрос — это количественный метод, направленный на получение точной, объективной и статистически значимой информации. Если качественные методы помогают в формулировке гипотез, то количественные — масштабируют и проверяют эти гипотезы на всей целевой аудитории.

Поэтому важно проводить отбор респондентов таким образом, чтобы выборочная совокупность отражала состав всей генеральной совокупности.

В социологии есть термин — единица наблюдения. Это может быть один человек, группа или сообщество в зависимости от целей исследования.

Генеральная совокупность — это вся совокупность единиц наблюдения, имеющих отношение к теме исследования.

Например, если ты проводишь продуктовое исследование, то скорее всего твоя генеральная совокупность — это все пользователи сервиса или определенный сегмент.

Выборочная совокупность — часть генеральной совокупности, которую вы изучаете в ходе исследования с помощью разработанных вами инструментов (анкета, гайд и прочее).

Например, в ходе исследования было опрошено 400 респондентов среди всех пользователей сервиса. Это твоя выборочная совокупность.

Выборка должна быть репрезентативной, иначе результаты количественного исследования будут сомнительными.

Репрезентативность — обеспечение в выборочной совокупности наличия всех видов единиц генеральной совокупности в достаточном количестве.

Репрезентативность имеет качественное и количественное выражение. Качественная репрезентация обязывает включить в выборку все возможные варианты респондентов, особенно, если какой-то признак влияет на опыт использования сервиса.

Например, выборка не будет репрезентативной если ты опросишь только новых пользователей (если это не оправдано целями исследования). Особенно это исказит результаты исследования, если длительность использования напрямую влияет на проверку гипотезы.

Что понимается под репрезентативностью получаемых данных. Смотреть фото Что понимается под репрезентативностью получаемых данных. Смотреть картинку Что понимается под репрезентативностью получаемых данных. Картинка про Что понимается под репрезентативностью получаемых данных. Фото Что понимается под репрезентативностью получаемых данных

На практике, особенно в онлайн-опросах, качественная репрезентативность может страдать. Ею можно пренебречь, если вы уверены, что на проверку гипотезы не повлияет принадлежность респондента к той или иной группе. Онлайн-опросы предполагают стихийную выборку и поэтому предусмотреть присутствие всех типов респондентов сложно. Про стихийную выборку подробнее я расскажу ниже.

Чтобы соблюсти количественную репрезентацию нужно обеспечить достаточное число респондентов, в том числе по каждой группе внутри выборки.

Например, если ты пригласишь на опрос 80% новых пользователей и лишь 20% пользователей с опытом — это тоже исказит результаты (опять же если это не предусмотрено дизайном исследования).

И, конечно, для того, чтобы масштабировать результаты опроса на всю генеральную совокупность (в нашем примере — на всех пользователей), нужно в целом рассчитать количество человек, которое ты планируешь пригласить для прохождения опроса.

Что значит «достаточное» количество человек для выборки.

К примеру, если проводить исследование на выборке в 50–100 человек, то погрешность в репрезентативности полученной информации будет выше, чем при опросе 800–1000 человек.

Но увеличивать до бесконечности число опрашиваемых нет смысла. После определенного количества респондентов ошибка выборки остановится на одном уровне.

Ошибка выборки — разность между характеристиками выборочной и генеральной совокупности. Это отклонение средних характеристик выборочной совокупности от средних характеристик генеральной совокупности.

Где-то после 400 респондентов ошибка выборки не меняется. Поэтому обычно в опросах выборочная совокупность составляет 300–400 человек. При таком значении ты можешь уверенно переносить результаты исследования на всю аудиторию при соблюдении качественной репрезентации и корректно составленной анкеты.

Если генеральная совокупность небольшая, то и выборочная совокупность будет меньше стандартных 300–400 респондентов.

Если хочешь разобраться с формулой расчета выборки подробнее про нее можно узнать здесь.

Также ты можешь провести сплошной опрос. При сплошном опросе ты опрашиваешь всю генеральную совокупность.

Например, если есть интересный и немногочисленный сегмент пользователей (30–100 человек), ты можешь опросить их всех. Или это стартап и уже есть первые пользователи. В таком случае тоже можно провести опрос по всей генеральной совокупности.

На практике требованиями количественной репрезентации иногда пренебрегают в силу нехватки ресурсов на обзвон (если это телефонный опрос) или времени на сбор ответов. Или если опрос проводят для сбора гипотез, а не для принятия конечного решения.

Здесь важно понимать, какое решение должно быть принято на основе исследования. Если это важный продуктовый или бизнес-вопрос, то лучше потратить время и деньги на проверку гипотезы с репрезентативной выборкой, чтобы не получить неверные выводы. А если, это, к примеру, опрос для сбора отклика по новой фиче, то можно остановиться на 30–60 респондентах. Основные выводы ты сделаешь, а пользователи по мере работы в сервисе расскажут о том, что ты мог пропустить.

Методы отбора

В количественном исследовании по сравнению с качественным не важно кто перед тобой, потому что все выводы строятся по совокупности ответов респондентов и материал собирается в обезличенном виде. Поэтому в идеале в выборку респонденты должны попадать случайным образом, чтобы сделать результаты максимально свободными от искажений.

Чтобы этого достичь можно использовать один из методов формирования выборки.

Случайные выборки

Они предполагают, что в выборке каждый элемент генеральной совокупности имеет заранее заданную вероятность быть отобранным в исследование.

Простая случайная выборка. Сначала нужно присвоить каждому потенциальному респонденту идентификационный номер. Дальше с помощью генератора случайных чисел определить номера, которые будут включены в выборку для опроса.

Механическая выборка. Как и в простой выборке пользователям присваивается порядковый номер. Только отбор происходит не с помощью генератора случайных чисел, а с шагом равным n. Например, каждый сотый.

Стратифицированная выборка. Для такой выборки нужно поделить генеральную совокупность на сегменты или страты. После чего респонденты внутри каждой группы отбираются случайным образом. Из каждого сегмента выделяют пользователей пропорционально их доле в генеральной совокупности.

Кластерный отбор или гнездовая выборка. Группа потенциальных респондентов отбирается случайным образом из всей генеральной совокупности. Далее внутри этой группы опрашиваются все пользователи. Например, можно опросить всех пользователей, которые зарегистрировались в сервисе в прошлом квартале.

При таком отборе риск искажений выше и важно учитывать внешние и внутренние факторы. Может быть в прошлом квартале в жизни пользователей произошло что-то важное, что повлияло на их желание воспользоваться сервисом. Тогда эта группа будет сильно отличаться от генеральной совокупности.

Неслучайные выборки

Обычно такие методы отбора применяют, если нет возможности или ресурсов для формирования случайной выборки. Например, у тебя мало времени на опрос или нет данных о генеральной совокупности или респонденты труднодоступны.

Квотная выборка. Такой метод можно применять, если у вас есть знания о составе генеральной совокупности. Например, вы знаете, как ваши пользователи распределяются в разрезе по должности, отрасли компании, возрасту и так далее. Тогда можно пропорционально этим долям сформировать выборку: в каждом разрезе выбрать такое число респондентов, которое будет отображать статистику по всей аудитории.

Стихийная выборка. Это метод без особых правил. В опрос попадают все, кто захочет пройти опрос. Такая выборка типична для онлайн-опросов, размещенных в свободном доступе.

«Снежный ком». Тоже достаточно популярная и простая методика. Каждого респондента просят порекомендовать нового среди его друзей, коллег и знакомых, которые подходили бы под параметры исследования. Такая выборка часто применяется когда самостоятельно найти интересующих респондентов затруднительно. Например, пользователи, занимающие высокую должность или с высоким доходом.

«Типичный представитель». Из генеральной совокупности отбираются респонденты с типичными признаками целевой аудитории. Только определить, что взять за такой признак, обычно сложно.

Отдельно стоит сказать про многоступенчатые выборки. На практике чаще всего (иногда интуитивно) исследователи используют как раз многоступенчатый метод. Такой отбор предполагает наличие двух или более этапов формирования выборки. Проще говоря, это микс нескольких методов отбора.

Например, ты собрал статистику по своей аудитории и знаешь, что большинство пользователей находятся в Москве. Это будет первая ступень отбора по «типичному представителю». Далее среди пользователей-москвичей ты приглашаешь на опрос каждого сотого (механическая выборка).

Проводя количественное исследование, не забывай о репрезентативности и продумывай подходящий метод отбора респондентов. Хорошая подготовка — половина успеха.

Источник

РЕПРЕЗЕНТАТИВНОСТЬ ДАННЫХ

Смотреть что такое «РЕПРЕЗЕНТАТИВНОСТЬ ДАННЫХ» в других словарях:

репрезентативность — в прямом смысле способность дать представление; термин свойственен статистике. Репрезентативность статистических объектов (предметов, изучаемых статистическим методом см. статистика) способность данных предметов, намеченных для выборочного… … Справочный коммерческий словарь

РЕПРЕЗЕНТАТИВНОСТЬ — (от франц. representatif представительный) представительность, показательность выборки по отношению ко всей совокупности данных, из которых была сделана выборка (в статистике, метеорологии); в социологии репрезентативность достигается с помощью… … Профессиональное образование. Словарь

репрезентативность участка — 3.1.13 репрезентативность участка: Степень представительности наблюдательного участка, обеспечивающая соответствие данного места наблюдений предъявляемым требованиям и получение сравнимых между собой данных, которые могут быть использованы для… … Словарь-справочник терминов нормативно-технической документации

Репрезентативность — (от франц. représentatif представляющий собой что либо, показательный) в статистике, главное свойство выборочной совокупности, состоящее в близости её характеристик (состава, средних величин и др.) к соответствующим характеристикам… … Большая советская энциклопедия

РЕПРЕЗЕНТАТИВНОСТЬ — – 1) свойство выборочной совокупности представлять характеристики генеральной совокупности; означает, что с некоторой наперед заданной или определенной статистически погрешностью можно считать, что представленное в выборочной совокупности… … Современный образовательный процесс: основные понятия и термины

Репрезентативность — свойство выборочной совокупности воспроизводить характеристики генеральной совокупности. Другими словами, Р. выборки означает, что с некоторой погрешностью можно отождествить установленное на выборочной совокупности распределение изучаемых… … Социологический справочник

Опрос почтовый — разновидность опроса анкетного. При О. п. анкета распространяется среди потенциальных респондентов с помощью почтовой службы как самостоятельное почтовое отправление по специально отобранным адресам тех диц, которые в совокупности, по мнению… … Социологический справочник

Опрос прессовый — разновидность опроса анкетного. При О. п. анкета публикуется на страницах газет, журналов и возможность ее заполнения и возврата исследователям ограничена только совокупностью читателей соответствующего периодического издания, причем той ее… … Социологический справочник

КИЭР — (Kiaei) Андерс Николай (1838 1919) норв. статистик. С 1867 возглавлял Статистич. бюро Мин ва внутр. дел в 1877 1913 директор Центр. бюро статистики Норвегии. По поручению Междунар. статистич. ин та разрабатывал проекты переписей нас. для стран… … Демографический энциклопедический словарь

РД 52.10.728-2010: Основные требования к компетентности лабораторий при проведении мониторинга состояния и загрязнения морской среды — Терминология РД 52.10.728 2010: Основные требования к компетентности лабораторий при проведении мониторинга состояния и загрязнения морской среды: 1.1.9 государственная наблюдательная сеть: Наблюдательная сеть федерального органа исполнительной… … Словарь-справочник терминов нормативно-технической документации

Источник

Репрезентативность выборки и данных

Что понимается под репрезентативностью получаемых данных. Смотреть фото Что понимается под репрезентативностью получаемых данных. Смотреть картинку Что понимается под репрезентативностью получаемых данных. Картинка про Что понимается под репрезентативностью получаемых данных. Фото Что понимается под репрезентативностью получаемых данных Что понимается под репрезентативностью получаемых данных. Смотреть фото Что понимается под репрезентативностью получаемых данных. Смотреть картинку Что понимается под репрезентативностью получаемых данных. Картинка про Что понимается под репрезентативностью получаемых данных. Фото Что понимается под репрезентативностью получаемых данных Что понимается под репрезентативностью получаемых данных. Смотреть фото Что понимается под репрезентативностью получаемых данных. Смотреть картинку Что понимается под репрезентативностью получаемых данных. Картинка про Что понимается под репрезентативностью получаемых данных. Фото Что понимается под репрезентативностью получаемых данных Что понимается под репрезентативностью получаемых данных. Смотреть фото Что понимается под репрезентативностью получаемых данных. Смотреть картинку Что понимается под репрезентативностью получаемых данных. Картинка про Что понимается под репрезентативностью получаемых данных. Фото Что понимается под репрезентативностью получаемых данных

Что понимается под репрезентативностью получаемых данных. Смотреть фото Что понимается под репрезентативностью получаемых данных. Смотреть картинку Что понимается под репрезентативностью получаемых данных. Картинка про Что понимается под репрезентативностью получаемых данных. Фото Что понимается под репрезентативностью получаемых данных

Репрезентативность – это способность выборочной совокупности (то есть того множества объектов, которые исследуются на эмпирическом уровне) отражать свойства генеральной совокупности (того множества объектов, которое предполагается изучить).

Репрезентативности необходимо добиваться, когда по части объектов (по выборочной совокупности) необходимо судить обо всей их совокупности (о генеральной совокупности).

В качестве генеральной совокупности могут выступать население страны, города, вся аудитория канала массовой информации, все люди, относящиеся к определенной группе населения и т. п.

В рейтинговых исследованиях требования к репрезентативности неизбежны, поскольку на этой основе подсчитываются рекламные бюджеты, стоимость контактов с рекламой.

Представительности необходимо добиваться, когда выявляются показатели, средние по аудитории. Тогда в выборке должны быть представлены все группы населения. Важно понять, что состав опрошенных набирается в этих случаях не поровну – по принципу Ноева ковчега («каждой твари по паре»), а в соответствии с теми пропорциями, в которых эти группы находятся в составе населения. Этого можно добиваться, применяя разные виды выборки. Тот из них, который применяется при проведении рейтинговых исследований, называется случайная многоступенчатая стратифицированная территориальная выборка.

Если требуется выяснить, какая доля публикаций в газете отводится тем или иным темам, необходимо построить выборку таким образом, чтобы она отразила весь контент издания, вещательной программы, сайта. Это можно сделать, отбирая даты с помощью таблицы случайных чисел или конструируя искусственно недельную выборку путем случайного (по жребию) отбора выпусков каждого из дней недели.

Для исследований специальных (Ad Hoc) применяются как указанные выше, так и другие виды выборки. Они могут быть квотными – тогда формирование выборочной совокупности идет на основе имеющихся статистических данных по генеральной совокупности – стране, отдельным населенным пунктам, разным секторам занятости, возрасту и др. Такие выборки способны

давать достаточно высокий уровень репрезентативности.

Механический, или шаговый, отбор возможен тогда, когда имеется полный список элементов генеральной совокупности, например списки избирателей или жителей домов. Такой дизайн выборки особенно хорош для опросов в отдельных населенных пунктах. Имеет смысл применять его и при отборе

выпусков (номеров) издания, дат для отбора телепрограмм в контент-аналитическом исследовании.

Стратифицированная выборка годится при возможности разбить генеральную совокупность на страты (отдельные части по какому-либо признаку) и затем отобрать из них элементы выборочной совокупности в соответствии с пропорциями этих страт в генеральной совокупности.

Разнообразны так называемые гнездовые выборки, когда в состав респондентов (тех, кто отвечает на вопросы) включаются все, принадлежащие к данной группе: редакции, дому, предприятию, родственному клану и т. п.

Когда объекты эмпирического исследования труднодостижимы, пользуются методом снежного кома, особенно часто – в маркетологии. Если товар, услуга (в нашем случае – издание, канал) еще не вошли в массовое потребление, то приобретающих или пользующихся ими можно обнаружить по цепочке.

При небольшом множестве объектов прибегают к сплошному отбору. Например, в наше время редакционная почта не так велика, чтобы отбирать из нее часть для исследования поводов обращения в редакцию (а вот изучение откликов на сайтах изданий может потребовать выборки).

В исследованиях контента в Интернете могут возникать модификации известных видов выборки. Так, многоступенчатая выборка может быть применена для отбора сообщений на разных форумах редакции. Из их достаточно большого числа необходимо отобрать сначала крупные, а внутри них – более мелкие темы/направления/дреды, а внутри попавших в выборку единиц провести отбор отдельных сообщений или предпринять их сплошное изучение.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *