Что понимают под термином статистика в настоящее время
Основные понятия. В настоящее время термин “статистика” употребляется в различных значениях
В настоящее время термин “статистика” употребляется в различных значениях.
1. Статистика – синоним слова “данные”. Именно в этом смысле говорится о “статистике урожайности”, “статистике населения”, “статистике туристической деятельности” и т.д.
2. Статистика – практическая деятельность по сбору, накоплению, обработке и анализу цифровых данных, характеризующих различные стороны жизни современного общества.
3. Статистика – самостоятельная отрасль знаний, наука, разрабатывающая принципы и методы работы с числовыми данными, характеризующими массовые явления.
Статистика – это общественная наука, которая изучает с количественной стороны качественное содержание и закономерности развития массовых социально-экономических явлений и процессов в конкретных условиях места и времени.
Современная статистика представляет собой систему научных дисциплин: общая теория статистики, социальная и экономическая статистика, комплекс отраслевых статистик, математическая статистика и некоторые научные направления, созданные под влиянием развития интеграционных связей статистики с другими науками.
Общая теория статистики разрабатывает понятийный аппарат статистической науки, формулирует общие правила, принципы и методы статистического исследования массовых общественных явлений.
Социальная статистика изучает социально-демографические процессы: уровень жизни населения, показатели образования и здравоохранения и т.д., т.е. показатели, характеризующие жизнь человека в обществе.
Отраслевые статистики характеризуют показатели процесса производства в различных отраслях хозяйственной деятельности: статистика промышленности, сельского хозяйства, транспорта, финансов, туризма и т.д.
Математическая статистика – раздел математики, посвященный математическим методам систематизации, обработки и использования статистических данных для научных и практических выводов. Определение, сформулированное видными отечественными математиками А.Н. Колмогоровым и Ю.В. Прохоровым.
Предметом статистики являются количественные характеристики социально-экономических явлений, описывающие состояние и развитие жизни общества.
Наука статистика развивается по двум направлениям, образовав описательную статистику и статистику вывода. Основное различие между ними в том, что описательная статистика предоставляет отчеты лишь на основании наблюдений. Статистический вывод подразумевает заключение о целой совокупности на основании результатов исследования выборки, отобранной из этой совокупности.
Статистические методы используются в технике и медицине, спорте и экономике. Особенно широко статистика используется при изучении различных явлений в жизни человеческого общества.
Любой социально-экономический процесс может быть выражен в ряде чисел, подверженных случайным колебаниям.
Пример: рост или спад производства, ускорение или замедление темпов экономического роста, увеличение или снижение уровня реализации туристических путевок и тд.
Содержание статистического исследования заключается в анализе количественных показателей осуществления социально-экономических процессов и выявлении закономерностей, присущих тому или иному процессу.
Стадии статистических исследований:
· статистическое наблюдение, т.е. сбор первичных статистических данных;
· статистическая сводка и обработка первичного статистического материала;
· анализ полученных сводных показателей.
На первой стадии применяется метод массовых наблюдений. Это связано с тем, что статистические закономерности в соответствии с законом больших чисел проявляются только при изучении достаточно большого количества данных.
Сущность закона в том, что при изучении большого количества показателей индивидуальные значения отдельных показателей, являющиеся случайными, сглаживаются. И наоборот, отчетливо проявляется значение показателей, являющихся типичными для изучаемого явления или процесса.
На второй стадии решается задача систематизации собранного статистического материала. Используется метод статистических группировок. Данные, сходные между собой, объединяются в группы, а затем осуществляется подсчет показателей отдельно по каждой группе. Осуществляется переход от характеристики единичных показателей к сводным данным, характеризующим отдельные группы явления или все явление в целом.
Основной задачей третьей стадии статистического исследования является анализ статистического материала и выявление социально-экономических закономерностей. Рассчитываются абсолютные, относительные и средние величины. Сопоставление единичных и обобщающих показателей позволяет охарактеризовать развитие различных явлений в пространстве и времени.
Широкое распространение в статистике получили табличный метод и метод графического изображения данных.
Статистическая совокупность — это множество реально существующих материальных предметов, лиц, процессов или явлений, однородных по одному или нескольким объективно существующим признакам.
Пример: множество студентов университета обследуются на уровень материальных затрат на летний отдых.
Специфическим свойством статистических совокупностей является их массовость. Это объясняется тем, что типичный характер явлений и процессов, изучаемых статистикой, проявляется лишь при взаимодействии большого количества единиц совокупности.
Единицы статистической совокупности – первичные элементы, из которых складывается совокупность и которые выражают ее качественную определенность.
Пример: промышленные, торговые или транспортные предприятия, жители города, студенты университета и т.д.
Единицы статистической совокупности должны обладать рядом общих свойств или признаков.
Признаки (показатели) –свойства единиц совокупности, которые могут быть установлены, описаны словами или измерены в ходе их изучения.
Признаки в статистике могут быть количественными и качественными.
Количественные признаки (показатели) — это такие свойства изучаемых совокупностей, которые различаются их численными значениями.
Пример: размер предприятия, определенный численностью занятых, стоимостью основных производственных фондов, объемами выпускаемой продукции.
Качественными называются признаки (показатели), которые отражают черты не количественных, а содержательных различий.
Например: все население страны может быть разбито по качественному признаку — уровню образования: граждане имеющие высшее, профессионально-техническое, среднее, начальное образование и т.д.
Статистика
Статистика разрабатывает специальную методологию исследования и обработки материалов: массовые статистические наблюдения, метод группировок, средних величин, индексов, балансовый метод, метод графических изображений и другие методы анализа статистических данных.
Содержание
Развитие представлений о статистике
Начало статистической практики относится примерно ко времени возникновения государства. Первой опубликованной статистической информацией можно считать глиняные таблички Шумерского царства (III — II тысячелетия до н. э.).
В XX веке статистику часто рассматривают прежде всего как самостоятельную научную дисциплину. Статистика есть совокупность методов и принципов, согласно которым проводится сбор, анализ, сравнение, представление и интерпретация числовых данных. В 1954 г. академик АН УССР Б. В. Гнеденко дал следующее определение: «Статистика состоит из трёх разделов:
Термин «статистика» употребляют ещё в двух смыслах. Во-первых, в обиходе под «статистикой» часто понимают набор количественных данных о каком-либо явлении или процессе. Во-вторых, статистикой называют функцию от результатов наблюдений, используемую для оценки характеристик и параметров распределений и проверки гипотез.
Краткая история статистических методов
Типовые примеры раннего этапа применения статистических методов описаны в Библии, в Ветхом Завете. Там, в частности, приводится число воинов в различных племенах. С математической точки зрения дело сводилось к подсчёту числа попаданий значений наблюдаемых признаков в определённые градации.
Сразу после возникновения теории вероятностей (Паскаль, Ферма, XVII век) вероятностные модели стали использоваться при обработке статистических данных. Например, изучалась частота рождения мальчиков и девочек, было установлено отличие вероятности рождения мальчика от 0.5, анализировались причины того, что в парижских приютах эта вероятность не та, что в самом Париже, и т. д.
Первая треть ХХ века прошла под знаком параметрической статистики. Изучались методы, основанные на анализе данных из параметрических семейств распределений, описываемых кривыми семейства Пирсона. Наиболее популярным было нормальное распределение. Для проверки гипотез использовались критерии Пирсона, Стьюдента, Фишера. Были предложены метод максимального правдоподобия, дисперсионный анализ, сформулированы основные идеи планирования эксперимента.
Разработанную в первой трети ХХ века теорию анализа данных называют параметрической статистикой, поскольку её основной объект изучения — это выборки из распределений, описываемых одним или небольшим числом параметров. Наиболее общим является семейство кривых Пирсона, задаваемых четырьмя параметрами. Как правило, нельзя указать каких-либо веских причин, по которым распределение результатов конкретных наблюдений должно входить в то или иное параметрическое семейство. Исключения хорошо известны: если вероятностная модель предусматривает суммирование независимых случайных величин, то сумму естественно описывать нормальным распределением; если же в модели рассматривается произведение таких величин, то итог, видимо, приближается логарифмически нормальным распределением и так далее.
Статистические методы
Статисти́ческие ме́тоды — методы анализа статистических данных. Выделяют методы прикладной статистики, которые могут применяться во всех областях научных исследований и любых отраслях народного хозяйства, и другие статистические методы, применимость которых ограничена той или иной сферой. Имеются в виду такие методы, как статистический приемочный контроль, статистическое регулирование технологических процессов, надёжность и испытания, планирование экспериментов.
Классификация статистических методов
Статистические методы анализа данных применяются практически во всех областях деятельности человека. Их используют всегда, когда необходимо получить и обосновать какие-либо суждения о группе (объектов или субъектов) с некоторой внутренней неоднородностью.
Целесообразно выделить три вида научной и прикладной деятельности в области статистических методов анализа данных (по степени специфичности методов, сопряженной с погруженностью в конкретные проблемы):
а) разработка и исследование методов общего назначения, без учёта специфики области применения;
б) разработка и исследование статистических моделей реальных явлений и процессов в соответствии с потребностями той или иной области деятельности;
в) применение статистических методов и моделей для статистического анализа конкретных данных.
Прикладная статистика
Прикладная статистика — это наука о том, как обрабатывать данные произвольной природы. Математической основой прикладной статистики и статистических методов анализа является теория вероятностей и математическая статистика.
Описание вида данных и механизма их порождения — начало любого статистического исследования. Для описания данных применяют как детерминированные, так и вероятностные методы. С помощью детерминированных методов можно проанализировать только те данные, которые имеются в распоряжении исследователя. Например, с их помощью получены таблицы, рассчитанные органами официальной государственной статистики на основе представленных предприятиями и организациями статистических отчетов. Перенести полученные результаты на более широкую совокупность, использовать их для предсказания и управления можно лишь на основе вероятностно-статистического моделирования. Поэтому в математическую статистику часто включают лишь методы, опирающиеся на теорию вероятностей.
В простейшей ситуации статистические данные — это значения некоторого признака, свойственного изучаемым объектам. Значения могут быть количественными или представлять собой указание на категорию, к которой можно отнести объект. Во втором случае говорят о качественном признаке.
При измерении по нескольким количественным или качественным признакам в качестве статистических данных об объекте получаем вектор. Его можно рассматривать как новый вид данных. В таком случае выборка состоит из набора векторов. Есть часть координат — числа, а часть — качественные (категоризованные) данные, то говорим о векторе разнотипных данных.
Одним элементом выборки, то есть одним измерением, может быть и функция в целом. Например, описывающая динамику показателя, то есть его изменение во времени, — электрокардиограмма больного или амплитуда биений вала двигателя. Или временной ряд, описывающий динамику показателей определенной фирмы. Тогда выборка состоит из набора функций.
Элементами выборки могут быть и иные математические объекты. Например, бинарные отношения. Так, при опросах экспертов часто используют упорядочения (ранжировки) объектов экспертизы — образцов продукции, инвестиционных проектов, вариантов управленческих решений. В зависимости от регламента экспертного исследования элементами выборки могут быть различные виды бинарных отношений (упорядочения, разбиения, толерантности), множества, нечёткие множества и т. д.
Итак, математическая природа элементов выборки в различных задачах прикладной статистики может быть самой разной. Однако можно выделить два класса статистических данных — числовые и нечисловые. Соответственно прикладная статистика разбивается на две части — числовую статистику и нечисловую статистику.
Числовые статистические данные — это числа, вектора, функции. Их можно складывать, умножать на коэффициенты. Поэтому в числовой статистике большое значение имеют разнообразные суммы. Математический аппарат анализа сумм случайных элементов выборки — это (классические) законы больших чисел и центральные предельные теоремы.
Нечисловые статистические данные — это категоризованные данные, вектора разнотипных признаков, бинарные отношения, множества, нечёткие множества и др. Их нельзя складывать и умножать на коэффициенты. Поэтому не имеет смысла говорить о суммах нечисловых статистических данных. Они являются элементами нечисловых математических пространств (множеств). Математический аппарат анализа нечисловых статистических данных основан на использовании расстояний между элементами (а также мер близости, показателей различия) в таких пространствах. С помощью расстояний определяются эмпирические и теоретические средние, доказываются законы больших чисел, строятся непараметрические оценки плотности распределения вероятностей, решаются задачи диагностики и кластерного анализа, и т. д. (см. [2]).
В прикладных исследованиях используют статистические данные различных видов. Это связано, в частности, со способами их получения. Например, если испытания некоторых технических устройств продолжаются до определённого момента времени, то получаем так называемые цензурированные данные, состоящие из набора чисел — продолжительности работы ряда устройств до отказа, и информации о том, что остальные устройства продолжали работать в момент окончания испытания. Цензурированные данные часто используются при оценке и контроле надежности технических устройств.
Статистический анализ конкретных данных
Применение статистических методов и моделей для статистического анализа конкретных данных тесно привязано к проблемам соответствующей области. Результаты третьего из выделенных видов научной и прикладной деятельности находятся на стыке дисциплин. Их можно рассматривать как примеры практического применения статистических методов. Но не меньше оснований относить их к соответствующей области деятельности человека.
Перспективы развития
Теория статистических методов нацелена на решение реальных задач. Поэтому в ней постоянно возникают новые постановки математических задач анализа статистических данных, развиваются и обосновываются новые методы. Обоснование часто проводится математическими средствами, то есть путем доказательства теорем. Большую роль играет методологическая составляющая — как именно ставить задачи, какие предположения принять с целью дальнейшего математического изучения. Велика роль современных информационных технологий, в частности, компьютерного эксперимента.
Актуальной является задача анализа истории статистических методов с целью выявления тенденций развития и применения их для прогнозирования.
Вычислительная статистика
Развитие вычислительной техники во второй половине XX века оказало значительное влияние на статистику. Ранее статистические модели были представлены преимущественно линейными моделями. Увеличение быстродействия ЭВМ и разработка соответствующих численных алгоритмов послужило причиной повышенного интереса к нелинейным моделям таким, как искусственные нейронные сети, и привело к разработке сложных статистических моделей, например обобщённая линейная модель и иерархическая модель.
Получили широкое распространение вычислительные методы, основанные на повторной выборке как критерий перестановок и бутстреппинг, наряду методы как семплирование по Гиббсу позволили более доступно использовать байесовские алгоритмы. В настоящее время существует разнообразное статистическое программное обеспечение общего и специализированного назначения.
Некорректная интерпретация статистических исследований
Крылатая фраза
«Существуют три вида обмана: ложь, наглая ложь и статистика», англ. There are three kinds of lies: lies, damned lies, and statistics ) — высказывание, приписываемое премьер-министру Великобритании Бенджамину Дизраэли, а известность оно получило благодаря Марку Твену после публикации «Главы моей автобиографии» в журнале North American Review 5 июля 1907 года [15] : «Цифры обманчивы, — писал он, — я убедился в этом на собственном опыте; по этому поводу справедливо высказался Дизраэли: „Существует три вида лжи: ложь, наглая ложь и статистика“». Однако этой фразы нет в работах Дизраэли. Также она не была известна ни при его жизни, ни вскоре после смерти.
См. также
Примечания
Литература
Ссылки
Описательная статистика |
| ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Статистический вывод и проверка гипотез |
| ||||||||||||
Корреляция | Коэффициент корреляции Пирсона · Ранг корреляций (Коэффициент Спирмана для ранга корреляций, Коэффициент тау Кендалла для ранга корреляций) · Переменная смешивания | ||||||||||||
Линейные модели | Основная линейная модель · Обобщённая линейная модель · Анализ вариаций · Ковариационный анализ | ||||||||||||
Регрессия | Линейная · Нелинейная · Непараметрическая регрессия · Полупараметрическая регрессия · Логистическая регрессия |
Полезное
Смотреть что такое «Статистика» в других словарях:
СТАТИСТИКА — СТАТИСТИКА. 1. Краткая история, предмет и основные понятия общей статистики. Предметом С. являет ся изучение совокупностей внутренне связанных хотя и внешне обособленных элементов. Внутренняя закономерность последних находит свое проявление… … Большая медицинская энциклопедия
СТАТИСТИКА — самая точная из всех лженаук. Джин Ко Статистика может доказать что угодно, даже правду. Ноэл Мойнихан Статистика есть наука о том, как, не умея мыслить и понимать, заставить делать это цифры. Василий Ключевский Статистика все равно что купальник … Сводная энциклопедия афоризмов
СТАТИСТИКА — (греч. statizein доказывать). Наука, имеющая целью показание нравственных и материальных сил народа, состояние его в данную пору, источники и размеры земледельческого и промышленного производств и т. п., на основании цифровых данных. Словарь… … Словарь иностранных слов русского языка
СТАТИСТИКА — СТАТИСТИКА, статистики, мн. нет, жен. (от англ. statistics, букв. сведения о государстве, с лат.). 1. Наука, изучающая количественные изменения в развитии человеческого общества и народного хозяйства. Промышленная статистика. Статистика… … Толковый словарь Ушакова
Статистика — (немецкое Statistik, от итальянского stato государство), 1) собирание, обработка, анализ и публикация количественной информации о различных сферах жизни общества (экономика, культура, мораль и др.). 2) Отрасль знаний, в которой излагаются общие… … Иллюстрированный энциклопедический словарь
СТАТИСТИКА — (нем. Statistik от итал. stato государство),1) вид практической деятельности, направленной на собирание, обработку, анализ и публикацию статистической информации, характеризующей количественные закономерности жизни общества во всем ее… … Большой Энциклопедический словарь
Статистика — по страницамСтатей1843Страниц (Все страницы в вики, включая страницы обсуждения, перенаправления и прочее.)15 540Загружено файлов153Статистика правокЧисло правок с момента установки Народной бухгалтерской энциклопедии94 902Среднее число правок на … Бухгалтерская энциклопедия
Статистика — (statistics) 1. Одно из направлений математики, связанное со сбором, классификацией и представлением информации в числовом виде. Статистика базируется на том предположении, что если группа достаточно велика, то ее поведение, в отличие от… … Словарь бизнес-терминов
СТАТИСТИКА — СТАТИСТИКА, наука о сборе и классификации цифровых данных. Статистика может быть описательной (суммирующей полученные данные) или дедуктивной (основанной на выводимых логическим путем заключениях о некоем количестве сведений, о котором судят на… … Научно-технический энциклопедический словарь
СТАТИСТИКА — (от лат. status – состояние) наука, изучающая количественные показатели развития общественного производства и общества, их соотношения и изменения в сфере хозяйственной, государственной и социальной жизни, а также в области биологии, физики и т.… … Философская энциклопедия
Статистика — наука, изучающая количественную сторону массовых явлений. По английски: Statistics См. также: Математика Статистические данные Финансовый словарь Финам … Финансовый словарь