Статистическая совокупность состоит из материально существующих объектов (работники, предприятия, страны, регионы) и является, в свою очередь, объектом статистического исследования.

Единица совокупности – каждая конкретная единица статистической совокупности.

Качественная однородность – сходство всех единиц совокупности по какому-либо признаку и несходство по всем остальным.

В статистической совокупности отличия одной единицы совокупности от другой чаще имеют количественную природу. Количественные изменения значений признака разных единиц совокупности называются вариацией.

Вариация признака – количественное изменение признака (для количественного признака) при переходе от одной единицы совокупности к другой.

Признак – это свойство, характерная черта или иная особенность единиц, объектов и явлений, которая может быть наблюдаема или измеряема. Признаки делятся на количественные и качественные. Многообразие и изменчивость величины признака у отдельных единиц совокупности называется вариацией.

Атрибутивные (качественные) признаки не поддаются числовому выражению (состав населения по полу). Количественные признаки имеют числовое выражение (состав населения по возрасту).

Показатель – это обобщающая количественно-качественная характеристика какого-либо свойства единиц или совокупности в целом в конкретных условиях времени и места.

Генеральная совокупность и выборка из нее. Основу статистического исследования составляет множество данных, полученных в результате измерения одного или нескольких признаков. Реально наблюдаемая совокупность объектов, статистически представленная рядом наблюдений …, случайной величины , является выборкой, а гипотетически существующая (домысливаемая) – генеральной совокупностью. Число наблюдений , образующих выборку, называется объемом выборки.

Основные способы организации выборки. Достоверность статистических выводов и содержательная интерпретация результатов зависит от репрезентативности выборки, т.е. полноты и адекватности представления свойств генеральной совокупности, по отношению к которой эту выборку можно считать представительной. Изучение статистических свойств совокупности можно организовать двумя способами: с помощью сплошного и несплошного наблюдения. Сплошное наблюдение предусматривает обследование всех единиц изучаемой совокупности, а несплошное (выборочное) наблюдение – только его части.

По методу отбора различают повторную и бесповторную выборку.

Так как выборочная совокупность отлична от генеральной, то возникают ошибки выборки.

При любом статистическом наблюдении (сплошном и выборочном) могут встретиться ошибки двух видов: регистрации и репрезентативности. Ошибки регистрации могут иметь случайный и систематический характер.

Случайные ошибки складываются из множества различных неконтролируемых причин, носят непреднамеренный характер и обычно по совокупности уравновешивают друг друга (например, изменения показателей прибора при температурных колебаниях в помещении).

Ошибки репрезентативности присущи только выборочному наблюдению, их невозможно избежать и они возникают в результате того, что выборочная совокупность не полностью воспроизводит генеральную. Значения показателей, получаемых по выборке, отличаются от показателей этих же величин в генеральной совокупности (или получаемых при сплошном наблюдении).

Ошибка выборочного наблюдения есть разность между значением параметра в генеральной совокупности и ее выборочным значением. Для среднего значения количественного признака , а для доли (альтернативного признака) .

Ошибки выборки свойственны только выборочным наблюдениям. Чем значительнее эти ошибки, тем больше эмпирическое распределение отличается от теоретического. Параметры эмпирического распределения и являются случайными величинами, следовательно, ошибки выборки также являются случайными величинами, могут принимать для разных выборок разные значения, и поэтому принято вычислять среднюю ошибку.

Средняя ошибка выборки есть величина , выражающая среднее квадратическое отклонение выборочной средней от математического ожидания. Эта величина при соблюдении принципа случайного отбора зависит прежде всего от объема выборки и от степени варьирования признака: чем больше и чем меньше вариация признака (следовательно, и значение ), тем меньше величина средней ошибки выборки . Соотношение между дисперсиями генеральной и выборочной совокупностей выражается формулой

,

т.е. при достаточно больших можно считать, что . Средняя ошибка выборки показывает возможные отклонения параметра выборочной совокупности от параметра генеральной. В табл. 3 приведены выражения для вычисления средней ошибки выборки при разных методах организации.

 

Таблица 3

Средняя ошибка выборки

 

Вид выборки

Отбор

повторный бесповторный

Количественный признак

Собственно-случайная
Типическая (стратифицированная)
Серийная

Альтернативный признак

Собственно-случайная
Типическая (стратифицированная)
Серийная

Задание 58. В одном из универмагов города с численностью работников 1000 человек было проведено 2%-ное выборочное обследование возраста работающих методом случайного бесповторного отбора.
В результате получены следующие данные.

 

Возраст, лет До 20 20–30 30–40 40–50 Св. 50
Число работников, чел. 5 22 15 10 4

 

С вероятностью 0,997 установите пределы, в которых находится средний возраст работников универмага.

Задание 59. С чулочной фабрики на базу поступило 2 тыс. коробок чулок, упакованных по 20 пар в каждой коробке. Для проверки качества чулок методом механического отбора проверено 50 коробок. В результате проверки установлено, что 80 % чулок первого сорта. Дисперсия серийной выборки равна 16. С вероятностью 0,954 необходимо установить пределы, в которых находится доля чулок первого сорта в генеральной совокупности.

Задание 60. Из поступившей в продовольственный магазин партии было отобрано 400 изделий, 80 % из них соответствовали первому сорту. Определите среднюю ошибку выборки и границы, в которых находится доля изделий первого сорта во всей партии, с вероятностью 0,954.

Задание 61. В порядке случайной повторной выборки из партии было взято 100 проб сахара. В результате исследования установлена средняя влажность сахара в 9 % выборки при среднем квадратическом отклонении 1,55. С вероятностью 0,954 установите пределы, в которых находится средняя влажность сахара в партии.

Задание 62. По договоренности с поставщиком партия готовых изделий должна иметь не менее 90 % изделий первого сорта. При обследовании 900 единиц изделия первого сорта составили 82 %. С вероятностью 0,954 определите, соответствует ли партия готовых изделий предъявляемым требованиям.

Задание 63. Из поступившей в магазин партии костюмов в порядке собственно-случайного бесповторного отбора было отобрано 200, из которых 5 костюмов оказались бракованными. Можно ли с вероятностью 0,954 полагать, что брак во всей партии не превышает 5 %, если выборка составляет двадцатую часть ее размера.

Задание 64. В продовольственный магазин поступило 1000 ящиков с овощными консервами. В 100 обследованных в порядке бесповторного отбора ящиках оказалась бракованная продукция.

 

% брака Число ящиков
1–2 50
2–3 25
3–4 8

 

Можно ли принять всю партию из 1000 ящиков при условии, что процент брака должен быть не больше 2,5 % с вероятностью 0,954?

 

Контрольные вопросы и задания

 

1. Дайте определение генеральной и выборочной совокупностей.

2. Вследствие чего образуются ошибки выборочного наблюдения?