Случайными величинами (данными) называют такие величины, которые в ходе наблюдений или испытаний могут принимать различные значения. Можно говорить о том, что их значения зависят от случая.
Конспект урока "Статистическая вероятность"
Сегодня на уроке мы вспомним, что называют вероятностью события. Введём понятие относительной частоты события. Узнаем, что называют статистической вероятностью. Прежде чем приступить к рассмотрению новой темы, давайте вспомним, что вероятностью события
в опыте с равновозможными элементарными исходами называется отношение числа исходов, благоприятствующих событию
, к числу всех исходов.
Если – число всех исходов,
– число исходов, благоприятствующих событию
, то вероятность события
определяется формулой
, где
.
Приведённое определение вероятности называется классическим определением вероятности. Оно применяется, когда теоретически удаётся выявить все элементарные равновозможные исходы испытания и определить благоприятствующие исследуемому событию исходы. При этом число элементарных исходов испытания конечно и выражается конкретным числом.
На практике часто встречаются испытания, число возможных исходов которых очень велико. А в ряде случаев до проведения реальных испытаний сложно или даже невозможно установить равновозможность исходов испытания. Так, например, не подбросив кнопку многократно, трудно представить, равновозможны ли её падения «на плоскость» и «на остриё». Поэтому наряду с классическим определением вероятности на практике используется статистическое определение вероятности. Прежде чем ним познакомиться, давайте введём понятие относительной частоты.
Итак, относительной частотой события в данной серии испытаний называют отношение числа испытаний
, в которых это событие произошло, к числу всех проведённых испытаний
. При этом число
называют частотой события
.
Относительную частоту события обозначают
. Поэтому по определению имеет место формула
.
Давайте решим задачу. Профессиональный стрелок произвёл 100 выстрелов по мишени и попал 83 раза. Какова относительная частота попадания по мишени в данной серии выстрелов?
Решение. Пусть событие – попадание по мишени. Это событие произошло в 83 случаях, то есть
. Общее число выстрелов равно 100, то есть
.
Тогда воспользуемся формулой . Подставим известные из условия задачи значения
и
.
Проводя реальное испытание с подбрасыванием монеты и наблюдая за относительной частотой появления, например, орла в каждой серии испытаний, можно заметить следующий факт: чем больше проводится испытаний, тем всё меньше относительная частота появления орла отличается от . Значение вероятности этого события в классическом понимании равна
. Данный факт подтверждает и дошедшие до нас исторические сведения.
Известно, что Жорж Луи Леклерк де Бюффон – французский натуралист, биолог, математик, естествоиспытатель и писатель в XVIII веке провёл испытаний с подбрасыванием монеты. В результате этого он наблюдал выпадение орла
раз. Таким образом, Бюффон получил относительную частоту появления орла, равную
, что приближённо равно
.
Карл Пирсон – английский математик, статистик, биолог и философ в начале XX века с помощью своих учеников провёл аналогичных испытаний и наблюдал
появлений орла. Таким образом, Пирсон получил относительную частоту появления орла равную
, что приближённо равно
.
Получается, что в каждом случае значения относительной частоты события колеблются около .
Сформулируем определение. Статистической вероятностью называют число, около которого колеблется относительная частота события при большом числе испытаний.
Таково статистическое определение вероятности.
Отметим, что классическую вероятность вычисляют математическими методами, а статистическую в основном определяют экспериментально. Различные исследования с большим числом однотипных испытаний проводили учёные в разные годы.
Якоб Бернулли – швейцарский математик, один из основателей теории вероятностей и математического анализа. Наблюдая за уменьшением амплитуды колебания относительных частот события около некоторого числа при увеличении количества испытаний, обосновал закон больших чисел: можно считать достоверным тот факт, что при любой достаточно большой серии испытаний относительная частота события стремится к некоторому числу – вероятности этого события.
Таким образом, .
Давайте ещё одним примером проиллюстрируем только что сформулированный закон больших чисел. Начертим параллельные линии, расстояния между которыми равны длине некоторой иглы. Эта игла 100 раз бросается на расчерченный лист.
Сейчас вы видите таблицу, в первом столбце которой записано число бросаний иглы.
Случаи пересечения с любой из линий подсчитываются во втором столбце таблицы. Относительная частота события в серии из испытаний, подсчитанная с точностью до десятитысячных, записана в третьем столбце таблицы.
Из таблицы видно, что значения относительной частоты близки друг к другу.
Вообще, по результатам 100 бросков было замечено, что значения дроби колеблются около числа
, а это примерно равно
.
При увеличении числа испытаний было установлено, что относительная частота этого события близка к числу, чуть меньшему, чем . Бюффон доказал, что вероятность этого события равна
.
А сейчас давайте выполним несколько заданий.
Задание первое. В партии из 100 деталей отдел технического контроля обнаружил 5 нестандартных деталей. Чему равна относительная частота появления нестандартных деталей?
Решение.
Задание второе. Заполните последний столбец таблицы.
Решение.
Задание третье. По некоторому объекту из данного орудия при одинаковых условиях проведено 6 серий выстрелов:
в 1-й серии было 5 выстрелов, число попаданий 2;
во 2-й серии было 10 выстрелов, число попаданий 6;
в 3-й серии было 12 выстрелов, число попаданий 6;
в 4-й серии было 50 выстрелов, число попаданий 27;
в 5-й серии было 100 выстрелов, число попаданий 49;
в 6-й серии было 200 выстрелов, число попаданий 102.
Выясните, чему равна относительная частота попадания в каждой серии?
Решение.
Отметим, что из наблюдений различных явлений следует, что если число испытаний в каждой серии практически невелико, то относительные частоты появления события в каждой серии могут существенно отличаться одна от другой. Если же число опытов в сериях велико, то, как правило, относительные частоты появления события
в различных сериях отличаются друг от друга мало и это отличие тем меньше, чем больше испытаний в сериях.
Говорят, что относительная частота при большом числе испытаний всё более перестаёт носить случайный характер.
Посмотрите в третьем задании на три последние серии выстрелов. С увеличением числа выстрелов в серии относительные частоты появления события всё меньше отличаются друг от друга.
Статистика занимается сбором, представлением (в виде таблиц, диаграмм, графиков и др.) и анализом информации о различных случайных величинах.
Случайными величинами (данными) называют такие величины, которые в ходе наблюдений или испытаний могут принимать различные значения. Можно говорить о том, что их значения зависят от случая.
Значения переменных, которые регистрируются с помощью чисел, имеющих содержательный смысл, называют количественными данными .
В зависимости от того, какие значения может потенциально принимать переменная, выделяют два типа количественных данных:
дискретные и непрерывные.
Если два варианта признака в данной совокупности могут отличаться один от другого не менее чем на определённое число или вообще совпадают, то такие данные называют дискретными .
Число учеников в классах школы; количество баллов, которые набирает ученик при тестировании; число детей в семье; число вызовов «скорой помощи», поступающих в больницу; число отказов изделия; число клиентов, обратившихся в фирму за определённый промежуток времени и т. п.
Если случайная величина может принимать любое значение из некоторого промежутка, то такая величина называется непрерывной .
Процент учеников, которые имеют достаточный уровень подготовки по предмету в разных классах; время, за которое ученики пробежали 60 м на соревнованиях; продолжительность работы электронных ламп; температура воздуха, рост взрослого человека (например от 140 до 230 см) , фактическая масса буханки хлеба (например от 750 до 830 г) , дальность полёта снаряда, урожайность культуры, выращенной в хозяйстве и т. п.
Есть данные, которые регистрируют определённое качество, которым обладает объект. Такие данные называют качественными .
Качественные данные бывают двух типов: порядковые, для которых существует имеющий содержательный смысл порядок, и номинальные, для которых нет содержательно интерпретируемого порядка.
Для удобства обработки данных измерения используют представление информации в виде таблицы, гистограммы или полигона.
Гистограмма частот — это фигура, состоящая из прямоугольников, опирающихся на интервалы группировки.
Полигон частот представляет собой ломаную, соединяющую точки, соответствующие срединным значениям интервалов группировки и частотам этих интервалов.
В частотной таблице отражена численность рабочих на различных заводах.
Пример:
численность рабочих | 20–39 | 40–59 | 60–79 | 80–99 | 100–119 |
число заводов | 5 | 9 | 7 | 6 | 7 |
Проиллюстрируем распределение этих данных с помощью гистограммы и полигона частот.
Гистограмма частот:
Полигон частот: