Доверительный интервал для оценки среднего (дисперсия известна) в MS EXCEL. Математика и информатика. Учебное пособие по всему курсу

ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ ДЛЯ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ

1. Пусть известно, что сл. величина x подчиняется нормальному закону с неизвестным средним μ и известной σ 2: X~N(μ,σ 2 ), σ 2 задано, μ не известно. Задано β. По выборке x 1, x 2, … , x n надо построить I β (θ) (сейчас θ=μ), удовлетворяющий (13)

Выборочное среднее (говорят также выборочная средняя) подчиняется нормальному закону с тем же центром μ, но меньшей дисперсией X~N (μ , D ), где дисперсией D =σ 2 =σ 2 /n.

Нам понадобится число К β , определяемое для ξ~N(0,1) условием

Словами: между точками -К β и К β оси абсцисс лежит площадь под кривой плотности стандартного нормального закона, равная β

Например, К 0,90 =1,645 квантиль уровня 0,95 величины ξ

K 0,95 = 1,96. ; К 0,997 =3 .

В частности, отложив от центра любого нормального закона 1,96 стандартных отклонений вправо и столько же влево, мы захватим площадь под кривой плотности, равную 0.95, в силу чего К 0 95 является квантилью уровня 0,95 + 1/2*0,005 = 0,975 для этого за­кона.

Искомый доверительный интервал для генерального среднего μ есть I А (μ) = (х-σ, х+σ),

где δ = (15)

Дадим обоснование:

По сказанному, сл. величина в интервал J=μ±σ попадает с вероятностью β (рис.9). В этом случае величина отклоняется от центра μ меньше, чем на δ , и случайный интервал ± δ (со случайным центром и такой же как у J ширины) накроет точку μ. То есть Є J <=> μ Є I β , а потому Р{μЄІ β } = Р{ Є J }=β.

Итак, постоянный по выборке интервал I β содержит среднее μ с вероятностью β.

Ясно, чем больше n, тем меньше σ и уже интервал, а чем больше мы берем гарантию β, тем доверительный интервал шире.

Пример 21.

По выборке с n=16 для нормальной величины с известной дисперсией σ 2 =64 найдено х=200. Построить доверительный интервал для генерального среднего (иначе говоря, для математического ожидания) μ, приняв β=0,95.

Решение. I β (μ)= ± δ, где δ = К β σ/ -> К β σ/ =1.96*8/ = 4

I 0.95 (μ)=200 4=(196;204).

Делая вывод, что с гарантией β=0,95 истинное среднее принадлежат интервалу (196,204), мы понимаем, что возможна ошибка.

Из 100 доверительных интервалов I 0. 95 (μ) в среднем 5 не содержат μ.

Пример 22.

Каким в условиях предыдущего примера 21 следует взять n, чтобы вдвое сузить доверительный интервал? Чтобы иметь 2δ=4, надо взять

На практике часто пользуются односторонними доверительными интервалами. Так, если полезны или не страшны высокие значения μ, но не.приятны низкие, как в случае с прочностью или надежностью, то резонно строить односторонний интервал. Для этого следует максимально поднять его верхнюю границу. Если мы построим, как в примере 21, двусторонний доверительный интервал для заданного β, а затем максимально расширим его за счет одной из границ, то получим односторонний интервал с большей гарантией β" = β + (1-β) / 2 = (1+β)/2, например, если β = 0,90, то β = 0,90 + 0,10/2 = 0,95.

Например, будем считать, что речь идет о прочности изделия и поднимем верхнюю границу интервала до . Тогда для μ в примере 21 получим односторонний доверительный интервал (196,°°) с нижней границей 196 и доверительной вероятностью β"=0,95+0,05/2=0,975.

Практическим недостатком формулы (15)_является то, что она выведена в предположении, что дисперсия = σ 2 (отсюда и = σ 2 /n) известна; а это бывает в жизни редко. Исключение составляет случай, когда объем выборки велик, скажем, n измеряется сотнями или тысячами и тогда за σ 2 можно практически принять ее оценку s 2 или .

Пример 23.

Положим, в некотором большом городе в результате выборочного обследования жилищных условий жителей получена следу­ющая таблица данных (пример из работы ).

Таблица 8

Исходные данные к примеру

Естественно допустить, что сл. величина X - общая (полезная) площадь (в м 2), приходящаяся на одного человека подчиняется нор­мальному закону. Среднее μ и дисперсия σ 2 не известны. Для μ тре­буется построить 95%-ный доверительный интервал. Чтобы по группи­рованным данным найти выборочные средние и дисперсию, составим следующую таблицу выкладок (табл.9).

Таблица 9

Вычисления X и 5 по сгруппированным данным

N группы з Общая площадь в расчете на 1 человека, м 2 Число жителей в группе г j Середина интервала x j r j x j rjxj 2
До 5.0 2.5 20.0 50.0
5.0-10.0 7.5 712.5 5343.75
10.0-15.0 12.5 2550.0 31875.0
15.0-20.0 17.5 4725.0 82687.5
20.0-25.0 22.5 4725.0 106312.5
25.0-30.0 27.5 3575.0 98312.5
более 30.0 32.5 * 2697.5 87668.75
- 19005.0 412250.0

В этой вспомогательной таблице по формуле (2) подсчитаны первый и второй начальные статистические моменты а 1 и а 2

Хотя дисперсия σ 2 здесь неизвестна, из-за большого объема выборки можно практически применить формулу (15), положив в ней σ= =7.16.

Тогда δ=k 0.95 σ/ =1.96*7.16/ =0.46.

Доверительный интервал для генерального среднего при β=0,95 равен I 0.95 (μ) = ± δ = 19 ± 0.46 = (18.54; 19.46).

Следовательно, среднее значение площади на одного человека в данном городе с гарантией 0.95 лежит в промежутке (18.54; 19.46).



2. Доверительный интервал для математического ожидания μ в случае неизвестной дисперсии σ 2 нормальной величины. Этот интервал для заданной гарантии β строится по формуле ,где ν = n-1 ,

(16)

Коэффициент t β,ν имеет тот же смысл для t – распределения с ν степенями свободы, что к β для распределения N(0,1), а именно:

.

Другими словами, сл. Величина tν попадает в интервал (-t β,ν ; +t β,ν) с вероятностью β. Значения t β,ν даны в табл.10 для β=0.95 и β=0.99.

Таблица 10.

Значения t β,ν

Возвращаясь к примеру 23, видим, что в нем доверительный интервал был построен по формуле (16) с коэффициентом t β,υ =k 0..95 =1.96, т. к. n=1000.

В статистике существует два вида оценок: точечные и интервальные. Точечная оценка представляет собой отдельную выборочную статистику, которая используется для оценки параметра генеральной совокупности. Например, выборочное среднее - это точечная оценка математического ожидания генеральной совокупности, а выборочная дисперсия S 2 - точечная оценка дисперсии генеральной совокупности σ 2 . было показано, что выборочное среднее является несмещенной оценкой математического ожидания генеральной совокупности. Выборочное среднее называется несмещенным, поскольку среднее значение всех выборочных средних (при одном и том же объеме выборки n ) равно математическому ожиданию генеральной совокупности.

Для того чтобы выборочная дисперсия S 2 стала несмещенной оценкой дисперсии генеральной совокупности σ 2 , знаменатель выборочной дисперсии следует положить равным n – 1 , а не n . Иначе говоря, дисперсия генеральной совокупности является средним значением всевозможных выборочных дисперсий.

При оценке параметров генеральной совокупности следует иметь в виду, что выборочные статистики, такие как , зависят от конкретных выборок. Чтобы учесть этот факт, для получения интервальной оценки математического ожидания генеральной совокупности анализируют распределение выборочных средних (подробнее см. ). Построенный интервал характеризуется определенным доверительным уровнем, который представляет собой вероятность того, что истинный параметр генеральной совокупности оценен правильно. Аналогичные доверительные интервалы можно применять для оценки доли признака р и основной распределенной массы генеральной совокупности.

Скачать заметку в формате или , примеры в формате

Построение доверительного интервала для математического ожидания генеральной совокупности при известном стандартном отклонении

Построение доверительного интервала для доли признака в генеральной совокупности

В этом разделе понятие доверительного интервала распространяется на категорийные данные. Это позволяет оценить долю признака в генеральной совокупности р с помощью выборочной доли р S = Х/ n . Как указывалось , если величины n р и n (1 – р) превышают число 5, биномиальное распределение можно аппроксимировать нормальным. Следовательно, для оценки доли признака в генеральной совокупности р можно построить интервал, доверительный уровень которого равен (1 – α)х100% .


где p S - выборочная доля признака, равная Х/ n , т.е. количеству успехов, деленному на объем выборки, р - доля признака в генеральной совокупности, Z - критическое значение стандартизованного нормального распределения, n - объем выборки.

Пример 3. Предположим, что из информационной системы извлечена выборка, состоящая из 100 накладных, заполненных в течение последнего месяца. Допустим, что 10 из этих накладных составлены с ошибками. Таким образом, р = 10/100 = 0,1. Доверительному уровню 95% соответствует критическое значение Z = 1,96.

Таким образом, вероятность того, что от 4,12% до 15,88% накладных содержат ошибки, равна 95%.

Для заданного объема выборки доверительный интервал, содержащий долю признака в генеральной совокупности, кажется более широким, чем для непрерывной случайной величины. Это объясняется тем, что измерения непрерывной случайной величины содержат больше информации, чем измерения категорийных данных. Иначе говоря, категорийные данные, принимающие лишь два значения, содержат недостаточно информации для оценки параметров их распределения.

В ычисление оценок, извлеченных из конечной генеральной совокупности

Оценка математического ожидания. Поправочный коэффициент для конечной генеральной совокупности (fpc ) использовался для уменьшения стандартной ошибки в раз. При вычислении доверительных интервалов для оценок параметров генеральной совокупности поправочный коэффициент применяется в ситуациях, когда выборки извлекаются без возвращения. Таким образом, доверительный интервал для математического ожидания, имеющий доверительный уровень, равный (1 – α)х100% , вычисляется по формуле:

Пример 4. Чтобы проиллюстрировать применение поправочного коэффициента для конечной генеральной совокупности, вернемся к задаче о вычислении доверительного интервала для средней суммы накладных, рассмотренной выше в примере 3. Предположим, что за месяц в компании выписываются 5000 накладных, причем =110,27долл., S = 28,95 долл., N = 5000, n = 100, α = 0,05, t 99 = 1,9842. По формуле (6) получаем:

Оценка доли признака. При выборе без возвращения доверительный интервал для доли признака, имеющий доверительный уровень, равный (1 – α)х100% , вычисляется по формуле:

Доверительные интервалы и этические проблемы

При выборочном исследовании генеральной совокупности и формулировании статистических выводов часто возникают этические проблемы. Основная из них - как согласуются доверительные интервалы и точечные оценки выборочных статистик. Публикация точечных оценок без указания соответствующих доверительных интервалов (как правило, имеющих 95%-ный доверительный уровень) и объема выборки, на основе которых они получены, может породить недоразумения. Это может создать у пользователя впечатление, что точечная оценка - именно то, что ему необходимо, чтобы предсказать свойства всей генеральной совокупности. Таким образом, необходимо понимать, что в любых исследованиях во главу угла должны быть поставлены не точечные, а интервальные оценки. Кроме того, особое внимание следует уделять правильному выбору объемов выборки.

Чаще всего объектами статистических манипуляций становятся результаты социологических опросов населения по тем или иным политическим проблемам. При этом результаты опроса выносят на первые страницы газет, а ошибку выборочного исследования и методологию статистического анализа печатают где-нибудь в середине. Чтобы доказать обоснованность полученных точечных оценок, необходимо указывать объем выборки, на основе которой они получены, границы доверительного интервала и его уровень значимости.

Следующая заметка

Используются материалы книги Левин и др. Статистика для менеджеров. – М.: Вильямс, 2004. – с. 448–462

Центральная предельная теорема утверждает, что при достаточно большом объеме выборок выборочное распределение средних можно аппроксимировать нормальным распределением. Это свойство не зависит от вида распределения генеральной совокупности.

Пусть произведена выборка из генеральной совокупности, подчиненной закону нормального распределения X N(m ; ). Это основное предположение математической статистики основано на центральной предельной теореме. Пусть известно генеральное среднее квадратическое отклонение , но неизвестно математическое ожидание теоретического распределения m (среднее значение ).

В таком случае среднее выборочное , полученное в ходе эксперимента (п.3.4.2), также будет являться случайной величинойm ;
). Тогда «нормализованное» отклонение
N(0;1) – является стандартной нормальной случайной величиной.

Задача состоит в поиске интервальной оценки для m . Построим двусторонний доверительный интервал для m так, чтобы истинное математическое ожидание принадлежало ему с заданной вероятностью (надежностью) .

Установить такой интервал для величины
– это значит найти максимальное значение этой величины
и минимальное
, которые являются границам критической области:
.

Т.к. такая вероятность равна
, то корень этого уравнения
можно найти с помощью таблиц функции Лапласа (Таблица 3, приложение 1).

Тогда с вероятностью можно утверждать, что случайная величина
, то есть искомое генеральное среднее принадлежит интервалу
. (3.13)

Величину
(3.14)

называют точностью оценки.

Число
квантиль нормального распределения – можно найти как аргумент функции Лапласа (Таблица 3, приложение 1), учитывая соотношение 2Ф(u )= , т.е. Ф(u )=
.

Обратно, по заданному значению отклонения можно найти, с какой вероятностью, неизвестное генеральное среднее принадлежит интервалу
. Для этого нужно вычислить

. (3.15)

Пусть из генеральной совокупности извлечена случайная выборка методом повторного отбора. Из уравнения
можно найти минимальный объем повторной выборки n , необходимый для того, чтобы доверительный интервал с заданной надежностью не превышал наперед заданного значения. Оценку требуемого объема выборки производят по формуле:

. (3.16)

Исследуем точность оценки
:

1) При возрастании объема выборки n величина уменьшается , и значит, точность оценки увеличивается .

2) С увеличением надежности оценки увеличивается значение аргументаu (т.к. Ф (u ) монотонно возрастает) и значит увеличивается . В таком случае увеличение надежности уменьшает точность ее оценки .

Оценку
(3.17)

называют классической (где t - некий параметр, зависящий от и n ), т.к. она характеризует наиболее часто встречающиеся законы распределения.

3.5.3 Доверительные интервалы для оценки математического ожидания нормального распределения при неизвестном среднем квадратическом отклонении 

Пусть известно, что генеральная совокупность подчинена закону нормального распределения X N(m ;), где величина среднего квадратического отклонения неизвестна.

Для построения доверительного интервала оценки генерального среднего в этом случае используется статистика
, имеющая распределение Стъюдента с k = n –1 степенями свободы. Это следует из того, что N(0;1) (см. п.3.5.2), а
(см. п.3.5.3) и из определения распределения Стъюдента (ч.1.п.2.11.2).

Найдем точность классической оценки распределения Стъюдента: т.е. найдем t из формулы (3.17). Пусть вероятность выполнения неравенства
задана надежностью :

. (3.18)

Поскольку T St(n -1), очевидно, что t зависит от и n , поэтому обычно пишут
.

(3.19)

где
– функция распределения Стъюдента сn -1 степенями свободы.

Решая это уравнение относительно m , получим интервал
который с надежностью  покрывает неизвестный параметр m .

Величина t , n -1 , служащая для определения доверительного интервала случайной величины T (n -1), распределенной по Стъюденту с n -1 степенями свободы, называется коэффициентом Стъюдента . Его следует находить по заданным значениям n и  из таблиц «Критические точки распределения Стьюдента». (Таблица 6, приложение 1), которые и представляют собой решения уравнения (3.19).

В итоге получаем следующее выражение точности  доверительного интервала для оценки математического ожидания (генерального среднего), если неизвестна дисперсия:

(3.20)

Т.о., существует общая формула построения доверительных интервалов для математического ожидания генеральной совокупности:

где точность доверительного интервала в зависимости от известной или неизвестной дисперсии находится по формулам соответственно 3.16. и 3.20.

Задача 10. Проведены некоторые испытания, результаты которых занесены в таблицу:

x i

Известно, что они подчиняются закону нормального распределения с
. Найти оценкуm * для математического ожидания m , построить для него 90% доверительный интервал.

Решение:

Итак, m (2.53;5.47).

Задача 11. Глубина моря измеряется прибором, систематическая ошибка которого равна 0, а случайные ошибки распределяются по нормальному закону, со средним квадратическим отклонением =15м. Сколько надо сделать независимых измерений, чтобы определить глубину с ошибками не более 5м при доверительной вероятности 90%?

Решение:

По условию задачи имеем X N(m ; ), где =15м, =5м, =0.9. Найдем объем n .

1) С заданной надежностью = 0.9 найдем по таблицам 3 (Приложение 1) аргумент функции Лапласа u = 1.65.

2) Зная заданную точность оценки =u =5, найдем
. Имеем

. Поэтому число испытаний n 25.

Задача 12. Выборка температуры t за первые 6 дней января представлена в таблице:

Найти доверительный интервал для математического ожидания m генеральной совокупности с доверительной вероятностью
и оценить генеральное стандартное отклонение s .

Решение:


и
.

2) Несмещённую оценку найдем по формуле
:

=-175

=234.84

;
;

=-192

=116


.

3) Поскольку генеральная дисперсия неизвестна, но известна ее оценка, то для оценки математического ожидания m используем распределение Стъюдента (Таблица 6, приложение 1) и формулу (3.20).

Т.к. n 1 =n 2 =6, то ,
, s 1 =6.85 имеем:
, отсюда -29.2-4.1<m 1 < -29.2+4.1.

Поэтому -33.3<m 1 <-25.1.

Аналогично имеем,
, s 2 = 4.8, , поэтому

–34.9< m 2 < -29.1. Тогда доверительные интервалы примут вид: m 1 (-33.3;-25.1) и m 2 (-34.9;-29.1).

В прикладных науках, например, в строительных дисциплинах, для оценки точности объектов используются таблицы доверительных интервалов, которые приведены в соответствующей справочной литературе.

Построим в MS EXCEL доверительный интервал для оценки среднего значения распределения в случае известного значения дисперсии.

Разумеется, выбор уровня доверия полностью зависит от решаемой задачи. Так, степень доверия авиапассажира к надежности самолета, несомненно, должна быть выше степени доверия покупателя к надежности электрической лампочки.

Формулировка задачи

Предположим, что из генеральной совокупности имеющей взята выборка размера n. Предполагается, что стандартное отклонение этого распределения известно. Необходимо на основании этой выборки оценить неизвестное среднее значение распределения (μ, ) и построить соответствующий двухсторонний доверительный интервал .

Точечная оценка

Как известно из , статистика (обозначим ее Х ср ) является несмещенной оценкой среднего этой генеральной совокупности и имеет распределение N(μ;σ 2 /n).

Примечание : Что делать, если требуется построить доверительный интервал в случае распределения, которое не является нормальным? В этом случае на помощь приходит , которая гласит, что при достаточно большом размере выборки n из распределения не являющемся нормальным , выборочное распределение статистики Х ср будет приблизительно соответствовать нормальному распределению с параметрами N(μ;σ 2 /n).

Итак, точечная оценка среднего значения распределения у нас есть – это среднее значение выборки , т.е. Х ср . Теперь займемся доверительным интервалом.

Построение доверительного интервала

Обычно, зная распределение и его параметры, мы можем вычислить вероятность того, что случайная величина примет значение из заданного нами интервала. Сейчас поступим наоборот: найдем интервал, в который случайная величина попадет с заданной вероятностью. Например, из свойств нормального распределения известно, что с вероятностью 95%, случайная величина, распределенная по нормальному закону , попадет в интервал примерно +/- 2 от среднего значения (см. статью про ). Этот интервал, послужит нам прототипом для доверительного интервала .

Теперь разберемся,знаем ли мы распределение, чтобы вычислить этот интервал? Для ответа на вопрос мы должны указать форму распределения и его параметры.

Форму распределения мы знаем – это нормальное распределение (напомним, что речь идет о выборочном распределении статистики Х ср ).

Параметр μ нам неизвестен (его как раз нужно оценить с помощью доверительного интервала ), но у нас есть его оценка Х ср, вычисленная на основе выборки, которую можно использовать.

Второй параметр – стандартное отклонение выборочного среднего будем считать известным , он равен σ/√n.

Т.к. мы не знаем μ, то будем строить интервал +/- 2 стандартных отклонения не от среднего значения , а от известной его оценки Х ср . Т.е. при расчете доверительного интервала мы НЕ будем считать, что Х ср попадет в интервал +/- 2 стандартных отклонения от μ с вероятностью 95%, а будем считать, что интервал +/- 2 стандартных отклонения от Х ср с вероятностью 95% накроет μ – среднее генеральной совокупности, из которого взята выборка . Эти два утверждения эквивалентны, но второе утверждение нам позволяет построить доверительный интервал .

Кроме того, уточним интервал: случайная величина, распределенная по нормальному закону , с вероятностью 95% попадает в интервал +/- 1,960 стандартных отклонений, а не+/- 2 стандартных отклонения . Это можно рассчитать с помощью формулы =НОРМ.СТ.ОБР((1+0,95)/2) , см. файл примера Лист Интервал .

Теперь мы можем сформулировать вероятностное утверждение, которое послужит нам для формирования доверительного интервала :
«Вероятность того, что среднее генеральной совокупности находится от среднего выборки в пределах 1,960 «стандартных отклонений выборочного среднего» , равна 95%».

Значение вероятности, упомянутое в утверждении, имеет специальное название , который связан с уровнем значимости α (альфа) простым выражением уровень доверия =1 . В нашем случае уровень значимости α=1-0,95=0,05 .

Теперь на основе этого вероятностного утверждения запишем выражение для вычисления доверительного интервала :

где Z α/2 стандартного нормального распределения (такое значение случайной величины z , что P (z >=Z α/2 )=α/2 ).

Примечание : Верхний α/2-квантиль определяет ширину доверительного интервала в стандартных отклонениях выборочного среднего. Верхний α/2-квантиль стандартного нормального распределения всегда больше 0, что очень удобно.

В нашем случае при α=0,05, верхний α/2-квантиль равен 1,960. Для других уровней значимости α (10%; 1%) верхний α/2-квантиль Z α/2 можно вычислить с помощью формулы =НОРМ.СТ.ОБР(1-α/2) или, если известен уровень доверия , =НОРМ.СТ.ОБР((1+ур.доверия)/2) .

Обычно при построении доверительных интервалов для оценки среднего используют только верхний α /2-квантиль и не используют нижний α /2-квантиль . Это возможно потому, что стандартное нормальное распределение симметрично относительно оси х (плотность его распределения симметрична относительно среднего, т.е. 0 ). Поэтому, нет нужды вычислять нижний α/2-квантиль (его называют просто α/2-квантиль ), т.к. он равен верхнему α /2-квантилю со знаком минус.

Напомним, что, не смотря на форму распределения величины х, соответствующая случайная величина Х ср распределена приблизительно нормально N(μ;σ 2 /n) (см. статью про ). Следовательно, в общем случае, вышеуказанное выражение для доверительного интервала является лишь приближенным. Если величина х распределена по нормальному закону N(μ;σ 2 /n), то выражение для доверительного интервала является точным.

Расчет доверительного интервала в MS EXCEL

Решим задачу.
Время отклика электронного компонента на входной сигнал является важной характеристикой устройства. Инженер хочет построить доверительный интервал для среднего времени отклика при уровне доверия 95%. Из предыдущего опыта инженер знает, что стандартное отклонение время отклика составляет 8 мсек. Известно, что для оценки времени отклика инженер сделал 25 измерений, среднее значение составило 78 мсек.

Решение : Инженер хочет знать время отклика электронного устройства, но он понимает, что время отклика является не фиксированной, а случайной величиной, которая имеет свое распределение. Так что, лучшее, на что он может рассчитывать, это определить параметры и форму этого распределения.

К сожалению, из условия задачи форма распределения времени отклика нам не известна (оно не обязательно должно быть нормальным ). , этого распределения также неизвестно. Известно только его стандартное отклонение σ=8. Поэтому, пока мы не можем посчитать вероятности и построить доверительный интервал .

Однако, не смотря на то, что мы не знаем распределение времени отдельного отклика , мы знаем, что согласно ЦПТ , выборочное распределение среднего времени отклика является приблизительно нормальным (будем считать, что условия ЦПТ выполняются, т.к. размер выборки достаточно велик (n=25)).

Более того, среднее этого распределения равно среднему значению распределения единичного отклика, т.е. μ. А стандартное отклонение этого распределения (σ/√n) можно вычислить по формуле =8/КОРЕНЬ(25) .

Также известно, что инженером была получена точечная оценка параметра μ равная 78 мсек (Х ср). Поэтому, теперь мы можем вычислять вероятности, т.к. нам известна форма распределения (нормальное ) и его параметры (Х ср и σ/√n).

Инженер хочет знать математическое ожидание μ распределения времени отклика. Как было сказано выше, это μ равно математическому ожиданию выборочного распределения среднего времени отклика . Если мы воспользуемся нормальным распределением N(Х ср; σ/√n), то искомое μ будет находиться в интервале +/-2*σ/√n с вероятностью примерно 95%.

Уровень значимости равен 1-0,95=0,05.

Наконец, найдем левую и правую границу доверительного интервала .
Левая граница: =78-НОРМ.СТ.ОБР(1-0,05/2)*8/КОРЕНЬ(25)= 74,864
Правая граница: =78+НОРМ.СТ.ОБР(1-0,05/2)*8/КОРЕНЬ(25)=81,136

Левая граница: =НОРМ.ОБР(0,05/2; 78; 8/КОРЕНЬ(25))
Правая граница: =НОРМ.ОБР(1-0,05/2; 78; 8/КОРЕНЬ(25))

Ответ : доверительный интервал при уровне доверия 95% и σ =8 мсек равен 78+/-3,136 мсек.

В файле примера на листе Сигма известна создана форма для расчета и построения двухстороннего доверительного интервала для произвольных выборок с заданным σ и уровнем значимости .

Функция ДОВЕРИТ.НОРМ()

Если значения выборки находятся в диапазоне B20:B79 , а уровень значимости равен 0,05; то формула MS EXCEL:
=СРЗНАЧ(B20:B79)-ДОВЕРИТ.НОРМ(0,05;σ; СЧЁТ(B20:B79))
вернет левую границу доверительного интервала .

Эту же границу можно вычислить с помощью формулы:
=СРЗНАЧ(B20:B79)-НОРМ.СТ.ОБР(1-0,05/2)*σ/КОРЕНЬ(СЧЁТ(B20:B79))

Примечание : Функция ДОВЕРИТ.НОРМ() появилась в MS EXCEL 2010. В более ранних версиях MS EXCEL использовалась функция ДОВЕРИТ() .

Вы можете использовать данную форму поиска, чтобы найти нужную задачу. Вводите слово, фразу из задачи или ее номер, если он вам известен.


Искать только в данном разделе


Доверительные интервалы: список решений задач

Доверительные интервалы: теория и задачи

Общие сведения о доверительных интервалах

Введем кратко понятие доверительного интервала, который
1) оценивает некоторый параметр числовой выборки непосредственно по данным самой выборки,
2) накрывает значение этого параметра с вероятностью γ.

Доверительным интервалом для параметра X (при вероятности γ) называется интервал вида , такой что , а значения вычисляются некоторым образом по выборке .

Обычно в прикладных задачах доверительную вероятность берут равной γ = 0,9; 0,95; 0,99.

Рассмотрим некоторую выборку объема n, сделанную из генеральной совокупности, распределенной предположительно по нормальному закону распределения . Покажем, по каким формулам находятся доверительные интервалы для параметров распределения - математического ожидания и дисперсии (среднего квадратического отклонения).

Доверительный интервал для математического ожидания

Случай 1. Дисперсия распределения известна и равна . Тогда доверительный интервал для параметра a имеет вид:
t определяется из таблицы распределения Лапласа по соотношению

Случай 2. Дисперсия распределения неизвестна, по выборке вычислена точечная оценка дисперсии . Тогда доверительный интервал для параметра a имеет вид:
, где - выборочное среднее, вычисленное по выборке, параметр t определяется из таблицы распределения Стьюдента

Пример. По данным 7 измерений некоторой величины найдены средняя результатов измерений, равная 30 и выборочная дисперсия, равная 36. Найдите границы, в которых с надежностью 0,99 заключено истинное значение измеряемой величины.

Решение. Найдем . Тогда доверительные границы для интервала, заключающего истинное значение измеряемой величины можно найти по формуле:
, где - выборочное среднее, - выборочная дисперсия. Подставляем все величины и получаем:

Доверительный интервал для дисперсии

Считаем, что вообще говоря, математическое ожидание неизвестно, а известна только точечная несмещенная оценка дисперсии . Тогда доверительный интервал имеет вид:
, где - квантили распределения , определяемые из таблиц.

Пример. По данным 7 испытаний найдено значение оценки для среднеквадратического отклонения s=12 . Найти с вероятностью 0,9 ширину доверительного интервала, построенного для оценки дисперсии.

Решение. Доверительный интервал для неизвестной дисперсии генеральной совокупности можно найти по формуле:

Подставляем и получаем:


Тогда ширина доверительного интервала равна 465,589-71,708=393,881.

Доверительный интервал для вероятности (доли)

Случай 1. Пусть в задаче известен объем выборки и выборочная доля (относительная частота) . Тогда доверительный интервал для генеральной доли (истинной вероятности) имеет вид:
, где параметр t определяется из таблицы распределения Лапласа по соотношению .

Случай 2. Если в задаче дополнительно известен общий объем совокупности , из которой была сделана выборка, доверительный интервал для генеральной доли (истинной вероятности) можно найти по скорректированной формуле:
.

Пример. Известно, что Найти границы, в которых с вероятностью заключена генеральная доля.

Решение. Используем формулу:

Найдем параметр из условия , получим Подставляем в формулу:


Другие примеры задач по математической статистике вы найдете на странице