Доверительный интервал в процентах

В предыдущем материале мы увидели, как построить доверительный интервал для медианы совокупности. Этот доверительный интервал предоставил молочным предприятиям информацию о количестве добавляемого в молоко витамина D. В качестве альтернативы медиане можно было использовать доверительный интервал для среднего. Чтобы найти доверительный интервал для среднего, предполагая, что данные следуют определенному распределению, мы должны знать выборочное распределение его оценщика. Мы также должны указать, насколько мы хотим быть уверены в том, что интервал содержит параметр совокупности. Среднее значение выборки является оценкой среднего генеральной совокупности, и распределение выборки среднего значения выборки легко найти.

Поскольку мы предполагаем, что данные подчиняются нормальному распределению, выборочное среднее - среднее из выборочных значений - также следует нормальному распределению. Однако это предположение не принципиально. Даже если данные не распределены нормально, центральная предельная теорема утверждает, что выборочное среднее при соответствующих условиях будет приблизительно соответствовать нормальному распределению.

Чтобы полностью указать нормальное распределение, мы также должны предоставить среднее значение и дисперсию выборочного среднего. Сначала мы разрабатываем доверительный интервал для среднего значения, предполагая, что дисперсия генеральной совокупности известна, и расширяем его до ситуации, когда дисперсия генеральной совокупности неизвестна и оценивается по выборке.

Известная дисперсия :в главе 5 мы увидели, что среднее значение выборки было μ, среднее значение генеральной совокупности, а его дисперсия - σ 2 / n . Таким образом, стандартное отклонение выборочного среднего составляет σ / n, и оно называется стандартной ошибкой выборочного среднего (). Использование слова « ошибка» сбивает с толку, поскольку ошибок не было. Однако в данном контексте это традиционный термин. Термин стандартная ошибка используется вместо стандартного отклонения, когда мы обсуждаем вариацию в статистической выборке. Термин стандартное отклонениеобычно используется для обсуждения вариаций самих выборочных данных. Таким образом, стандартное отклонение измеряет изменение от единицы к единице, в то время как стандартная ошибка измеряет вариацию от выборки к выборке.

Теперь мы обращаемся к вопросу о том, насколько мы хотим быть уверены в том, что интервал содержит среднее значение генеральной совокупности (μ). Из материала о нормальном распределении в главе 5 мы знаем, что

где Z - стандартная нормальная переменная. С точки зрения выборочного среднего это

Но мы хотим , чтобы интервал для ц, а не для Z . Следовательно, мы должны выполнить некоторые алгебраические манипуляции, чтобы преобразовать это в интервал для μ. Сначала мы умножаем все три члена в фигурных скобках на σ / n. Это дает

Затем мы вычитаем из всех выражений внутри фигурных скобок, и это дает

Этот интервал примерно равен −µ; чтобы преобразовать его в интервал около μ, мы должны умножить каждый член в скобках на −1. Перед тем как это сделать, мы должны знать о влиянии умножения неравенства на минусовое число. Например, мы знаем, что 3 меньше 4. Однако −3 больше −4, поэтому результат умножения обеих сторон неравенства на −1 меняет направление неравенства. Следовательно, мы имеем

Мы меняем порядок членов так, чтобы слева была наименьшая из трех величин, то есть

или, в более общем смысле,

(1 - α) * 100-процентный доверительный интервал для среднего значения генеральной совокупности может быть выражен как

Результатом этих манипуляций является интервал для μ в терминах σ, n , 1,96 (или некоторого другого значения z ) и. Среднее значение выборки является единственной из этих величин, которая изменяется от образца к образцу. Однако, как только мы рисуем выборку, интервал фиксируется, так как значение выборочного среднего известно. Поскольку интервал будет содержать или не содержать μ, мы больше не говорим о вероятности интервала, содержащего μ.

Хотя мы не говорим о вероятности интервала, содержащего µ, мы знаем, что при повторной выборке интервалы предыдущей формы будут содержать параметр µ в 95% случаев. Таким образом, вместо обсуждения вероятности интервала, содержащего μ, мы говорим, что на 95 процентов уверены, что интервал от [x ¯ - 1,96 (σ / n)] до [x ¯ - 1,96 (σ / n)] будет содержать μ. Поэтому интервалы этого типа называются доверительными интервалами . Причина использования слова уверенностьто же самое, что обсуждалось в предыдущем материале, не предназначенном для распространения. Границы доверительного интервала обычно имеют форму оценки выборки плюс или минус некоторый процентиль распределения - в данном случае нормальное распределение - умноженное на стандартную ошибку оценки выборки.

95-процентный доверительный интервал для среднего систолического артериального давления для 200 пациентов можно найти на основе набора данных dig200, представленного в главе 3. Мы предполагаем, что стандартное отклонение для этой популяции пациентов составляет 20 мм рт. Поскольку среднее значение выборки, основанное на размере выборки из 199 наблюдений (одно отсутствующее значение), оказалось равным 125,8 мм рт. 125,8 - 1,96 (20/199)], то есть от 123,0 до 128,6 мм рт.

Таблица 7.4 иллюстрирует концепцию доверительных интервалов. На нем показаны результаты построения 50 образцов размером 60 из нормального распределения со средним значением 94 и стандартным отклонением 11. Эти значения близки к среднему значению и стандартному отклонению переменной систолического артериального давления для 5-летних мальчиков. в Соединенных Штатах, как сообщила рабочая группа NHLBI по контролю артериального давления у детей (1987).

Таблица 7.4. Моделирование 95% доверительных интервалов для 50 образцов n = 60 из нормального распределения с μ = 94 и σ = 11 (стандартная ошибка = 1,42).

Образец Иметь в виду Стандартное 95% ДИ Образец Иметь в виду Стандартное 95% ДИ
194,7510,25(91,96, 97,54)26 год94,6111,49(91,82, 97,39)
294,8510,86(92,06, 97,63)2792,799,36(90,00, 95,58)
394,7110.09(91,92, 97,50)28 год96,0012,19(93,22, 98,79)
494,0312,27(91,24, 96,82)2995,9911,36(93.20, 98.78)
593,7710,05(90,98, 96,56)3093,9811,74(91,19, 96,76)
692,549,32(89,76, 95,33)31 год95,3613.08(92,57, 98,15)
793,4012.07(90,62, 96,19)3291,108,69(88,31, 93,89) *
893,9711.02(91,18, 96,75)3393,8512,94(91,06, 96,63)
996,339,26(93,54, 99,12)3496,019,63(93,22, 98,79)
1093,5612.01(90,78, 96,35)35 год95,208,94(92,41, 97,99)
1194,9410,81(92,15, 97,73)3695,649,41(92,85, 98,43)
1294,6612.08(91,88, 97,45)3794,7410.31(91,95, 97,53)
1394,2111.02(91,42, 97,00)3893,5210.30(90,73, 96,31)
1494,559,98(91,76, 97,34)3992,9210,27(90,13, 95,71)
1593,5711,50(90,79, 96,36)4095,0810.07(92,30, 97,87)
1695,9912.01(93.20, 98.78)41 год93,8810,53(91,09, 96,66)
1793,8612,53(91,08, 96,65)4295,389,98(92,59, 98,17)
1892,0213,58(89,23, 94,81)43 год94,3811,65(91,59, 97,17)
1995,1612,03(92,38, 97,95)44 год91,5510,63(88,76, 94,33)
2094,9912.00(92.20, 97.78)4595,4112,79(92,62, 98,20)
21 год94,6511,18(91,86, 97,43)4692,4010,57(89,62, 95,19)
2292,8612,52(90,07, 95,64)4796,0011,45(93,21, 98,78)
2393,9911,76(91,20, 96,78)4895,3910,56(92,60, 98,18)
2491,4410,75(88,65, 94,22)4997,6910,89(94,90, 100,47) *
2596,0711,89(93,28, 98,86)5095,0110,61(92,22, 97,79)

В этой демонстрации 4 процента (2 из 50, отмеченных в таблице) интервалов не содержали среднего для генеральной совокупности, а 96 процентов - содержали. Если мы возьмем намного больше выборок, доля интервалов, содержащих среднее значение, составит 95 процентов. Это основа для утверждения, что мы на 95 процентов уверены, что доверительный интервал, основанный на нашей единственной выборке, будет содержать среднее значение генеральной совокупности.

Если мы используем другое значение для стандартной нормальной переменной, уровень достоверности изменится соответствующим образом. Например, если бы мы начали со значения 1,645, z 0,95 вместо 1,96, z 0,975 , уровень достоверности был бы 90 процентов вместо 95 процентов. Z 0,95value используется с 90-процентным уровнем, потому что мы хотим, чтобы 5 процентов значений находились в каждом хвосте. Нижний и верхний пределы для 90-процентного доверительного интервала для среднего генерального значения для данных в первой выборке из 60 наблюдений составляют 92,41 [= 94,75 - 1,645 (1,42)] и 97,09 [= 94,75 + 1,645 (1,42)], соответственно. Этот интервал уже, чем соответствующий 95-процентный доверительный интервал от 91,96 до 97,54. Это имеет смысл, поскольку, если мы хотим быть более уверенными в том, что интервал содержит среднее значение генеральной совокупности, интервал должен быть шире. 99-процентный доверительный интервал использует z 0,995 , что составляет 2,576, а соответствующий интервал составляет от 91,09 [= 94,75 - 2,576 (1,42)] до 98,41 [= 94,75 + 2,576 (1,42)].

Пятьдесят образцов, показанных в таблице 7.4, имели средние значения выборки, основанные на 60 наблюдениях, в диапазоне от минимума 91,1 до максимального значения 97,7. Это величина вариации средних значений выборки, ожидаемая, если данные были получены от одной и той же нормальной популяции со средним значением 94 и стандартным отклонением 11. Вторая национальная целевая группа по контролю артериального давления у детей (1987) использовала средства исследования в диапазоне от От 85,6 (на основе 181 значения) до 103,5 мм рт. Ст. (На основе 61 значения), что далеко за пределами только что указанного диапазона. Эти экстремальные значения предполагают, что эти данные получены не из одной и той же популяции, и это затем ставит под сомнение комбинацию Целевой группой данных из этих различных исследований.

На размер доверительного интервала также влияет размер выборки, который появляется в члене σ / n. Поскольку n находится в знаменателе, увеличение n уменьшает размер доверительного интервала. Например, если мы удвоили размер выборки с 60 до 120 в предыдущем примере, стандартная ошибка среднего изменится с 1,42 (= 11 60) до 1,004 (= 11/120). . Удвоение размера выборки снижает доверительный интервал примерно до 71 процента (= 1/2) от его прежней ширины. Таким образом, мы знаем больше о местонахождении среднего значения генеральной совокупности, поскольку доверительный интервал короче по мере увеличения размера выборки.

Размер доверительного интервала также является функцией значения σ, но изменение σ означает, что мы рассматриваем другую популяцию. Однако, если мы хотим рассматривать однородные подгруппы населения, значение стандартного отклонения для подгруппы должно быть меньше, чем для всего населения. Например, вместо того, чтобы рассматривать артериальное давление 5-летних мальчиков, мы рассматриваем артериальное давление 5-летних мальчиков, сгруппированных по интервалам роста. Стандартное отклонение систолического артериального давления в подгруппах с разным ростом должно быть намного меньше общего стандартного отклонения.

Другой фактор, влияющий на размер доверительного интервала, - это односторонний или двусторонний интервал. Если нас беспокоят только более высокие значения артериального давления, мы могли бы использовать верхний односторонний доверительный интервал. Нижний предел будет равен нулю или -∞ для переменной, имеющей положительные и отрицательные значения, а верхний предел равен

Это похоже на двусторонний верхний предел, за исключением использования z 1 − α вместо z 1 − α / 2 .

Неизвестная дисперсия :когда дисперсия совокупности σ 2 неизвестна, разумно заменить ее выборочную оценку s 2 при вычислении доверительного интервала. Однако в этом есть проблема. Хотя (x ¯ - μ) (σ / n) следует стандартному нормальному распределению, (x ¯ - μ) (s / n) нет. В первом выражении есть только одна случайная величина, тогда как второе выражение включает соотношение двух случайных величин и s . Нам нужно знать распределение вероятностей для этого отношения случайных величин.

К счастью, Госсет, с которым мы познакомились в главе 5, уже обнаружил распределение (x ¯ - μ) (s / n). Распределение называется Стьюдентом, что означает Стьюдент, псевдоним, используемый Госсетом, или, проще говоря, t-распределение . Для больших значений n выборочные значения s очень близки к σ, и, следовательно, распределение t очень похоже на стандартное нормальное. Однако для малых значений n выборочные значения s значительно различаются, и t и стандартное нормальное распределение имеют разный вид. Таким образом, tРаспределение имеет один параметр - количество независимых наблюдений, используемых при вычислении s . В главе 3 мы увидели, что это значение равно n - 1, и назвали это значение степенями свободы. Следовательно, параметр t- распределения - это степени свободы, связанные с вычислением стандартной ошибки. Степени свободы показаны нижним индексом, то есть как t df . Например, t с 5 степенями свободы записывается как t 5 .

На рисунке 7.1 показаны распределения t 1 и t 5 по сравнению со стандартным нормальным распределением в диапазоне от –3,8 до 3,8. Как видно из этих графиков, t- распределение с одной степенью свободы, нижняя кривая, значительно более пологие, то есть вариабельность больше, чем для стандартного нормального распределения, верхняя кривая на рисунке. Этого следовало ожидать, поскольку среднее значение выборки, деленное на стандартное отклонение выборки, является более изменчивым, чем одно только среднее значение выборки. По мере увеличения степеней свободы t- распределения становятся все ближе и ближе к стандартному нормальному виду. Тенденция к tприближение к стандартному нормальному распределению по мере увеличения числа степеней свободы также можно увидеть в таблице 7.5, где показаны выбранные процентили для нескольких t- распределений и стандартного нормального распределения. Более полная таблица t находится в Приложении Таблица B5.

Рисунок 7.1. Распределения t 1 и t 5 по сравнению с распределением z .

Таблица 7.5. Выбранные процентили для нескольких t- распределений и стандартного нормального распределения.

Процентили Распределение 0,80 0,90 0,95 0,99
т 11,3763,0786,31431 821
т 50,9201,4762,0153,365
т 100,8791,3721,8132,764
т 300,8541,3101,6972,457
т 600,8481,2961,6712.390
т 1200,8451,2891,6582,358
Стандартный нормальный0,8421,2821,6452.326

Теперь, когда мы знаем распределение (x ¯ - μ) (s / n), мы можем сформировать доверительные интервалы для среднего, даже если дисперсия генеральной совокупности неизвестна. Форма доверительного интервала аналогична предыдущей для среднего с известной дисперсией, за исключением того, что s заменяет σ, а распределение t используется вместо стандартного нормального распределения. Следовательно, нижний и верхний пределы для (1 - α) * 100-процентного доверительного интервала для среднего значения, когда дисперсия неизвестна, равны и соответственно.

Давайте рассчитаем 90-процентный доверительный интервал для среднего систолического артериального давления для 5-летних мальчиков на основе данных первого образца в таблице 7.4 (строка 1). Доверительный интервал 90 процентов [= (1 - α) * 100 процентов] означает, что α равно 0,10. Основываясь на выборке из 60 наблюдений, среднее значение выборки составило 94,75, а стандартное отклонение выборки составило 10,25 мм рт. Таким образом, нам нужен 95-й (= 1 - α / 2) процентиль t- распределения с 59 степенями свободы. Однако ни в таблице 7.5, ни в таблице B5 не показаны процентили для распределения t с 59 степенями свободы. Основываясь на небольших изменениях в распределении t для больших степеней свободы, будет небольшая ошибка, если мы будем использовать 95-й процентиль для 60распределение. Следовательно, нижний и верхний пределы примерно равны

или 92,54 и 96,96 мм рт. ст. соответственно.

Если мы воспользуемся компьютерным пакетом (см. Примечание к программе 7.1на веб-сайте), чтобы найти значение 95-го процентиля для распределения t 59 , мы обнаружим, что его значение составляет 1,6711. Следовательно, в этом примере небольшая ошибка вводится при использовании процентилей от t 60 вместо распределения 59 .

Оценка

6.48 В тексте сообщается, что 95-процентный доверительный интервал для коэффициента лузовости для игроков в интернет-покер с высокими ставками составляет 25,53 ± 1,18. Объясните, почему вы согласны или не согласны с этим толкованием этого числа:

95 процентов игроков в этой популяции имеют коэффициенты лузовости в этом интервале.

Если игрок в покер выбран случайным образом из этой совокупности, существует вероятность 0,95 того, что его или ее коэффициент лузовости находится в этом интервале.

95 процентов оцененных таким образом доверительных интервалов включают средний коэффициент лузовости игроков в популяции.

ОЦЕНКА ПАРАМЕТРОВ

РЕШЕНИЕ

Мы используем программу 7.3.1 для получения решения (см. Рисунок 7.3).

РИСУНОК 7.3. (a) Двусторонний и (b) нижний 95-процентный доверительный интервал для ПРИМЕРА 7.3f.

Наши выводы 100 (1 - α) процентных доверительных интервалов для среднего значения совокупности μ предполагают, что распределение совокупности является нормальным. Однако даже если это не так, если размер выборки достаточно велик, полученные интервалы все равно будут приблизительно 100 (1 - α) процентным доверительным интервалом для μ. Это верно, потому что согласно центральной предельной теореме n (X ¯ - μ) / σ будет иметь приблизительно нормальное распределение, а n (X ¯ - μ) / S будет иметь приблизительно t -распределение.

Оценка

Пример 8.13

Агентство по охране окружающей среды (EPA) обеспокоено количеством ПХБ, токсичного химического вещества, в молоке кормящих матерей. В выборке из 20 женщин количество (в миллионных долях) ПХБ было следующим:

Используйте эти данные, чтобы получить

95-процентный доверительный интервал

99-процентный доверительный интервал

среднего количества ПХБ в молоке кормящих матерей.

Решение

Простой расчет показывает, что среднее значение выборки и стандартное отклонение выборки равны

Поскольку 100 (1 - α) равно 0,95 при α = 0,05 и 0,99 при α = 0,01, нам нужны значения t 19,0,025 и t 19,0,005 . Из таблицы D.2 мы видим, что

Следовательно, оценка μ с 95-процентным доверительным интервалом равна

и оценка 99-процентного доверительного интервала μ равна

То есть мы можем быть на 95 процентов уверены, что среднее количество ПХД в молоке кормящих матерей составляет от 3,42 до 8,18 частей на миллион; и мы можем быть уверены на 99 процентов, что она составляет от 2,55 до 9,05 частей на миллион.

Эту проблему также можно было решить, запустив программу 8-3, которая дает следующее.

ПОПУЛЯРНЫЕ СТАТЬИ