Значимость по критерию фишера. Критерий фишера применяется при проверке гипотезы о равенстве дисперсий двух генеральных совокупностей - документ
Значимость уравнения множественной регрессии в целом, так же как и в парной регрессии, оценивается с помощью -критерия Фишера:
, (2.22)
где
– факторная сумма квадратов на одну
степень свободы;
– остаточная сумма квадратов на одну
степень свободы;
– коэффициент (индекс) множественной
детерминации;
– число параметров при переменных(в линейной регрессии совпадает с числом
включенных в модель факторов);
– число наблюдений.
Оценивается
значимость не только уравнения в целом,
но и фактора, дополнительно включенного
в регрессионную модель. Необходимость
такой оценки связана с тем, что не каждый
фактор, вошедший в модель, может
существенно увеличивать долю объясненной
вариации результативного признака.
Кроме того, при наличии в модели нескольких
факторов они могут вводиться в модель
в разной последовательности. Ввиду
корреляции между факторами значимость
одного и того же фактора может быть
разной в зависимости от последовательности
его введения в модель. Мерой для оценки
включения фактора в модель служит
частный
-критерий,
т.е..
Частный
-критерий
построен на сравнении прироста факторной
дисперсии, обусловленного влиянием
дополнительно включенного фактора, с
остаточной дисперсией на одну степень
свободы по регрессионной модели в целом.
В общем виде для факторачастный
-критерий
определится как
, (2.23)
где
– коэффициент множественной детерминации
для модели с полным набором факторов,
– тот же показатель, но без включения
в модель фактора,– число наблюдений,
– число параметров в модели (без
свободного члена).
Фактическое значение частного
-критерия
сравнивается с табличным при уровне
значимости
и числе степеней свободы: 1 и
.
Если фактическое значение
превышает
,
то дополнительное включение факторав модель статистически оправданно и
коэффициент чистой регрессиипри факторестатистически значим. Если же фактическое
значениеменьше табличного, то дополнительное
включение в модель факторане увеличивает существенно долю
объясненной вариации признака,
следовательно, нецелесообразно его
включение в модель; коэффициент регрессии
при данном факторе в этом случае
статистически незначим.
Для двухфакторного уравнения частные
-критерии
имеют вид:
,
. (2.23а)
С помощью частного
-критерия
можно проверить значимость всех
коэффициентов регрессии в предположении,
что каждый соответствующий факторвводился в уравнение множественной
регрессии последним.
-Критерий стьюдента для уравнения множественной регрессии.
Частный
-критерий
оценивает значимость коэффициентов
чистой регрессии. Зная величину,
можно определить и-критерий
для коэффициента регрессии при-м
факторе,,
а именно:
. (2.24)
Оценка значимости коэффициентов чистой
регрессии по
-критерию
Стьюдента может быть проведена и без
расчета частных
-критериев.
В этом случае, как и в парной регрессии,
для каждого фактора используется
формула:
, (2.25)
где – коэффициент чистой регрессии при факторе,– средняя квадратическая (стандартная) ошибка коэффициента регрессии.
Для уравнения множественной регрессии средняя квадратическая ошибка коэффициента регрессии может быть определена по следующей формуле:
, (2.26)
где
,– среднее квадратическое отклонение
для признака,
– коэффициент детерминации для
уравнения множественной регрессии,
– коэффициент детерминации для
зависимости факторасо всеми другими факторами уравнения
множественной регрессии;
– число степеней свободы для остаточной
суммы квадратов отклонений.
Как видим, чтобы воспользоваться данной
формулой, необходимы матрица межфакторной
корреляции и расчет по ней соответствующих
коэффициентов детерминации
.
Так, для уравнения
оценка значимости коэффициентов
регрессии,,предполагает расчет трех межфакторных
коэффициентов детерминации:
,
,
.
Взаимосвязь показателей частного
коэффициента корреляции, частного
-критерия
и-критерия
Стьюдента для коэффициентов чистой
регрессии может использоваться в
процедуре отбора факторов. Отсев факторов
при построении уравнения регрессии
методом исключения практически можно
осуществлять не только по частным
коэффициентам корреляции, исключая на
каждом шаге фактор с наименьшим незначимым
значением частного коэффициента
корреляции, но и по величинами.
Частный
-критерий
широко используется и при построении
модели методом включения переменных и
шаговым регрессионным методом.
Критерий Фишера
Критерий Фишера применяется при проверке гипотезы о равенстве дисперсий двух генеральных совокупностей, распределенных по нормальному закону. Он является параметрическим критерием.
F-критерий Фишера называют дисперсионным отношением, так как он формируется как отношение двух сравниваемых несмещенных оценок дисперсий.
Пусть в результате наблюдений получены
две выборки. По ним вычислены дисперсии
и
,
имеющие
и
степеней
свободы. Будем считать, что первая
выборка взята из генеральной совокупности
с дисперсией
,
а вторая – из генеральной совокупности
с дисперсией
.
Выдвигается нулевая гипотеза о равенстве
двух дисперсий, т.е. H 0:
или
.
Для того, чтобы отвергнуть эту гипотезу
нужно доказать значимость различия при
заданном уровне значимости
.
Значение критерия вычисляется по формуле:
Очевидно, что при равенстве дисперсий величина критерия будет равна единице. В остальных случаях она будет больше (меньше) единицы.
Критерий имеет распределение Фишера
.
Критерий Фишера – двусторонний критерий,
и нулевая гипотеза
отвергается в пользу альтернативной
если
.
Здесь
,
где
– объем первой и второй выборки
соответственно.
В системе STATISTICA реализован односторонний критерий Фишера, т.е. в качестве всегда берут максимальную дисперсию. В этом случае нулевая гипотеза отвергается в пользу альтернативы , если .
Пример
Пусть поставлена задача, сравнить
эффективность
обучения
двух групп студентов. Уровень успеваемости
- характеризует уровень управления
процессом обучения, а дисперсия качество
управления обучением, степень
организованности
процесса обучения. Оба показателя
являются независимыми
и в общем случае должны рассматриваться
совместно. Уровень
успеваемости (математическое
ожидание) каждой группы студентов
характеризуется средними
арифметическими
и
,
а качество характеризуется соответствующими
выборочными дисперсиями оценок:
и
.
При оценке уровня текущей успеваемости
оказалось, что он одинаков у обоих
учащихся:
=
=
4,0. Выборочные дисперсии:
и
.
Числа степеней свободы, соответствующие
этим оценкам:
и
. Отсюда для установления различий в
эффективности обучения мы можем
воспользоваться стабильностью
успеваемости, т.е. проверим гипотезу
.
Вычислим
(в числителе должна быть большая
дисперсия),
.
По таблицам (STATISTICA
–
Probability
Distribution
Calculator
)
находим
,
которое меньше вычисленного, следовательно
нулевая гипотеза должна быть отвергнута
в пользу альтернативы
.
Это заключение может не удовлетворить
исследователя, поскольку его интересует
истинная величина отношения
(у нас в числителе всегда большая
дисперсия). При проверке одностороннего
критерия получим
,
что меньше вычисленного выше значения.
Итак, нулевая гипотеза должна быть
отвергнута в пользу альтернативы
.
Критерий Фишера в программе STATISTICA в среде Windows
Для примера проверки гипотезы (критерий Фишера) используем (создаем) файл с двумя переменными (fisher.sta):
Рис. 1. Таблица с двумя независимыми переменными
Чтобы проверить гипотезу необходимо в базовой статистике (Basic Statistics and Tables ) выбрать проверку по Стьюденту для независимых переменных. (t-test, independent, by variables ).
Рис. 2. Проверка параметрических гипотез
После выбора переменных и нажатия на клавишу Summary производится подсчет значений среднеквадратичных отклонений и критерия Фишера. Кроме этого определяется уровень значимости p , при котором различие несущественно.
Рис. 3. Результаты проверки гипотезы (F- критерий)
Используя Probability Calculator и задав значение параметров можно построить график распределения Фишера с пометкой вычисленного значения.
Рис. 4. Область принятия (отклонения) гипотезы (F- критерий)
Источники.
Проверка гипотез об отношениях двух дисперсий
URL: /tryphonov3/terms3/testdi.htm
Лекция 6. :8080/resources/math/mop/lections/lection_6.htm
F – критерий Фишера
URL: /home/portal/applications/Multivariatadvisor/F-Fisheer/F-Fisheer.htm
Теория и практика вероятностно-статистических исследований.
URL: /active/referats/read/doc-3663-1.html
F – критерий Фишера
Критерий Фишера позволяет сравнивать величины выборочных дисперсий двух независимых выборок. Для вычисления F эмп нужно найти отношение дисперсий двух выборок, причем так, чтобы большая по величине дисперсия находилась бы в числителе, а меньшая – в знаменателе. Формула вычисления критерия Фишера такова:
где - дисперсии первой и второй выборки соответственно.
Так как, согласно условию критерия, величина числителя должна быть больше или равна величине знаменателя, то значение F эмп всегда будет больше или равно единице.
Число степеней свободы определяется также просто:
k 1 =n l - 1 для первой выборки (т.е. для той выборки, величина дисперсии которой больше) и k 2 = n 2 - 1 для второй выборки.
В Приложении 1 критические значения критерия Фишера находятся по величинам k 1 (верхняя строчка таблицы) и k 2 (левый столбец таблицы).
Если t эмп >t крит, то нулевая гипотеза принимается, в противном случае принимается альтернативная.
Пример 3. В двух третьих классах проводилось тестирование умственного развития по тесту ТУРМШ десяти учащихся. Полученные значения величин средних достоверно не различались, однако психолога интересует вопрос - есть ли различия в степени однородности показателей умственного развития между классами.
Решение. Для критерия Фишера необходимо сравнить дисперсии тестовых оценок в обоих классах. Результаты тестирования представлены в таблице:
Таблица 3.
№№ учащихся |
Первый класс |
Второй класс |
Рассчитав дисперсии для переменных X и Y, получаем:
s x 2 =572,83; s y 2 =174,04
Тогда по формуле (8) для расчета по F критерию Фишера находим:
По таблице из Приложения 1 для F критерия при степенях свободы в обоих случаях равных k=10 - 1 = 9 находим F крит =3,18 (<3.29), следовательно, в терминах статистических гипотез можно утверждать, что Н 0 (гипотеза о сходстве) может быть отвергнута на уровне 5%, а принимается в этом случае гипотеза Н 1 . Иcследователь может утверждать, что по степени однородности такого показателя, как умственное развитие, имеется различие между выборками из двух классов.
6.2 Непараметрические критерии
Сравнивая на глазок (по процентным соотношениям) результаты до и после какого-либо воздействия, исследователь приходит к заключению, что если наблюдаются различия, то имеет место различие в сравниваемых выборках. Подобный подход категорически неприемлем, так как для процентов нельзя определить уровень достоверности в различиях. Проценты, взятые сами по себе, не дают возможности делать статистически достоверные выводы. Чтобы доказать эффективность какого-либо воздействия, необходимо выявить статистически значимую тенденцию в смещении (сдвиге) показателей. Для решения подобных задач исследователь может использовать ряд критериев различия. Ниже будет рассмотрены непараметрические критерии: критерий знаков и критерий хи-квадрат.