В наших расчётах будет использоваться распределение Стьюдента, которое также называют t-распределением
Буква F говорит об использовании распределения Фишера. Другое название: F-распределение. Само выражение «F-статистика» означает «случайная величина, имеющая F-распределение»
Скорректированный R2 используют для сравнения разных моделей и выбора «наилучшей» модели. Самая лучшая модель должна давать хорошее качество прогнозов (низкий уровень ошибки) и должна быть не слишкой сложной
Скорректированный коэффициент детерминации
В данной формуле учитывается k — количество коэффициентов уравнения регрессии и n — объём выборки, то есть число пар «иксов» и «игреков»
крышкой». Это — оценка зависимой переменной (результативного признака) «игрека» при заданном значении независимой переменной (факторного признака) «икс». Другими словами, это так называемый линейный прогноз по уравнению регрессии
ESS (Explained Sum of Squares) — объяснённая сумма квадратов;
TSS (Total Sum of Squares) — полная (общая) сумма квадратов;
RSS (Residual Sum of Squares) — сумма квадратов остатков.
TSS, ESS и RSS связаны следующим образом
Коэффициент детерминации показазывает, насколько точно изменение икса определяет изменение игрека
Качество модели в целом характеризуется коэффициентом детерминации R2
Коэффициент линейной корреляции определяет тесноту линейной взаимосвязи между переменными
Здесь мы используем следующие обозначения:
a — свободный член уравнения;
b — коэффициент регрессии;
e — случайная стоставляющая (остатки);
y — зависимая переменная, результативный признак;
x — независимая (объясняющая) переменная, факторный признак