Коефіцієнт кореляції та детермінації, Детальна інформація
Коефіцієнт кореляції та детермінації
- сума квадратів помилок.
Справедливий такий вираз:
.
Поділивши цей вираз на п, отримаємо вираз для дисперсій:
,
де
- загальна дисперсія ознаки у;
- дисперсія, що пояснює регресію;
- дисперсія помилок.
Таким чином ми здійснили декомпозицію дисперсії, тобто розклали загальну дисперсію на дві частини: дисперсію, що пояснює регресію, та дисперсію помилок (або дисперсію випадкової величини). Запишемо це у такому вигляді:
.
і отримаємо:
У цьому виразі перша частина – це частка дисперсії, що пояснюється регресією, а друга – частка помилок в загальній дисперсії.
Частина дисперсії, що пояснює регресію, називається коефіцієнтом детермінації і позначається r2. Коефіцієнт детермінації використовується як критерій адекватності моделі, бо є мірою пояснювальної сили незалежної змінної х.
Коефіцієнт детермінації визначається за формулою:
Коефіцієнт детермінації завжди позитивний і перебуває в межах від нуля до одиниці. Він показує, яка частка коливань результативної ознаки y зумовлена коливанням факторної ознаки х.
Звичайно, нас цікавить, чи є зв’язок між коефіцієнтом кореляції та коефіцієнтом детермінації, і якщо є , то який? Перш ніж відповісти на це питання, розглянемо зв’язок між коефіцієнтом кореляції та нахилом регресійної лінії, тобто параметром а1. Нагадаємо формули для розрахунків коефіцієнта кореляції та нахилу:
;
.
.і зробимо деякі перетворення
.
додатні, випливає, що знак коефіцієнта кореляції завжди збігається із знаком параметра а1.
.
Знаючи зв’язок між коефіцієнтом кореляції і коефіцієнтом регресії, розглянемо зв’язок між коефіцієнтом кореляції і коефіцієнтом детермінації. Нагадаємо формулу для розрахунку коефіцієнта детермінації:
Виконаємо прості перетворення з виразом чисельника:
.
Внесемо зміни до виразу коефіцієнта детермінації, враховуючи останні перетворення:
Справедливий такий вираз:
.
Поділивши цей вираз на п, отримаємо вираз для дисперсій:
,
де
- загальна дисперсія ознаки у;
- дисперсія, що пояснює регресію;
- дисперсія помилок.
Таким чином ми здійснили декомпозицію дисперсії, тобто розклали загальну дисперсію на дві частини: дисперсію, що пояснює регресію, та дисперсію помилок (або дисперсію випадкової величини). Запишемо це у такому вигляді:
.
і отримаємо:
У цьому виразі перша частина – це частка дисперсії, що пояснюється регресією, а друга – частка помилок в загальній дисперсії.
Частина дисперсії, що пояснює регресію, називається коефіцієнтом детермінації і позначається r2. Коефіцієнт детермінації використовується як критерій адекватності моделі, бо є мірою пояснювальної сили незалежної змінної х.
Коефіцієнт детермінації визначається за формулою:
Коефіцієнт детермінації завжди позитивний і перебуває в межах від нуля до одиниці. Він показує, яка частка коливань результативної ознаки y зумовлена коливанням факторної ознаки х.
Звичайно, нас цікавить, чи є зв’язок між коефіцієнтом кореляції та коефіцієнтом детермінації, і якщо є , то який? Перш ніж відповісти на це питання, розглянемо зв’язок між коефіцієнтом кореляції та нахилом регресійної лінії, тобто параметром а1. Нагадаємо формули для розрахунків коефіцієнта кореляції та нахилу:
;
.
.і зробимо деякі перетворення
.
додатні, випливає, що знак коефіцієнта кореляції завжди збігається із знаком параметра а1.
.
Знаючи зв’язок між коефіцієнтом кореляції і коефіцієнтом регресії, розглянемо зв’язок між коефіцієнтом кореляції і коефіцієнтом детермінації. Нагадаємо формулу для розрахунку коефіцієнта детермінації:
Виконаємо прості перетворення з виразом чисельника:
.
Внесемо зміни до виразу коефіцієнта детермінації, враховуючи останні перетворення:
The online video editor trusted by teams to make professional video in
minutes
© Referats, Inc · All rights reserved 2021