Криволінійний поліноміальний регрессііонний аналіз. Коефіцієнти кореляції і детермінації фетометрії

При великому обсязі вибірки (Наприклад, коли в терміні 20 тижнів або пізніше отримано більш ніж 150 вимірювань) з`являється можливість апроксимації даних до графічної кривої, а не просто прямій лінії. За допомогою цього можна більш точно описати еволюцію даних. Такий метод має назву поліноміальний регресійний аналіз.
поліноміальна регресія описується математичними багаточленними (квадратичними, кубічними) рівняннями.

рівняння можуть бути різних порядків, в залежності від ступеня, в яку буде зводитися незалежна змінна. наприклад:
Перший порядок: у - а + b х
Другий порядок: у = а + b х + сх2
Третій порядок: у = a + bx + cx2 + dx3

Чим вище порядок многочленів рівняння, тим краще воно описує дані. Остаточна мета цього виду аналізу полягає в побудові кривої, яка проходила б через кожну точку двовимірного графіка даних. Математично доведено, що рівняння подібної кривої має порядок, що дорівнює кількості точок вибірки мінус 1.
Очевидно, що рівняння такого високого ступеня робило б обчислення настільки громіздким, що не дозволяло б провести аналіз даних.

На практиці вибирається многочленное рівняння найнижчого порядку, яке в той же час дозволяє досить точно описати криву для отриманих значень. Вибір рівняння здійснюється за допомогою порівняння їх коефіцієнтів кореляції.

регресійний аналіз

Коефіцієнти кореляції і детермінації

якість відповідності рівняння оцінюється коефіцієнтом множинної кореляції (R) або квадратом цієї величини (коефіцієнтом детермінації - R2). Чим більш виражена кореляційний взаємозв`язок, тим ближче будуть значення цих коефіцієнтів до 1. Якщо є абсолютна кореляційний взаємозв`язок між двома змінними, всі крапки графіка розсіювання опиняться на регресійній кривої.

таке відбувається досить рідко, більш імовірна ситуація, коли деякі крапки не будуть на ній розташовуватися. Величина R, що дорівнює 0, буде вказувати на те, що між двома змінними немає зв`язку. У разі наявності між ними сильної кореляційної зв`язку коефіцієнт детермінації (R2) буде знаходитися в межах від 0,9 до 0,99. Рівняння, які мають порядок ступеня більше, ніж квадрат і куб, зазвичай характеризуються близькими величинами коефіцієнта детермінації R2.

Серед кривих з високими значеннями коефіцієнта кореляції (R) найбільш придатною для опису даних буде та, яка має найменший порядок ступеня. Для того щоб розрізнити (дискримінувати) ці криві, необхідно використовувати F-критерій.

F-критерій. Зі збільшенням порядку рівняння коефіцієнти (о, з, і d в вищевказаних рівняннях), на які множать незалежну змінну (х - у вищевказаних рівняннях) стають менше. У рівняннях високого порядку спорудження до рівня незалежної змінної буде приводити до того, що будуть виходити дуже великі числові значення (наприклад, 40 тижнів в рівнянні третього порядку превращется в 64 000).

У зв`язку з цим коефіцієнт повинен бути дуже невеликим- в іншому випадку параметр виявиться величезним. Коефіцієнти бувають настільки малі, що не набагато відрізняються від 0. В даному випадку термін вагітності не додає точності рівняння і повинен бути усунутий. F-критерій є варіантом t-критерію, розробленого, щоб протестувати гіпотезу, згідно з якою коефіцієнти (b, с, d, ..., п) рівнянь відрізняються від 0.

Цей критерій дозволяє встановити, переходити чи до рівняння вищого порядку, додаючи коефіцієнти, або можна обійтися без його ускладнення.


Поділитися в соц мережах:

Cхоже