Як скласти рівняння регресії.

Як лікар встановлює діагноз? Він розглядає сукупність ознак (симптомів), а потім приймає рішення про хворобу. Насправді, він усього лише робить певний прогноз, спираючись на деяку сукупність ознак. Цю задачу легко формалізувати. Очевидно, що як встановлені симптоми, так і діагнози в якійсь мірі випадкові. Саме з такого роду первинних прикладів починається побудова регресійного аналізу.
Інструкція
1
Основне завдання регресійного аналізу - встановлення прогнозів про значення якої-небудь випадкової величини, на основі даних про іншу величині. Нехай безліч факторів, що впливають на прогноз випадкова величина - Х, а безліч прогнозів - випадкова величина Y. Прогноз повинен бути конкретним, тобто необхідно вибрати значення випадкової величини Y = y. Це значення (оцінка Y = y *) вибирається на основі критерію якості оцінки (мінімуму дисперсії).
2
За оцінку в регресійному аналізі беруть апостеріорне математичне сподівання. Якщо щільність ймовірності випадкової величини Y позначити p (y), то апостериорная щільність позначається як p (y | X = x) або p (y | x). Тоді y * = M {Y | = x} =? Yp (y | x) dy (мається увазі інтеграл по вcем значенням). Дана оптимальна оцінка y *, розглянута як функція х, називається регресією Y на X.
3
Будь прогноз може залежати від безлічі факторів, виникає багатофакторна регресія. Однак в даному випадку слід обмежитися однофакторной регресією, пам'ятаючи, що в деяких випадках набір прогнозів традиційний і може бути розглянутий як єдиний у всій своїй сукупності (скажімо ранок - це схід сонця, закінчення ночі, найвища точка роси, найсолодший сон ...) .
4
Найбільш широкого поширення набула лінійна регресія y = a + Rx. Число R називається коефіцієнтом регресії . Рідше зустрічається квадратична - y = с + bx + ax ^ 2.
5
Визначення параметрів лінійної і квадратичної регресії можна здійснити за допомогою методу найменших квадратів, який ґрунтується на вимозі мінімальної суми квадратів відхилень табличній функції від апроксимуючої величини. Його застосування для лінійної і квадратичної апроксимацій призводить до систем лінійних рівнянь щодо коефіцієнтів (див. Рис. 1а і 1b):
6
Проводити обчислення «вручну» вкрай трудомістким. Тому доведеться обмежитися самим коротким прикладом. Для практичної роботи вам буде потрібно використовувати програмне забезпечення, призначене для розрахунку мінімальної суми квадратів, якого, в принципі, досить багато.
7
Приклад. Нехай чинники: х1 = 0, х2 = 5, х3 = 10. Прогнози: y1 = 2,5, y2 = 11, y = 23. Знайти рівняння лінійної регресії. Рішення. Складіть систему рівнянь (див. Рис. 1а) і вирішите його будь-яким способом.3a + 15R = 36,5 і 15а + 125R = 285. R = 2,23; a = 3,286. y = 3,268 + 2,23.
Зверніть увагу
Зауваження. Для встановлення лінійної регресії можна використовувати кореляційний аналіз.