Як розрахувати коефіцієнт кореляції.

За визначенням, коефіцієнтом кореляції (нормованим кореляційним моментом) називається відношення кореляційного моменту системи двох випадкових величин (ССВ) до його максимального значення. Для того щоб розібратися в суті цього питання, необхідно, перш за все, познайомитися з поняттям кореляційного моменту.
Вам знадобиться
  • - папір;
  • - ручка.
Інструкція
1
Визначення: Кореляційним моментом ССВ X і Y називається змішаний центральний момент другого порядку (див. Рис.1) Тут W (x, y) - спільна щільність ймовірності ССВ Кореляційний момент є характеристикою: а) взаємного розкиду значень ССВ щодо точки середніх значень або математичних очікувань (mx, my); б) ступеня лінійного зв'язку між СВ Х і Y.
2
Властивості кореляційного момента.1. R (xy) = R (yx) - з визначення. 2. Rxx = Dx (дисперсії) - з визначення. 3. Для незалежних Х і Y R (xy) = 0. Дійсно, при цьому M {Xц, Yц} = M {Xц} M {Yц} = 0. В даному випадку це відсутність лінійного зв'язку, але не будь-який, а, скажімо, квадратичной. 4. За наявності «жорсткої лінійного зв'язку між X і Y, Y = aX + b - | R (xy) | = бxбy = max.5. -бxбy? R (xy)? бxбy.
3
Тепер повернемося до розгляду коефіцієнта кореляції r (xy), сенс якого полягає в лінійного зв'язку між СВ. Його значення змінюється від -1 до +1, крім того він не володіє розмірністю. У відповідності зі сказаним, можна записати: R (xy) = R (xy)/бxбy (1)
4
Для пояснення сенсу нормованого кореляційного моменту, уявіть собі, що отримані дослідним шляхом значення СВ Х і Y є координатами точки на площині. При наявності «жорсткої» лінійного зв'язку ці точки в точності ляжуть на пряму лінію Y = aX + b. Возьмтіе тільки позитивні значення кореляції (при а
5
При r (xy) = 0 всі отримані точки опиняться всередині еліпса з центром в (mx, my), величина півосей якого визначається значеннями дисперсій СВ.На цьому питання про розрахунок r (xy), здавалося б, можна вважати вичерпаним (див. формулу (1)). Проблема полягає в тому, що дослідник, який отримав значення СВ експериментально, не може на всі 100% знати щільність ймовірності W (x, y). Тому краще вважати, що в поставленому завданню розглядаються вибіркові значення СВ (тобто отриманими в досвіді), і використовувати оцінки потрібних величин. Тоді оцінка mx * = (1/n) (x1 + x2 + ... + xn) (для СВ Y аналогічно). Dx * = (1/(n-1)) ((x1- mx *) ^ 2 + (x2- mx *) ^ 2 + ... + (xn- mx *) ^ 2). R * x = (1/(n-1)) ((x1- mx *) (y1- my *) + (x2- mx *) (y2- my *) + ... + (xn- mx *) (yn - my *)). бx * = sqrtDx (те ж для СВ Y). Тепер можна сміливо для оцінок використовувати формулу (1).