Як порахувати кореляцію. Як в екселя зробити кореляцію.

Кореляцією називають взаємну залежність двох випадкових величин (частіше - двох груп величин), при якій зміна однієї з них призводить і до зміни іншої. Коефіцієнт кореляції показує, наскільки ймовірно зміна другої величини при зміні значень першої, тобто ступінь її залежності. Найпростіший спосіб обчислення цієї величини - скористатися відповідною функцією, вбудованої в табличний редактор Microsoft Office Excel.
Вам знадобиться
  • Табличний редактор Microsoft Office Excel.
Інструкція
1
Запустіть Excel і відкрийте документ, що містить групи даних, коефіцієнт кореляції між якими потрібно обчислити. Якщо такого документа ще не створено, то введіть дані в порожню таблицю - табличний редактор створює її автоматично при запуску програми. Кожну з груп значень, кореляція між якими вас цікавить, вводите в окрему колонку. Це не обов'язково повинні бути сусідні колонки, ви вільні оформити таблицю найбільш зручним чином - додати додаткові стовпці з поясненнями до даних, заголовки колонок, підсумкові комірки з сумарними або середніми значеннями і т.д. Можна навіть розташовувати дані не в вертикальному (в колонках), а в горизонтальному (в рядках) напрямку. Єдина вимога, яку треба дотримуватися - комірки з даними кожної групи повинні розташовуватися послідовно одна за одною, щоб таким чином створювався безперервний масив.
2
Перейдіть в комірку, яка повинна буде містити значення кореляції даних двох масивів, і клікніть в меню Excel закладку «Формули». В групі команд «Бібліотека функцій» клацніть по найостаннішої піктограмі - «Інші функції». Розкриється список, що випадає, в якому вам слід перейти в розділ «Статистичні» і вибрати функцію КОРРЕЛ. В результаті відкриється вікно майстра функцій з формою, призначеної для заповнення. Це ж вікно можна викликати і без вкладки «Формули», просто клацнувши по піктограмі вставки функції, розміщеної лівіше рядка формул.
3
Вкажіть першу групу корелюють даних в поле «массив1» майстра формул. Щоб ввести діапазон комірок вручну наберіть адресу першої та останньої клітин, розділивши їх двокрапкою (без пробілів). Інший варіант - просто виділіть потрібний діапазон мишкою, а потрібний запис в це поле форми Excel помістить самостійно. Таку ж операцію треба виконати і з другою групою даних в поле «массів2».
4
Натисніть кнопку OK. Табличний редактор розрахує і відобразить значення кореляції в осередку з формулою. При необхідності ви можете зберегти цей документ для подальшого використання (поєднання клавіш Ctrl + S).
За визначенням, коефіцієнтом кореляції (нормованим кореляційним моментом) називається відношення кореляційного моменту системи двох випадкових величин (ССВ) до його максимального значення. Для того щоб розібратися в суті цього питання, необхідно, перш за все, познайомитися з поняттям кореляційного моменту.
Вам знадобиться
  • - папір;
  • - ручка.
Інструкція
1
Визначення: Кореляційним моментом ССВ X і Y називається змішаний центральний момент другого порядку (див. Рис.1) Тут W (x, y) - спільна щільність ймовірності ССВ Кореляційний момент є характеристикою: а) взаємного розкиду значень ССВ щодо точки середніх значень або математичних очікувань (mx, my); б) ступеня лінійного зв'язку між СВ Х і Y.
2
Властивості кореляційного момента.1. R (xy) = R (yx) - з визначення. 2. Rxx = Dx (дисперсії) - з визначення. 3. Для незалежних Х і Y R (xy) = 0. Дійсно, при цьому M {Xц, Yц} = M {Xц} M {Yц} = 0. В даному випадку це відсутність лінійного зв'язку, але не будь-який, а, скажімо, квадратичной. 4. За наявності «жорсткої лінійного зв'язку між X і Y, Y = aX + b - | R (xy) | = бxбy = max.5. -бxбy? R (xy)? бxбy.
3
Тепер повернемося до розгляду коефіцієнта кореляції r (xy), сенс якого полягає в лінійного зв'язку між СВ. Його значення змінюється від -1 до +1, крім того він не володіє розмірністю. У відповідності зі сказаним, можна записати: R (xy) = R (xy)/бxбy (1)
4
Для пояснення сенсу нормованого кореляційного моменту, уявіть собі, що отримані дослідним шляхом значення СВ Х і Y є координатами точки на площині. При наявності «жорсткої» лінійного зв'язку ці точки в точності ляжуть на пряму лінію Y = aX + b. Возьмтіе тільки позитивні значення кореляції (при а
5
При r (xy) = 0 всі отримані точки опиняться всередині еліпса з центром в (mx, my), величина півосей якого визначається значеннями дисперсій СВ.На цьому питання про розрахунок r (xy), здавалося б, можна вважати вичерпаним (див. формулу (1)). Проблема полягає в тому, що дослідник, який отримав значення СВ експериментально, не може на всі 100% знати щільність ймовірності W (x, y). Тому краще вважати, що в поставленому завданню розглядаються вибіркові значення СВ (тобто отриманими в досвіді), і використовувати оцінки потрібних величин. Тоді оцінка mx * = (1/n) (x1 + x2 + ... + xn) (для СВ Y аналогічно). Dx * = (1/(n-1)) ((x1- mx *) ^ 2 + (x2- mx *) ^ 2 + ... + (xn- mx *) ^ 2). R * x = (1/(n-1)) ((x1- mx *) (y1- my *) + (x2- mx *) (y2- my *) + ... + (xn- mx *) (yn - my *)). бx * = sqrtDx (те ж для СВ Y). Тепер можна сміливо для оцінок використовувати формулу (1).