Як розрахувати коефіцієнт кореляції

За визначенням, коефіцієнтом кореляції (нормованим кореляційним моментом) називається відношення кореляційного моменту системи двох випадкових величин (ССВ) до його максимального значення. Для того щоб розібратися в суті цього питання, необхідно, насамперед, познайомитися з поняттям кореляційного моменту.
Як розрахувати коефіцієнт кореляції




Вам знадобиться
  • - папір;
  • - ручка.
Інструкція
1
Як розрахувати коефіцієнт кореляції
Визначення: Кореляційним моментом ССВ X і Y називається змішаний центральний момент другого порядку (див. Рис.1)
Тут W (x, y) - спільна щільність ймовірності ССВ
Кореляційний момент є характеристикою: а) взаємного розкиду значень ССВ щодо точки середніх значень або математичних очікувань (mx, my) - б) ступеня лінійного зв'язку між СВ Х і Y.


2
Властивості кореляційного моменту.
1. R (xy) = R (yx) - з визначення.
2. Rxx = Dx (дисперсії) - з визначення.
3. Для незалежних Х і YR (xy) = 0.
Дійсно, при цьому M {Xц, Yц} = M {Xц} M {Yц} = 0. В даному випадку це відсутність лінійного зв'язку, але не будь, а, скажімо, квадратичної.
4. При наявності «жорсткої лінійного зв'язку між X і Y, Y = aX + b - | R (xy) | = бxбy = max.
5. -бxбy? R (xy)? Бxбy.
3
Тепер повернемося до розгляду коефіцієнта кореляції r (xy), сенс якого полягає в лінійного зв'язку між СВ. Його значення змінюється від -1 до +1, крім того він не володіє розмірністю. У відповідності зі сказаним, можна записати:
R (xy) = R (xy) / бxбy (1)
4
Як розрахувати коефіцієнт кореляції
Для пояснення сенсу нормованого кореляційного моменту, уявіть собі, що отримані дослідним шляхом значення СВ Х і Y є координатами точки на площині. При наявності «жорсткої» лінійного зв'язку ці точки в точності ляжуть на пряму лінію Y = aX + b. Возьмтіе тільки позитивні значення кореляції (при а
5
При r (xy) = 0 всі отримані точки виявляться всередині еліпса з центром в (mx, my), величина півосей якого визначається значеннями дисперсій СВ.
На цьому питання про розрахунок r (xy), здавалося б, можна вважати вичерпаним (див. Формулу (1)). Проблема полягає в тому, що дослідник, який отримав значення СВ експериментально, не може на всі 100% знати щільність ймовірності W (x, y). Тому краще вважати, що в поставленому завданню розглядаються вибіркові значення СВ (тобто отриманими в досвіді), і використовувати оцінки потрібних величин. Тоді оцінка
mx * = (1 / n) (x1 + x2 + ... + xn) (для СВ Y аналогічно). Dx * = (1 / (n-1)) ((x1- mx *) ^ 2 + (x2- mx *) ^ 2 + ...
+(Xn- mx *) ^ 2). R * x = (1 / (n-1)) ((x1- mx *) (y1- my *) + (x2- mx *) (y2- my *) + ... + (xn- mx *) (yn - my *)). бx * = sqrtDx (те ж для СВ Y).
Тепер можна сміливо для оцінок використовувати формулу (1).
Переглядів: 4422

Увага, тільки СЬОГОДНІ!