Коефіцієнт кореляції у статистиці. Коефіцієнт Фехнера (коефіцієнт кореляції символів). Значення коефіцієнта кореляції

Коефіцієнт кореляції, запропонований у ІІ–й половині ХІХ століття Р. Т. Фехнером, є найпростішим заходом зв'язку між двома змінними. Він заснований на зіставленні двох психологічних ознак x iі y i, Виміряні на одній і тій же вибірці, в порівнянні знаків відхилень індивідуальних значень від середнього: і
. Висновок кореляції між двома змінними робиться виходячи з підрахунку числа збігів і розбіжностей цих символів.

приклад

Нехай x iі y i- Дві ознаки, виміряні на одній і тій же вибірці піддослідних. Для обчислення коефіцієнта Фехнера необхідно обчислити середні значення кожної ознаки, і навіть кожного значення змінної – знак відхилення від середнього (табл. 8.1):

Таблиця 8.1

x i

y i

Позначення

В таблиці: а- Збіги знаків, b- Розбіжності знаків; n a – кількість збігів, n b – кількість розбіжностей (у разі n a = 4, n b = 6).

Коефіцієнт кореляції Фехнера обчислюється за такою формулою:

(8.1)

У цьому випадку:

Висновок

Між змінними, що досліджуються, існує слабкий негативний зв'язок.

Необхідно відзначити, що коефіцієнт кореляції Фехнера не є досить суворим критерієм, тому його можна використовувати лише на початковому етапі обробки даних та для формулювання попередніх висновків.

8. 4. Коефіцієнт кореляції Пірсона

Вихідний принцип коефіцієнта кореляції Пірсона - використання добутку моментів (відхилень значення змінної від середнього значення):

Якщо сума творів моментів велика та позитивна, то хі упов'язані прямою залежністю; якщо сума велика та негативна, то хі усильно пов'язані зворотною залежністю; нарешті, у разі відсутності зв'язку між xі усума добутків моментів близька до нуля.

Щоб статистика не залежала від обсягу вибірки, береться не сума творів моментів, а середнє значення. Проте розподіл проводиться не так на обсяг вибірки, але в число ступенів свободи n - 1.

Величина
є мірою зв'язку між хі уі називається підступністю хі у.

Багато завдань природничих і технічних наук коваріація є цілком задовільною мірою зв'язку. Її недоліком є ​​те, що діапазон її значень не фіксований, тобто вона може змінюватись у невизначених межах.

Для того, щоб стандартизувати міру зв'язку, необхідно позбавити коваріацію впливу стандартних відхилень. Для цього треба поділити S xyна s x та s y:

(8.3)

де r xy- Коефіцієнт кореляції, або добуток моментів Пірсона.

Загальна формула для обчислення коефіцієнта кореляції виглядає так:

(деякі перетворення)

(8.4)

Вплив перетворення даних на r xy:

1. Лінійні перетворення xі yтипу bx + aі dy + cне змінять величину кореляції між xі y.

2. Лінійні перетворення xі yпри b < 0, d> 0, а також при b> 0 та d < 0 изменяют знак коэффициента корреляции, не меняя его величины.

Достовірність (або, інакше, статистична значимість) коефіцієнта кореляції Пірсона може бути визначена різними способами:

За таблицями критичних значень коефіцієнтів кореляції Пірсона та Спірмена (див. Додаток, табл. XIII). Якщо отримане у розрахунках значення r xy перевищує критичне (табличне) значення цієї вибірки, коефіцієнт Пірсона вважається статистично значимим. Число ступенів свободи в даному випадку відповідає n- 2, де n- Число пар порівнюваних значень (обсяг вибірки).

За таблицею XV Додатків, що має назву «Кількість пар значень, необхідне статистичної значимості коефіцієнта кореляції». У разі необхідно орієнтуватися на коефіцієнт кореляції, отриманий у обчисленнях. Він вважається статистично значущим, якщо обсяг вибірки дорівнює або перевищує табличне число пар значень даного коефіцієнта.

За коефіцієнтом Стьюдента, який обчислюється як ставлення коефіцієнта кореляції до його помилки:

(8.5)

Помилка коефіцієнта кореляції обчислюється за такою формулою:

де m r - помилка коефіцієнта кореляції, r- Коефіцієнт кореляції; n- Число порівнюваних пар.

Розглянемо порядок обчислень та визначення статистичної значущості коефіцієнта кореляції Пірсона на прикладі вирішення наступного завдання.

Умова задачі

22 старшокласники були протестовані за двома тестами: УСК (рівень суб'єктивного контролю) та МКУ (мотивація до успіху). Отримано такі результати (табл. 8.2):

Таблиця 8.2

УСК ( x i)

МКУ ( y i)

УСК ( x i)

МКУ ( y i)

Завдання

Перевірити гіпотезу у тому, що з людей із високим рівнем інтернальності (бал УСК) характерний високий рівень мотивації до успіху.

Рішення

1. Використовуємо коефіцієнт кореляції Пірсона у наступній модифікації (див. формулу 8.4):

Для зручності обробки даних на мікрокалькуляторі (у разі відсутності необхідної комп'ютерної програми) рекомендується оформлення проміжної робочої таблиці наступного виду (табл. 8.3):

Таблиця 8.3

x i y i

x 1 y 1

x 2 y 2

x 3 y 3

x n y n

Σ x i y i

2. Проводимо обчислення та підставляємо значення у формулу:

3. Визначаємо статистичну значущість коефіцієнта кореляції Пірсона трьома способами:

1-й спосіб:

У табл. XIII Додатків знаходимо критичні значення коефіцієнта для 1-го та 2-го рівнів значимості: r кр.= 0,42; 0,54 (ν = n – 2 = 20).

Робимо висновок про те, r xy > rкр . , Т. е. кореляція є статистично значущою для обох рівнів.

2-й спосіб:

Скористаємось табл. XV, в якій визначаємо число пар значень (число досліджуваних), достатнє для статистичної значущості коефіцієнта кореляції Пірсона, що дорівнює 0,58: для 1-го, 2-го та 3-го рівнів значущості воно становить відповідно 12, 18 і 28 .

Звідси робимо висновок у тому, що коефіцієнт кореляції є значним для 1-го і 2-го рівня, але «не дотягує» до 3-го рівня значимості.

3-й спосіб:

Обчислюємо помилку коефіцієнта кореляції та коефіцієнт Стьюдента як відношення коефіцієнта Пірсона до помилки:

У табл. X знаходимо стандартні значення коефіцієнта Стьюдента для 1-го, 2-го та 3-го рівнів значущості при числі ступенів свободи ν = n – 2 = 20: t кр. = 2,09; 2,85; 3,85.

Загальний висновок

Кореляція між показниками тестів УСК та МКУ є статистично значущою для 1-го та 2-го рівнів значущості.

Примітка:

При інтерпретації коефіцієнта кореляції Пірсона необхідно враховувати такі моменти:

    p align="justify"> Коефіцієнт Пірсона може використовуватися для різних шкал (шкала відносин, інтервальна або порядкова) за винятком дихотомічної шкали.

    Кореляційний зв'язок далеко не завжди означає зв'язок причинно-наслідковий. Іншими словами, якщо ми знайшли, припустимо, позитивну кореляцію між зростанням і вагою у групи піддослідних, це зовсім не означає, що зростання залежить від ваги або навпаки (обидві ці ознаки залежать від третьої (зовнішньої) змінної, яка в даному випадку пов'язана з генетичними конституційними особливостями людини).

    r xu » 0 може спостерігатися не тільки за відсутності зв'язку між xі y, а й у разі сильного нелінійного зв'язку (рис. 8.2 а). У разі негативна і позитивна кореляції врівноважуються й у результаті створюється ілюзія відсутності зв'язку.

    r xyможе бути досить малий, якщо сильний зв'язок між хі успостерігається у вужчому діапазоні значень, ніж досліджуваний (рис. 8.2 б).

    Об'єднання вибірок із різними середніми значеннями може створювати ілюзію досить високої кореляції (рис. 8.2 в).

y i y i y i

+ + . .

x i x i x i

Мал. 8.2. Можливі джерела помилок при інтерпретації величини коефіцієнта кореляції (пояснення у тексті (пункти 3 – 5 примітки))

При кореляційному зв'язку разом з досліджуваним фактором або декількома факторами при множинній кореляції на результативну ознаку впливають інші фактори, які не враховуються або не можуть бути точно враховані. При цьому їхня дія може бути спрямована як у бік підвищення результативної ознаки, так і в бік її зниження. Отже, дослідження зв'язку відбувається за умов, коли цей зв'язок більшою чи меншою мірою затушовується суперечливою дією інших причин. Тому одне із завдань кореляційного аналізу полягає у визначенні тісноти зв'язку між ознаками, у визначенні сили впливу досліджуваного фактора (факторів) на результативну ознаку.

Тіснота зв'язку в кореляційному аналізі характеризується за допомогою спеціального відносного показника, який отримав назву коефіцієнта кореляції

При парній лінійної залежностітіснота зв'язку визначається за допомогою лінійного коефіцієнта кореляції

Коефіцієнт кореляції знаходиться в межах від 0 до±1. Якщо коефіцієнт кореляції дорівнює нулю, то зв'язок відсутня, і якщо одиниці, то зв'язок функціональна. Знак при коефіцієнті кореляції свідчить про напрям зв'язку ("+" - прямий"-" - зворотний). Що ближче коефіцієнт кореляції до одиниці, то зв'язок між ознаками вже.

Квадрат коефіцієнта кореляції називається коефіцієнтом детермінації (г2). Він показує, яка частка загальної варіації результативної ознаки визначається фактором, що досліджується. Якщо коефіцієнт детермінації виражений у відсотках, його слід читати так: варіація (коливання) залежної змінної на стільки відсотків обумовлена ​​варіацією чинника.

Між лінійним коефіцієнтом кореляції (г) та коефіцієнтом повної регресії(Ь) зв'язок:

Отже, знаючи коефіцієнт кореляції (г) та значення середніх квадратичних відхилень пох івможна визначити коефіцієнт регресії (Ь) і навпаки, знаючи коефіцієнт регресії (Ь) та відповідні середні квадратичні відхилення можна обчислити коефіцієнт кореляції (г).

При парній лінійній залежності коефіцієнт кореляції та коефіцієнт повної регресії мають однакові знаки (плюс, мінус).

Лінійний коефіцієнт кореляції призначений з метою оцінки ступеня тісноти зв'язку при лінійної залежності. Для випадків нелінійного зв'язку між ознаками використовується інша формула коефіцієнта кореляції, яка випливає із правила складання дисперсій:

З наведеної рівності видно, що чим більший вплив фактора на результативну ознаку, тим більшою мірою її значення дисперсії (м.гр) наближається до значення загальної дисперсії результативної ознаки.

Відповідно, чим більше м.гРі менше ае.гртим зв'язок між ознаками буде вже й навпаки. Отже, відношення міжгрупової (факторної) та загальної дисперсій використовується для оцінки тісноти зв'язку між ознаками. Формула коефіцієнта кореляції має вигляд:

Враховуючи, що сг2я = о-а-вугілля!>, формулу коефіцієнта кореляції можна представити як

Обидві формули коефіцієнта кореляції застосовуються для розрахунку тісноти зв'язку за будь-якої форми зв'язку.

З правила складання дисперсій видно, значення коефіцієнта кореляції перебуває у межах від 0 до 1. Знак коефіцієнта кореляції з формули не виводиться. Якщо вивчається зв'язок між двома ознаками (парна проста кореляція), напрям зв'язку (знак перед г) визначається безпосередньо за знаком перед коефіцієнтом регресії лінійного рівняння.

При парній криволінійній залежності, тіснота зв'язку при лінійній залежності визначається за допомогою спеціального показника, аналогічного розглянутому вище коефіцієнта кореляції р.

Цей показник (щоб наголосити на його приналежності до криволінійного зв'язку) позначають символом іг і називають індексом кореляції:

Числове значення індексу кореляції аналогічне коефіцієнту кореляції: якщо іг= 1 - зв'язок функціональний, якщо іг= 0 – зв'язок відсутній; чим іг ближче до одиниці, тим зв'язок між ознаками тісніше.

Якщо відомі коефіцієнти регресії рівняння зв'язку, то індекс кореляції можна визначити за іншою, більш простою формулою. Так, при параболічній залежності формула індексу кореляції може бути представлена ​​як

Тіснота зв'язку при множинній кореляції визначається за допомогою коефіцієнта множинної кореляції (її) та коефіцієнта множинної детермінації (2).За змістом вони аналогічні коефіцієнтам кореляції та детермінації при парному зв'язку. їх обчислення ґрунтується на порівнянні міжгрупової (факторної) та загальної дисперсій:

Ця формула може бути застосована для визначення тісноти зв'язку за будь-якої форми зв'язку.

Розмір рч. змінюється від 0 до 1 і розглядається як позитивна, оскільки при багатьох залежностях зв'язок результативної ознаки з одними факторами може бути позитивним, а з іншими - негативним.

Для випадку залежності результативної ознаки від двох факторів формула коефіцієнта множинної кореляції має вигляд

де Гі – парні лінійні коефіцієнти кореляції.

Наведена формула застосовується визначення тісноти зв'язку при лінійної залежності.

Для визначення тісноти зв'язку між результативною ознакою і кожним фактором при виключенні впливу інших факторів визначають приватні коефіцієнти кореляції, які характеризують "чистий" вплив фактора на результативну ознаку. Для розрахунку використовуються парні коефіцієнти кореляції.

У разі залежності результативної ознаки від двох факторів (х1 та х2) можна розрахувати три коефіцієнти часткової кореляції:

1) між ві х1 за винятком впливу х2:

Коефіцієнти кореляції при парних та множинних зв'язків, а також індекс кореляції - це відносні величини, тому вони можуть бути використані для зіставлення тісноти зв'язку за декількома явищами, які аналізуються.

Слід пам'ятати, що показники тісноти зв'язку залежить від розмаху варіювання досліджуваних ознак. Що більше варіація змінних, то вище буде величина показників тісноти зв'язку.

Визначимо тісноту зв'язку між досліджуваними ознаками нашого прикладу. Оскільки між продуктивністю корів та рівнем годування має місце лінійний зв'язок, тісноту зв'язку визначимо за допомогою лінійного коефіцієнта кореляції.

Коефіцієнт кореляції показує, що між продуктивністю корів та рівнем годівлі має місце тісний (сильний) зв'язок.

p align="justify"> Коефіцієнт детермінації г2 = 0,93442 = 0,8731 показує, що 87,31% загального коливання продуктивності корів обумовлено відмінностями в рівні годування, а решта 12,69% (100 - 87,31) - іншими факторами, які в даному випадку не було враховано.

Коефіцієнт кореляції можна знайти і за іншими формулами.

Різні ознаки можуть бути пов'язані між собою.

Виділяють 2 види зв'язку між ними:

  • функціональна;
  • кореляційна.

Кореляціяу перекладі російською мовою – не що інше, як зв'язок.
У разі кореляційного зв'язку простежується відповідність кількох значень однієї ознаки кільком значенням іншої ознаки. Як приклади можна розглянути встановлені кореляційні зв'язки між:

  • довжиною лап, шиї, дзьоба у таких птахів як чаплі, журавлі, лелеки;
  • показниками температури тіла та частоти серцевих скорочень.

Більшість медико-біологічних процесів статистично доведено присутність цього зв'язку.

Статистичні методи дають змогу встановити факт існування взаємозалежності ознак. Використання цього спеціальних розрахунків призводить до встановлення коефіцієнтів кореляції (заходи пов'язаності).

Такі розрахунки дістали назву кореляційний аналіз.Він проводиться на підтвердження залежності друг від друга 2-х змінних (випадкових величин), що виражається коефіцієнтом кореляції.

Використання кореляційного методу дозволяє вирішити декілька завдань:

  • виявити наявність взаємозв'язку між аналізованими параметрами;
  • знання наявності кореляційного зв'язку дозволяє вирішувати проблеми прогнозування. Так, існує реальна можливість передбачати поведінку параметра на основі аналізу поведінки іншого параметра, що корелює;
  • проведення класифікації з урахуванням підбору незалежних друг від друга ознак.

Для змінних величин:

  • що належать до порядкової шкали, розраховується коефіцієнт Спірмена;
  • що відносяться до інтервальної шкали - коефіцієнт Пірсона.

Це найчастіше використовувані параметри, крім них є інші.

Значення коефіцієнта може бути як позитивним, і негативними.

У першому випадку зі збільшенням значення однієї змінної спостерігається збільшення другої. При негативному коефіцієнті закономірність зворотна.

Навіщо потрібен коефіцієнт кореляції?

Випадкові величини, Пов'язані між собою, можуть мати зовсім різну природу цього зв'язку. Не обов'язково вона буде функціональною, випадок коли простежується пряма залежність між величинами. Найчастіше на обидві величини діє ціла сукупність різноманітних факторів, у випадках, коли вони є загальними для обох величин, спостерігається формування пов'язаних закономірностей.

Це означає, що доведений статистично факт наявності зв'язку між величинами не є підтвердженням того, що встановлено причину змін, що спостерігаються. Як правило, дослідник робить висновок про наявність двох взаємозалежних наслідків.

Властивості коефіцієнта кореляції

Цій статистичній характеристиці притаманні такі властивості:

  • значення коефіцієнта знаходиться в діапазоні від -1 до +1. Чим ближче до крайніх значень, тим сильніший позитивний або негативний зв'язок між лінійними параметрами. У разі нульового значення йдеться про відсутність кореляції між ознаками;
  • позитивне значення коефіцієнта свідчить у тому, що разі збільшення значення однієї ознаки спостерігається збільшення другого (позитивна кореляція);
  • негативне значення – у разі збільшення значення однієї ознаки спостерігається зменшення другої (негативна кореляція);
  • наближення значення показника до крайніх точок (або -1 або +1) свідчить про наявність дуже сильного лінійного зв'язку;
  • показники ознаки можуть змінюватись при незмінному значенні коефіцієнта;
  • кореляційний коефіцієнт є безрозмірною величиною;
  • наявність кореляційного зв'язку перестав бути обов'язковим підтвердженням причинно-наслідкового зв'язку.

Значення коефіцієнта кореляції

Охарактеризувати силу кореляційного зв'язку можна вдавшись до шкали Челдока, у якій певному числовому значенню відповідає якісна характеристика.

У разі позитивної кореляції при значенні:

  • 0-0,3 - кореляційний зв'язок дуже слабкий;
  • 0,3-0,5 – слабка;
  • 0,5-0,7 – середньої сили;
  • 0,7-0,9 – висока;
  • 0,9-1 – дуже висока сила кореляції.

Шкала може використовуватись і для негативної кореляції. І тут якісні характеристики замінюються на протилежні.

Можна скористатися спрощеною шкалою Челдока, в якій виділяється всього 3 градації сили кореляційного зв'язку:

  • дуже сильна - показники ±0,7 - ±1;
  • середня – показники ±0,3 – ±0,699;
  • дуже слабка – показники 0 – ±0,299.

Даний статистичний показникдозволяє як перевірити припущення про існування лінійної взаємозв'язку між ознаками, а й встановити її силу.

Види коефіцієнта кореляції

Коефіцієнти кореляції можна класифікувати за знаком і значенням:

  • позитивний;
  • нульовий;
  • негативний.

Залежно від аналізованих значень розраховується коефіцієнт:

  • Пірсона;
  • Спірмена;
  • Кендалу;
  • знаків Фехнера;
  • конкордації чи множинної рангової кореляції.

Кореляційний коефіцієнт Пірсона використовується встановлення прямих зв'язків між абсолютними значеннями змінних. При цьому розподіл обох рядів змінних має наближатися до нормального. Порівнянні змінні повинні відрізнятися однаковим числом ознак, що варіюють. Шкала, що представляє змінні, має бути інтервальної чи шкалою відносин.

  • точного встановлення кореляційної сили;
  • порівняння кількісних ознак.

Недоліків використання лінійного кореляційного коефіцієнта Пірсона небагато:

  • метод нестійкий у разі викидів числових значень;
  • за допомогою цього методу можливе визначення кореляційної сили тільки для лінійного взаємозв'язку, за інших видів взаємних зв'язків змінних слід використовувати методи регресійного аналізу.

Рангова кореляція визначається методом Спірмена, що дозволяє статистично досліджувати зв'язок між явищами. Завдяки цьому коефіцієнту обчислюється фактично існуючий рівень паралелізму двох кількісно виражених рядів ознак, і навіть оцінюється тіснота, виявленої зв'язку.

  • що не потребують точного визначення значення кореляційної сили;
  • порівнювані показники мають як кількісні, і атрибутивні значення;
  • рівняння рядів ознак із відкритими варіантами значень.

Метод Спірмена відноситься до методів непараметричного аналізу, тому немає потреби перевіряти нормальність розподілу ознаки. До того ж, він дозволяє порівнювати показники, виражені в різних шкалах. Наприклад, порівняння значень кількості еритроцитів у певному обсязі крові (безперервна шкала) та експертної оцінки, що виражається в балах (порядкова шкала).

На ефективність методу негативно впливає велика різниця між значеннями порівнюваних величин. Неефективний метод і у випадках, коли вимірювана величина характеризується нерівномірним розподілом значень.

Покроковий розрахунок коефіцієнта кореляції в Excel

Розрахунок кореляційного коефіцієнта передбачає послідовне виконання низки математичних операцій.

Наведена вище формула розрахунку коефіцієнта Пірсона, показує наскільки трудомісткий цей процес, якщо виконувати його вручну.
Використання можливостей Excell прискорює процес знаходження коефіцієнта у рази.

Достатньо дотримати нескладний алгоритм дій:

  • введення базової інформації - стовпець значень х і стовпець значень у;
  • в інструментах вибирається та відкривається вкладка «Формули»;
  • у вкладці вибирається «Вставка функції fx»;
  • у діалоговому вікні, що відкрилося, вибирається статистична функція «Коррел», що дозволяє виконати розрахунок кореляційного коефіцієнта між 2 масивами даних;
  • вікно, що відкрилося, вносяться дані: масив 1 - діапазон значень стовпця х (дані необхідно виділити), масив 2 - діапазон значень стовпця у;
  • натискається клавіша "ок", у рядку "значення" з'являється результат розрахунку коефіцієнта;
  • висновок щодо наявності кореляційного зв'язку між 2 масивами даних та її силою.

Коротка теорія

До найпростіших показників тісноти зв'язку відносять коефіцієнт кореляції знаків, запропонований німецьким ученим Г.Фехнером. Цей показник ґрунтується на оцінці ступеня узгодженості напрямів відхилень індивідуальних значень факторної та результативної ознак від відповідних середніх. Для його розрахунку обчислюють середні значення результативної та факторної ознак, а потім проставляють знаки відхилень для всіх значень взаємопов'язаних пар ознак.

Якщо ввести позначення: – кількість збігів знаків відхилень індивідуальних величин від середньої, – кількість розбіжностей знаків відхилень, то коефіцієнт Фехнера можна записати таким чином:

Коефіцієнт Фехнер може приймати різні значення в межах від -1 до +1. Якщо знаки всіх відхилень збігатимуться, то і тоді показник дорівнюватиме 1, що свідчить про можливу наявність прямого зв'язку. Якщо ж знаки всіх відхилень будуть різними, тоді і коефіцієнт Фехнера дорівнюватиме -1, що дає підставу припустити наявність зворотного зв'язку.

Приклад розв'язання задачі

Умова задачі

Є дані про поголів'я великої рогатої худоби по 12 сільгосппідприємствах на 1 січня та середньорічному надої молока на одну корову. Визначте частоту зв'язку між цими факторами за допомогою коефіцієнта кореляції Фехнера.

№ п/п сільськогосподарських підприємств 1 1.2 35.8 2 1.6 30.0 3 2.8 34.8 4 1.8 31.3 5 2.9 36.9 6 3 37.1 7 1.6 27.9 8 1.7 30.0 9 2.6 35.8 10 1.3 32.1 11 2 29.1 12 3.3 34.3

Рішення завдання

Складемо розрахункову таблицю:

№ п/п сільськогосподарських підприємств Поголів'я великої рогатої худоби на 1 січня, тис.голів Середньорічний надій на одну корову, кг 1 1.2 35.8 1.44 1281.64 42.96 2 1.6 30 2.56 900 48 3 2.8 34.8 7.84 1211.04 97.44 4 1.8 31.3 3.24 979.69 56.34 5 2.9 36.9 8.41 1361.61 107.01 6 3 37.1 9 1376.41 111.3 7 1.6 27.9 2.56 778.41 44.64 8 1.7 30 2.89 900 51 9 2.6 35.8 6.76 1281.64 93.08 10 1.3 32.1 1.69 1030.41 41.73 11 2 29.1 4 846.81 58.2 12 3.3 34.3 10.89 1176.49 113.19 Разом 25.8 395.1 61.28 13124.15 864.89

Коефіцієнт Фехнера можна обчислити за такою формулою:

Число збігів знаків відхилень індивідуальних величин від середньої, - число розбіжностей знаків відхилень

1.2 35.8 1.6 30 2.8 34.8 1.8 31.3 2.9 36.9 3 37.1 1.6 27.9 1.7 30 2.6 35.8 1.3 32.1 2 29.1 3.3 34.3
Знаки відхилень від середньої Збіг (або розбіжність знаків 1 - + b 2 - - a 3 + + a 4 - - a 5 + + a 6 + + a 7 - - a 8 - - a 9 + + a 10 - - a 11 - - a 12 + + a

Зазвичай таке значення показника тісноти зв'язку характеризує сильну залежність, однак, слід мати на увазі, що оскільки коефіцієнт залежить тільки від знаків і не враховує величину самих відхилень та від їх середніх величин, то він практично характеризує не так тісноту зв'язку, скільки її наявність та напрямок .

На ціну сильно впливає терміновість рішення (від доби до кількох годин). Онлайн-допомога на іспиті/заліку здійснюється за попереднім записом.

Заявку можна залишити прямо в чаті, попередньо скинувши умову завдань та повідомивши необхідні вам терміни вирішення. Час відповіді – кілька хвилин.

Висновки:

Отримана величина коефіцієнта кореляції знаків дорівнює нулю, оскільки кількість збігів і кількість розбіжностей знаків рівні. Це основний недолік цього показника. За цим показником можна припускати, що зв'язок відсутній.

Лінійний коефіцієнт кореляції

Перевірка суттєвості коефіцієнта кореляції:

Висновки:

Отримана величина лінійного коефіцієнта кореляції свідчить про наявність зворотної залежності.

Отже, з ймовірністю 95% можна припустити, що кореляційний зв'язок все ж таки істотний.

Емпіричне кореляційне відношення:

Перевірка значимості емпіричного кореляційного відношення:

Висновки:

Отримане значення емпіричного кореляційного відношення свідчить про помірний зв'язок між досліджуваними ознаками.

Отже, з ймовірністю 95% можна дійти невтішності кореляційної зв'язку між аналізованими показниками.

Коефіцієнт кореляції рангів Спірмена:

Висновки:

За результатами розрахунку коефіцієнта Спірмена можна припустити про наявність слабкої зворотної залежності між часткою в загальному обсязі поставок видів палива, що спалюються, і очікуваною тривалістю життя при народженні.

Коефіцієнт кореляції рангів Кендела:

Висновки:

За розрахованим коефіцієнтом кореляції рангів можна вважати наявність слабкої зворотної залежності між досліджуваними ознаками.

· Перевірка можливості використання лінійної функціїяк форма взаємозв'язку

Вважається за можливе застосовувати лінійне рівняннякореляційної залежності, але для перевірки гіпотези про лінійну залежність більш ефективно використовувати величину .

Висновки:

Отже, гіпотеза про лінійність зв'язку між часткою в загальному обсязі поставок видів палива, що спалюються, і очікуваною тривалістю життя при народженні вірна.



Країни із середнім рівнем розвитку людського потенціалу

· Виявлення факту наявності взаємозв'язку між факторною та результативною ознакою

Аналітичне угруповання

Емпірична лінія регресії


Висновки:

Порівнявши середні значення результативної ознаки за групами, можна побачити таку тенденцію: чим вища частка в загальному обсязі поставок палив, що спалюються, тим більша очікувана тривалість життя при народженні (якщо не враховувати стрибки, можливо зумовлені іншими факторами), тобто можна припустити наявність пряма кореляційна залежність між ознаками.

Поле кореляції


Висновки:

Основна частина одиниць формує хмару, що розташовується в основному з лівого нижнього кута системи координат у верхній правий кут, можна припустити наявність прямого взаємозв'язку між ознаками.

Кореляційна таблиця

При групуванні за факторною ознакою число груп дорівнює 6. При групуванні за результативною ознакою встановимо число груп, рівну числугруп за факторним ознакою, т. е. . Також виключимо країни, за якими відсутні дані за факторною ознакою, кількість країн скоротилася до тридцяти, тобто.

Тепер складаємо кореляційну таблицю:

Кореляційна таблиця Середня очікувана тривалість життя при народженні, років
52,0-57,2 57,2-62,4 62,4-67,6 67,6-70,1 70,1-72,6 72,6-75,1 Разом
Частка в загальному обсязі поставок видів палива, що спалюються, % 15-30
30-45
45-60
60-75
75-90
90-100
Разом

Висновки:

Трудно визначити напрямок кореляційного зв'язку, в основному частоти в кореляційній таблиці розташовані на діагоналі з лівого верхнього кута в правий нижній кут, тобто великим значенням факторної ознаки відповідають великі значення результативної, отже, можна припустити наявність прямої кореляційної залежності між ознаками.

· Показники оцінки ступеня тісноти взаємозв'язку