Коефициент на корелация в статистиката. Коефициент на Фехнер (коефициент на корелация на знака). Стойности на коефициента на корелация

Коефициентът на корелация, предложен през втората половина на 19 век от G. T. Fechner, е най-простата мярка за връзката между две променливи. Тя се основава на сравнение на два психологически признака х ии г иизмерено на същата проба, чрез сравняване на признаците на отклонения на отделните стойности от средната стойност: и
. Заключението за корелацията между две променливи се прави на базата на преброяване на съвпаденията и несъответствията на тези признаци.

Пример

Нека бъде х ии г и- две характеристики, измерени на една и съща извадка от субекти. За да се изчисли коефициентът на Фехнер, е необходимо да се изчислят средните стойности за всяка характеристика, както и за всяка стойност на променливата - знакът на отклонението от средната стойност (Таблица 8.1):

Таблица 8.1

х и

г и

Обозначаване

На масата: а- съвпадение на знаци б- несъответствия на знаците; н a е броят на съвпаденията, н b е броят на несъответствията (в този случай на = 4 н b = 6).

Коефициентът на корелация на Фехнер се изчислява по формулата:

(8.1)

В такъв случай:

Заключение

Има слаба отрицателна връзка между изследваните променливи.

Трябва да се отбележи, че коефициентът на корелация на Фехнер не е достатъчно строг критерий, поради което може да се използва само в началния етап на обработка на данните и за формулиране на предварителни заключения.

8. 4. Коефициент на корелация на Пиърсън

Първоначалният принцип на коефициента на корелация на Пиърсън е използването на произведението на моментите (отклонения на стойността на променливата от средната стойност):

Ако сборът от произведенията на моментите е голям и положителен, тогава хи всвързани чрез пряка зависимост; ако сборът е голям и отрицателен, тогава хи всилно свързани чрез обратна връзка; И накрая, ако няма връзка между хи всумата от произведенията на моментите е близка до нула.

За да не зависи статистиката от размера на извадката, се взема не сумата от произведенията на моментите, а средната стойност. Разделянето обаче се прави не по размера на извадката, а по броя на степените на свобода. н - 1.

Стойност
е мярка за връзката между хи ви се нарича ковариация хи в.

В много проблеми на природните и техническите науки ковариацията е напълно задоволителна мярка за свързаност. Недостатъкът му е, че диапазонът на неговите стойности не е фиксиран, тоест може да варира в неопределени граници.

За да се стандартизира мярката за асоцииране, е необходимо да се освободи ковариацията от влиянието на стандартните отклонения. За да направите това, трябва да разделите С xyна сх и с y:

(8.3)

където r xyе коефициентът на корелация или произведението на моментите на Пиърсън.

Общата формула за изчисляване на коефициента на корелация е както следва:

(някои трансформации)

(8.4)

Влияние на трансформацията на данни върху r xy:

1. Линейни трансформации хи гТип bx + аи dy + ° Сняма да промени големината на корелацията между хи г.

2. Линейни трансформации хи гв б < 0, д> 0, както и б> 0 и д < 0 изменяют знак коэффициента корреляции, не меняя его величины.

Надеждността (или, с други думи, статистическата значимост) на коефициента на корелация на Пиърсън може да се определи по различни начини:

Според таблиците на критичните стойности на коефициентите на корелация на Пиърсън и Спирман (вижте Приложение, Таблица XIII). Ако изчислената стойност r xy надвишава критичната (таблична) стойност за тази извадка, коефициентът на Пиърсън се счита за статистически значим. Броят на степените на свобода в този случай съответства на н– 2, където н– брой двойки сравнени стойности (размер на извадката).

Съгласно таблица XV ​​от приложението, което е озаглавено „Брой двойки стойности, необходими за статистическата значимост на коефициента на корелация“. В този случай е необходимо да се съсредоточи върху коефициента на корелация, получен при изчисленията. Счита се за статистически значим, ако размерът на извадката е равен или по-голям от табличния брой двойки стойности за даден коефициент.

Според коефициента на Студент, който се изчислява като отношение на коефициента на корелация към неговата грешка:

(8.5)

Грешка на коефициента на корелация се изчислява по следната формула:

където м r - грешка на коефициента на корелация, r- коефициент на корелация; н- брой сравнени двойки.

Разгледайте реда на изчисления и определянето на статистическата значимост на коефициента на корелация на Пиърсън, като използвате примера за решаване на следния проблем.

Задачата

22 гимназисти бяха тествани на два теста: SSC (ниво на субективен контрол) и MCS (мотивация за успех). Бяха получени следните резултати (Таблица 8.2):

Таблица 8.2

USK ( х и)

MkU ( г и)

USK ( х и)

MkU ( г и)

Упражнение

Тествайте хипотезата, че хората с високо ниво на вътрешност (SCI резултат) се характеризират с високо ниво на мотивация за успех.

Решение

1. Използваме коефициента на корелация на Пиърсън в следната модификация (вижте формула 8.4):

За удобство на обработката на данни на микрокалкулатор (при липса на необходимата компютърна програма) се препоръчва да се проектира междинен работен лист със следната форма (Таблица 8.3):

Таблица 8.3

хи ги

х 1 г 1

х 2 г 2

х 3 г 3

хн гн

Σ хи ги

2. Извършваме изчисления и заместваме стойностите във формулата:

3. Определяме статистическата значимост на коефициента на корелация на Пиърсън по три начина:

1-ви начин:

В табл. XIII Приложение намираме критичните стойности на коефициента за 1-во и 2-ро ниво на значимост: r кр.= 0,42; 0,54 (ν = н – 2 = 20).

Заключаваме, че r xy > rкр . , т.е. корелацията е статистически значима и за двете нива.

2-ри начин:

Да използваме таблицата. XV, в който определяме броя на двойките стойности​​​(брой субекти), достатъчен за статистическата значимост на коефициента на корелация на Пиърсън, равен на 0,58: за 1-во, 2-ро и 3-то ниво на значимост е съответно , 12, 18 и 28 .

Оттук стигаме до извода, че коефициентът на корелация е значим за 1-во и 2-ро ниво, но "не достига" 3-то ниво на значимост.

3-ти начин:

Изчисляваме грешката на коефициента на корелация и коефициента на Студент като отношението на коефициента на Пиърсън към грешката:

В табл. X намираме стандартните стойности на коефициента на Студент за 1-во, 2-ро и 3-то ниво на значимост с броя на степените на свобода ν = н – 2 = 20: т кр. = 2,09; 2,85; 3,85.

Общо заключение

Корелацията между резултатите от USC и MCU тестовете е статистически значима за 1-во и 2-ро ниво на значимост.

Забележка:

При тълкуване на коефициента на корелация на Пиърсън трябва да се вземат предвид следните точки:

    Коефициентът на Пиърсън може да се използва за различни скали (съотношение, интервал или ред) с изключение на дихотомната скала.

    Корелацията не винаги означава причинно-следствена връзка. С други думи, ако открием, да предположим, положителна корелация между височината и теглото в група субекти, тогава това изобщо не означава, че височината зависи от теглото или обратно (и двата знака зависят от трети (външен) променлива, която в този случай е свързана с генетични конституционни особености на човек).

    r xu » 0 може да се наблюдава не само при липса на връзка между хи г, но и в случай на силна нелинейна връзка (фиг. 8.2 а). В този случай отрицателните и положителните корелации се балансират и в резултат се създава илюзията за липса на връзка.

    r xyможе да бъде достатъчно малък, ако има силна връзка между хи все наблюдава в по-тесен диапазон от стойности от изследвания (фиг. 8.2 б).

    Комбинирането на проби с различни средства може да създаде илюзията за доста висока корелация (фиг. 8.2 в).

ги ги ги

+ + . .

хи хи хи

Ориз. 8.2. Възможни източници на грешка при тълкуване на стойността на коефициента на корелация (обяснения в текста (параграфи 3 - 5 от бележката))

В случай на корелационна връзка, заедно с изследвания фактор или няколко фактора в случай на множествена корелация, други фактори, които не се вземат предвид или не могат да бъдат взети предвид, също влияят върху ефективния атрибут. В същото време тяхното действие може да бъде насочено както към увеличаване на ефективната характеристика, така и към нейното намаляване. Така изучаването на връзката става при условия, когато тази връзка е в по-голяма или по-малка степен замъглена от противоречивото действие на други причини. Следователно една от задачите на корелационния анализ е да се определи близостта на връзката между признаците, да се определи силата на влиянието на изследвания фактор (фактори) върху ефективния знак.

Стегнатостта на връзката в корелационния анализ се характеризира със специална относителен индикатор, който беше кръстен коефициент на корелация.

С парна баня линейна зависимостхерметичността на връзката се определя с помощта на коефициента на линейна корелация

Коефициентът на корелация е в диапазона от 0 да се±1. в Ако коефициентът на корелация нула, тогава няма връзка, а ако е единство, тогава връзката е функционална. Знакът при коефициента на корелация показва посоката на връзката ("+" - прав"-" - обратен). Колкото по-близък е коефициентът на корелация до единица, толкова по-близка е връзката между характеристиките.

Квадратът на коефициента на корелация се нарича коефициент на детерминация (r2). Показва каква част от общата вариация на резултантния атрибут се определя от изследвания фактор. Ако коефициентът на детерминация е изразен като процент, тогава той трябва да се чете по следния начин: вариацията (флуктуациите) на зависимата променлива се дължи на толкова много проценти, дължащи се на вариацията на фактора.

Между коефициент на линейна корелация (r) и коефициент на пълна регресия(б) Връзка:

Следователно, знаейки коефициента на корелация (r) и стойностите на стандартните отклонения зах ивможете да определите коефициента на регресия (b) и обратно, като знаете коефициента на регресия (b) и съответните стандартни отклонения, можете да изчислите коефициента на корелация (r).

При сдвоена линейна зависимост коефициентът на корелация и коефициентът на пълна регресия имат еднакви знаци (плюс, минус).

Коефициентът на линейна корелация е предназначен да оцени степента на близост на връзката с линейна връзка. За случаите на нелинейна връзка между признаците се използва друга формула за коефициента на корелация, която следва от правилото за добавяне на дисперсии:

От даденото равенство се вижда, че колкото по-голямо е влиянието на фактора върху резултантния атрибут, толкова повече неговата дисперсионна стойност („m.gr“) се доближава до стойността на общата дисперсия на резултантния атрибут.

Съответно, колкото повече „м.гри по-малко напртолкова по-близка е връзката между характеристиките и обратно. Следователно съотношението на междугруповите (факторни) и общите дисперсии се използва за оценка на близостта на връзката между признаците. Формулата за коефициента на корелация е:

Като се има предвид, schosg2ya \u003d oh-a-look!\u003e, формулата за коефициента на корелация може да бъде представена като

И двете формули за коефициента на корелация се използват за изчисляване на плътността на връзката за всяка форма на връзка.

От правилото за добавяне на дисперсии се вижда, че стойността на коефициента на корелация е в диапазона от 0 до 1. Знакът на коефициента на корелация не се извежда от формулата. Ако се изследва връзката между два признака (сдвоена проста корелация), тогава посоката на връзката (знакът пред r) се определя непосредствено след знака пред коефициента на регресия на линейното уравнение.

При сдвоена криволинейна зависимост плътността на връзката с линейна зависимост се определя с помощта на специален индикатор, подобен на коефициента на корелация r, разгледан по-горе.

Този индикатор (за да се подчертае принадлежността му към криволинейна връзка) се обозначава със символа u и се нарича индекс на корелация:

Числовата стойност на индекса на корелация е подобна на коефициента на корелация: if ig= 1 - функционална връзка, ако ig= 0 - няма връзка; колкото по-близо е до единството, толкова по-близка е връзката между признаците.

Ако коефициентите на регресия на уравнението на връзката са известни, тогава индексът на корелация може да бъде определен по друга, по-проста формула. Така че, с параболична зависимост, формулата на индекса на корелация може да бъде представена като

Стегнатостта на връзката с множествена корелация се определя с помощта на коефициента на множествена корелация (ee) и коефициент на множествена детерминация (її2).По съдържание те са подобни на коефициентите на корелация и детерминация в двойна връзка. тяхното изчисление се основава на сравнение на междугруповите (факторни) и общите дисперсии:

Тази формула може да се използва за определяне на херметичността на връзката за всяка форма на свързване.

RF стойност. варира от 0 до 1 и се счита за положителен, тъй като при множество зависимости връзката на ефективната характеристика с някои фактори може да бъде положителна и отрицателна с други.

За случая на зависимостта на ефективния признак от два фактора, формулата за коефициента на множествена корелация има вида

където Gi - сдвоени линейни корелационни коефициенти.

Горната формула се използва за определяне на плътността на връзката с линейна връзка.

За да се определи близостта на връзката между ефективния признак и всеки фактор, като се изключва влиянието на други фактори, се определят коефициенти на частична корелация, които характеризират „чистото“ влияние на фактора върху ефективния признак. За тяхното изчисляване се използват сдвоени корелационни коефициенти.

В случай на зависимостта на ефективния признак от два фактора (x1 и x2), могат да се изчислят три коефициента на частична корелация:

1) между ви х1 с изключение на влиянието на х2:

Коефициентите на корелация за двойни и множествени връзки, както и индексът на корелация са относителни стойности, така че могат да се използват за сравняване на близостта на връзката за няколко анализирани явления.

Трябва да се има предвид, че показателите за близостта на връзката зависят от диапазона на вариация на изследваните характеристики. Колкото по-голямо е вариацията на променливите, толкова по-висока ще бъде стойността на индикаторите за близост на връзката.

Нека определим близостта на връзката между изследваните характеристики за нашия пример. Тъй като има линейна зависимост между продуктивността на кравите и нивото на хранене, ние ще определим близостта на връзката с помощта на коефициента на линейна корелация

Коефициентът на корелация показва, че има тясна (силна) връзка между продуктивността на кравите и нивото на хранене.

Коефициентът на детерминация r2 = 0,93442 = 0,8731 показва, че 87,31% от общото колебание в продуктивността на кравите се дължи на разлики в нивото на хранене, а останалите 12,69% (100 - 87,31) - други фактори, които в този случай не са взети предвид.

Коефициентът на корелация може да бъде намерен и с други формули.

Различни характеристики могат да бъдат свързани.

Има 2 вида връзка между тях:

  • функционален;
  • корелация.

Корелацияпреведено на руски - нищо повече от връзка.
В случай на корелация има съответствие на няколко стойности на един атрибут с няколко стойности на друг атрибут. Като примери можем да разгледаме установените корелации между:

  • дължината на лапите, шията, клюна при птици като чапли, жерави, щъркели;
  • показатели за телесната температура и сърдечната честота.

За повечето биомедицински процеси наличието на този тип връзка е статистически доказано.

Статистическите методи позволяват да се установи фактът на съществуването на взаимозависимост на характеристиките. Използването на специални изчисления за това води до установяване на корелационни коефициенти (мерки за свързаност).

Такива изчисления се наричат корелационен анализ.Извършва се за потвърждаване на зависимостта на 2 променливи (случайни променливи) една от друга, която се изразява чрез коефициента на корелация.

Използването на корелационния метод ни позволява да решим няколко проблема:

  • идентифицира връзката между анализираните параметри;
  • познаването на наличието на корелация позволява решаването на проблеми с прогнозирането. По този начин съществува реална възможност да се предскаже поведението на параметър въз основа на анализа на поведението на друг корелиран параметър;
  • класификация въз основа на избора на характеристики, независими един от друг.

За променливи:

  • свързано с порядковата скала, се изчислява коефициентът на Спиърман;
  • свързана с интервалната скала - коефициентът на Пиърсън.

Това са най-често използваните параметри, но има и други.

Стойността на коефициента може да бъде изразена както положителна, така и отрицателна.

В първия случай с увеличаване на стойността на една променлива се наблюдава увеличение на втората. При отрицателен коефициент моделът е обратен.

За какво е коефициентът на корелация?

случайни променливи, свързани помежду си, могат да имат съвсем различен характер на тази връзка. Не е задължително да е функционален, в случая, когато има пряка връзка между количествата. Най-често и двете величини се влияят от цял ​​набор от различни фактори, в случаите, когато са общи и за двете величини, се наблюдава образуването на свързани закономерности.

Това означава, че статистически доказаният факт за съществуване на връзка между количествата не е потвърждение, че причината за наблюдаваните изменения е установена. По правило изследователят стига до заключението, че има две взаимосвързани последици.

Свойства на коефициента на корелация

Тази статистика има следните свойства:

  • стойността на коефициента варира от -1 до +1. Колкото по-близо до екстремните стойности, толкова по-силна е положителната или отрицателната връзка между линейните параметри. В случай на нулева стойност говорим за липса на корелация между характеристиките;
  • положителна стойност на коефициента показва, че в случай на увеличение на стойността на един атрибут се наблюдава увеличение на втория (положителна корелация);
  • отрицателна стойност - при увеличаване на стойността на един атрибут се наблюдава намаляване на втория (отрицателна корелация);
  • приближаването на стойността на индикатора до крайните точки (или -1, или +1) показва наличието на много силна линейна връзка;
  • показателите на чертите могат да се променят с постоянна стойност на коефициента;
  • коефициентът на корелация е безразмерна величина;
  • наличието на корелация не е задължително потвърждение на причинно-следствена връзка.

Стойности на коефициента на корелация

Силата на корелацията може да се характеризира чрез прибягване до скалата на Челдок, в която качествена характеристика съответства на определена числена стойност.

В случай на положителна корелация при стойност:

  • 0-0,3 - корелацията е много слаба;
  • 0,3-0,5 - слаб;
  • 0,5-0,7 - средна якост;
  • 0,7-0,9 - високо;
  • 0,9-1 - много висока сила на корелация.

Скалата може да се използва и за отрицателна корелация. В този случай качествените характеристики се заменят с противоположни.

Можете да използвате опростената скала на Челдок, в която се разграничават само 3 градации на силата на корелацията:

  • много силни - показатели ± 0,7 - ± 1;
  • средно - показатели ± 0,3 - ± 0,699;
  • много слаб - показатели 0 - ± 0,299.

В статистикапозволява не само да се тества предположението за съществуването на линейна връзка между характеристиките, но и да се установи нейната сила.

Видове коефициент на корелация

Коефициентите на корелация могат да бъдат класифицирани по знак и стойност:

  • положителен;
  • нула;
  • отрицателен.

В зависимост от анализираните стойности се изчислява коефициентът:

  • Пиърсън;
  • копиеносец;
  • Кендала;
  • знаци на Фехнер;
  • съгласуваност или множествена рангова корелация.

Коефициентът на корелация на Пиърсън се използва за установяване на директни връзки между абсолютните стойности на променливите. В този случай разпределението на двете серии от променливи трябва да се доближи до нормалното. Сравняваните променливи трябва да се различават със същия брой различни характеристики. Скалата, представяща променливите, трябва да бъде или интервална скала, или скала на съотношението.

  • точно установяване на силата на корелация;
  • сравнение на количествени характеристики.

Има няколко недостатъка от използването на коефициента на линейна корелация на Пиърсън:

  • методът е нестабилен при отклонения от числови стойности;
  • използвайки този метод, е възможно да се определи силата на корелация само за линейна връзка; за други видове взаимни връзки на променливи трябва да се използват методи за регресионен анализ.

Ранговата корелация се определя по метода на Спирман, който дава възможност за статистическо изследване на връзката между явленията. Благодарение на този коефициент се изчислява действителната степен на паралелизъм на двете количествено изразени серии от признаци и също така се оценява плътността на идентифицираната връзка.

  • не изисква точно определяне на стойността на силата на корелация;
  • сравнените показатели имат както количествени, така и атрибутивни стойности;
  • сравнение на редове от характеристики с отворени варианти на стойности.

Методът на Спирман се отнася до непараметрични методи за анализ, така че няма нужда да се проверява нормалността на разпределението на характеристиките. Освен това ви позволява да сравнявате показатели, изразени в различни скали. Например, сравняване на стойностите на броя на червените кръвни клетки в определен обем кръв (непрекъсната скала) и експертна оценка, изразена в точки (редна скала).

Ефективността на метода се влияе негативно от голямата разлика между стойностите на сравняваните стойности. Методът е неефективен и в случаите, когато измерената стойност се характеризира с неравномерно разпределение на стойностите.

Стъпка по стъпка изчисляване на коефициента на корелация в Excel

Изчисляването на коефициента на корелация включва последователно изпълнение на редица математически операции.

Горната формула за изчисляване на коефициента на Пиърсън показва колко трудоемък е този процес, ако се извършва ръчно.
Използването на възможностите на Excell ускорява процеса на намиране на коефициента в пъти.

Достатъчно е да следвате прост алгоритъм на действия:

  • въвеждане на основна информация - колона от x стойности и колона от y стойности;
  • в инструментите се избира и отваря раздел Формули;
  • в раздела, който се отваря, изберете "Insert fx function";
  • в диалоговия прозорец, който се отваря, е избрана статистическата функция "Correl", която ви позволява да изчислите коефициента на корелация между 2 масива от данни;
  • данните се въвеждат в прозореца, който се отваря: масив 1 - диапазонът от стойности на колоната x (данните трябва да бъдат избрани), масив 2 - диапазонът от стойности на колоната y;
  • натиска се клавиш „OK“, резултатът от изчисляването на коефициента се появява в реда „стойност“;
  • заключение относно наличието на корелация между двата набора от данни и неговата сила.

Кратка теория

Най-простите показатели за плътността на връзката включват коефициента на корелация на знаците, който беше предложен от немския учен Г. Фехнер. Този индикатор се основава на оценка на степента на последователност в посоките на отклонения на отделните стойности на факторните и ефективните характеристики от съответните средни стойности. За да се изчисли, се изчисляват средните стойности на ефективните и факторните знаци и след това се записват знаците за отклонение за всички стойности на взаимосвързаните двойки знаци.

Ако въведем обозначението: - броят на съвпаденията на знаците на отклонения на отделните стойности от средната стойност, - броя на несъответствията на знаците на отклонения, тогава коефициентът на Фехнер може да бъде записан, както следва:

Коефициентът на Фехнер може да приема различни стойности, вариращи от -1 до +1. Ако знаците на всички отклонения съвпадат, тогава индикаторът също ще бъде равен на 1, което показва възможното наличие на директна връзка. Ако знаците на всички отклонения са различни, тогава коефициентът на Фехнер ще бъде равен на -1, което дава основание да се предположи наличието на обратна връзка.

Пример за решение на проблема

Задачата

Има данни за броя на говедата за 12 земеделски предприятия към 1 януари и средния годишен млечност от крава. Определете честотата на свързване между тези фактори, като използвате коефициента на корелация на Фехнер.

бр. земеделски предприятия 1 1.2 35.8 2 1.6 30.0 3 2.8 34.8 4 1.8 31.3 5 2.9 36.9 6 3 37.1 7 1.6 27.9 8 1.7 30.0 9 2.6 35.8 10 1.3 32.1 11 2 29.1 12 3.3 34.3

Решението на проблема

Нека направим изчислителна таблица:

бр. земеделски предприятия Брой говеда към 1 януари, хиляди глави Среден годишен добив на мляко от крава, кг 1 1.2 35.8 1.44 1281.64 42.96 2 1.6 30 2.56 900 48 3 2.8 34.8 7.84 1211.04 97.44 4 1.8 31.3 3.24 979.69 56.34 5 2.9 36.9 8.41 1361.61 107.01 6 3 37.1 9 1376.41 111.3 7 1.6 27.9 2.56 778.41 44.64 8 1.7 30 2.89 900 51 9 2.6 35.8 6.76 1281.64 93.08 10 1.3 32.1 1.69 1030.41 41.73 11 2 29.1 4 846.81 58.2 12 3.3 34.3 10.89 1176.49 113.19 Обща сума 25.8 395.1 61.28 13124.15 864.89

Коефициентът на Фехнер може да се изчисли по формулата:

Броят на съвпаденията на признаците на отклонения на отделните стойности от средните, , - броят на несъответствията на признаците на отклонения

1.2 35.8 1.6 30 2.8 34.8 1.8 31.3 2.9 36.9 3 37.1 1.6 27.9 1.7 30 2.6 35.8 1.3 32.1 2 29.1 3.3 34.3
Признаци на отклонения от средната стойност Съвпадение (или несъответствие на знаците 1 - + б 2 - - а 3 + + а 4 - - а 5 + + а 6 + + а 7 - - а 8 - - а 9 + + а 10 - - а 11 - - а 12 + + а

Обикновено такава стойност на индикатора за близост на връзката характеризира силна зависимост, но трябва да се има предвид, че тъй като коефициентът зависи само от знаците и не отчита големината на самите отклонения и от тяхната средна стойност ценности, то на практика характеризира не толкова близостта на връзката, колкото нейното присъствие и посока.

Цената е силно повлияна от спешността на решението (от дни до няколко часа). Онлайн помощ при изпита/теста се извършва по предварителна уговорка.

Приложението може да се остави директно в чата, като предварително сте изхвърлили състоянието на задачите и ви информират за крайните срокове за решаването му. Времето за отговор е няколко минути.

Констатации:

Получената стойност на коефициента на корелация на знаците е равна на нула, тъй като броят на съвпаденията и броят на несъответствията на знаците са равни. Това е основният недостатък на този индикатор. Според този показател може да се приеме, че няма връзка.

Коефициент на линейна корелация

Проверка на значимостта на коефициента на корелация:

Констатации:

Получената стойност на линейния коефициент на корелация показва, че връзката между дела в общия запас на изгорени горива и продължителността на живота при раждане е умерена, което показва наличието на обратна зависимост.

Следователно с вероятност от 95% може да се приеме, че корелацията все още е значителна.

Емпирично съотношение на корелация:

Проверка на значимостта на емпиричната корелация:

Констатации:

Получената стойност на емпиричното съотношение на корелация показва умерена връзка между изследваните признаци.

Следователно с вероятност от 95% можем да заключим, че корелацията между анализираните показатели е незначителна.

Коефициент на корелация на ранга на Спиърман:

Констатации:

Въз основа на резултатите от изчисляването на коефициента на Спиърман може да се предположи, че има слаба обратна зависимост между дела в общия запас на изгорени горива и продължителността на живота при раждане.

Коефициент на корелация на ранга на Кендал:

Констатации:

Според изчисления коефициент на корелация на ранговете може да се приеме, че има слаба обратна връзка между изследваните признаци.

· Проверка на използваемостта линейна функциякато форма на връзка

Счита се за възможно да се кандидатства линейно уравнениекорелационна зависимост, но за тестване на хипотезата за линейна зависимост е по-ефективно да се използва стойността .

Констатации:

Следователно хипотезата за линейна зависимост между дела в общия запас на изгорени горива и продължителността на живота при раждане е вярна.



Страни със средно човешко развитие

· Идентифициране на факта на наличието на връзка между фактора и получената характеристика

Аналитично групиране

Емпирична регресионна линия


Констатации:

Сравнявайки средните стойности на индикатора за производителност по групи, може да се види следната тенденция: колкото по-висок е делът в общите доставки на изгорени горива, толкова по-голяма е продължителността на живота при раждане (ако не вземем предвид скокове, които могат да се дължи на други фактори), т.е. можем да предположим наличието на пряка корелация между характеристиките.

Корелационно поле


Констатации:

Основната част от единиците образува облак, разположен основно от долния ляв ъгъл на координатната система до горния десен ъгъл, може да се предположи, че има пряка връзка между признаците.

корелационна таблица

При групиране по факторен критерий броят на групите е 6. При групиране по ефективен критерий ние задаваме броя на групите, равно на числотогрупи на факторна основа, т.е. Изключваме и държави, за които няма данни за факторен атрибут, броят на страните е намален до тридесет, т.е.

Сега правим таблица на корелация:

корелационна таблица Средна продължителност на живота при раждане, години
52,0-57,2 57,2-62,4 62,4-67,6 67,6-70,1 70,1-72,6 72,6-75,1 Обща сума
Дял в общата доставка на изгорени горива, % 15-30
30-45
45-60
60-75
75-90
90-100
Обща сума

Констатации:

Трудно е да се определи посоката на корелацията, главно честотите в таблицата на корелацията са разположени по диагонала от горния ляв ъгъл до долния десен ъгъл, т.е. големите стойности на атрибута фактор съответстват на големи стойности от получената, следователно можем да предположим наличието на пряка корелация между признаците.

· Показатели за оценка на степента на близост на връзката