Коефициент на корелация в статистиката. Коефициент на Фехнер (коефициент на знакова корелация). Стойности на коефициента на корелация

Коефициентът на корелация, предложен през втората половина на 19 век от G. T. Fechner, е най-простата мярка за връзката между две променливи. Основава се на сравнение на две психологически характеристики х азИ г аз, измерени на една и съща проба, чрез сравняване на признаците на отклонения на отделните стойности от средните: и
. Заключението за корелацията между две променливи се прави въз основа на преброяването на броя на съвпаденията и несъответствията на тези знаци.

Пример

Позволявам х азИ г аз– две черти, измерени върху една и съща извадка от субекти. За да се изчисли коефициентът на Фехнер, е необходимо да се изчислят средните стойности за всяка характеристика, както и за всяка стойност на променливата - знакът на отклонението от средната стойност (Таблица 8.1):

Таблица 8.1

х аз

г аз

Обозначаване

На масата: А– съвпадение на знаци, b– несъответствие на знаци; н a – брой съвпадения, н b – брой несъответствия (в този случай на = 4, н b = 6).

Корелационният коефициент на Фехнер се изчислява по формулата:

(8.1)

В такъв случай:

Заключение

Има слаба отрицателна връзка между изследваните променливи.

Трябва да се отбележи, че коефициентът на корелация на Фехнер не е достатъчно строг критерий, така че може да се използва само в началния етап на обработка на данните и за формулиране на предварителни заключения.

8. 4. Коефициент на корелация на Пиърсън

Първоначалният принцип на корелационния коефициент на Пиърсън е използването на произведението на моментите (отклонения на стойността на променлива от средната стойност):

Ако сумата от продуктите на моментите е голяма и положителна, тогава хИ приса пряко свързани; ако сумата е голяма и отрицателна, тогава хИ присилно обратно свързана; накрая, ако няма връзка между хИ присумата от произведенията на моментите е близка до нула.

За да се гарантира, че статистическите данни не зависят от размера на извадката, се взема средната стойност, а не сумата от продуктите на моментите. Разделението обаче се прави не по размера на извадката, а по броя на степените на свобода н - 1.

величина
е мярка за връзката между хИ прии се нарича ковариация хИ при.

В много проблеми в природните и техническите науки ковариацията е напълно задоволителна мярка за връзка. Недостатъкът му е, че обхватът на стойностите му не е фиксиран, т.е. може да варира в неопределени граници.

За да се стандартизира мярка за асоцииране, е необходимо да се освободи ковариацията от влиянието на стандартните отклонения. За да направите това, трябва да разделите С xyНа с x и с y:

(8.3)

Където r xy- коефициент на корелация или произведение на моментите на Пиърсън.

Общата формула за изчисляване на коефициента на корелация е следната:

(някои реализации)

(8.4)

Влияние на преобразуването на данни върху r xy:

1. Линейни трансформации хИ гТип bx + аИ dy + ° Сняма да промени величината на корелацията между хИ г.

2. Линейни трансформации хИ гпри b < 0, д> 0, а също и когато b> 0 и д < 0 изменяют знак коэффициента корреляции, не меняя его величины.

Надеждността (или в противен случай статистическата значимост) на коефициента на корелация на Pearson може да се определи по различни начини:

Според таблиците на критичните стойности на коефициентите на корелация на Pearson и Spearman (виж Приложение, Таблица XIII). Ако стойността, получена при изчисленията r xy надвишава критичната (таблична) стойност за дадена извадка, коефициентът на Пиърсън се счита за статистически значим. Броят на степените на свобода в този случай съответства на н– 2, където н– брой двойки сравнявани стойности (размер на извадката).

Съгласно таблица XV ​​от приложението, което е озаглавено „Броят на двойките стойности, необходими за статистическата значимост на коефициента на корелация.“ В този случай е необходимо да се съсредоточите върху коефициента на корелация, получен при изчисленията. Счита се за статистически значимо, ако размерът на извадката е равен или по-голям от табличния брой двойки стойности за даден коефициент.

Според коефициента на Стюдънт, който се изчислява като съотношението на коефициента на корелация към неговата грешка:

(8.5)

Грешка на коефициента на корелация изчислено по следната формула:

Където м r - грешка на коефициента на корелация, r- коефициент на корелация; н- брой сравнявани двойки.

Нека разгледаме процедурата за изчисления и определяне на статистическата значимост на коефициента на корелация на Pearson, като използваме примера за решаване на следния проблем.

Задачата

22 гимназисти бяха тествани по два теста: USK (ниво на субективен контрол) и MkU (мотивация за успех). Бяха получени следните резултати (Таблица 8.2):

Таблица 8.2

USK ( х аз)

MkU ( г аз)

USK ( х аз)

MkU ( г аз)

Упражнение

Да се ​​провери хипотезата, че хората с високо ниво на интерналност (USC резултат) се характеризират с високо ниво на мотивация за успех.

Решение

1. Използваме коефициента на корелация на Pearson в следната модификация (вижте формула 8.4):

За удобство на обработката на данни на микрокалкулатор (при липса на необходимата компютърна програма) се препоръчва да се създаде междинна работна таблица със следната форма (Таблица 8.3):

Таблица 8.3

хаз газ

х 1 г 1

х 2 г 2

х 3 г 3

хн гн

Σ хаз газ

2. Извършваме изчисления и заместваме стойностите във формулата:

3. Определяме статистическата значимост на корелационния коефициент на Pearson по три начина:

1-ви метод:

В табл XIII Приложение намираме критичните стойности на коефициента за 1-во и 2-ро ниво на значимост: r кр.= 0,42; 0,54 (ν = н – 2 = 20).

Ние заключаваме, че r xy > rкр . , т.е. корелацията е статистически значима и за двете нива.

2-ри метод:

Да използваме таблицата. XV, в който определяме броя на двойките стойности (брой субекти), достатъчни за статистическата значимост на корелационния коефициент на Pearson, равен на 0,58: за 1-во, 2-ро и 3-то ниво на значимост е 12, 18 и 28, съответно .

Оттук стигаме до извода, че коефициентът на корелация е значим за 1-во и 2-ро ниво, но „не достига” до 3-то ниво на значимост.

3-ти метод:

Изчисляваме грешката на коефициента на корелация и коефициента на Стюдънт като отношение на коефициента на Пиърсън към грешката:

В табл X намираме стандартните стойности на коефициента на Студент за 1-во, 2-ро и 3-то ниво на значимост с броя на степените на свобода ν = н – 2 = 20: T кр. = 2,09; 2,85; 3,85.

Общо заключение

Корелацията между показателите на тестовете USC и MkU е статистически значима за 1-во и 2-ро ниво на значимост.

Забележка:

При тълкуването на коефициента на корелация на Pearson трябва да се имат предвид следните точки:

    Коефициентът на Пиърсън може да се използва за различни скали (съотношение, интервал или порядък) с изключение на дихотомичната скала.

    Корелацията не винаги означава причинно-следствена връзка. С други думи, ако установим, да речем, положителна корелация между височината и теглото в група субекти, това не означава, че височината зависи от теглото или обратното (и двете характеристики зависят от трета (външна) променлива, която в този случай се свързва с генетични конституционални характеристики на човек).

    r xu » 0 може да се наблюдава не само при липса на връзка между хИ г, но и при силна нелинейна връзка (фиг. 8.2 а). В този случай отрицателните и положителните корелации са балансирани, което води до илюзията за липса на връзка.

    r xyможе да бъде доста малък, ако има силна връзка между хИ присе наблюдава в по-тесен диапазон от стойности от изследвания (фиг. 8.2 b).

    Комбинирането на проби с различни средства може да създаде илюзията за доста висока корелация (фиг. 8.2 c).

газ газ газ

+ + . .

хаз хаз хаз

Ориз. 8.2. Възможни източници на грешки при интерпретиране на стойността на коефициента на корелация (пояснения в текста (точки 3 – 5 забележки))

Когато има корелация, заедно с изследвания фактор или няколко фактора в случай на множествена корелация, полученият знак се влияе от други фактори, които не се вземат предвид или не могат да бъдат точно взети предвид. В този случай тяхното действие може да бъде насочено както към повишаване на ефективната характеристика, така и към нейното намаляване. И така, изследването на връзката се извършва в условия, при които тази връзка в по-голяма или по-малка степен е затъмнена от противоречивото действие на други причини. Следователно една от задачите на корелационния анализ е да се определи близостта на връзката между характеристиките, да се определи силата на влиянието на изследвания фактор (фактори) върху получената характеристика.

Близостта на връзката в корелационния анализ се характеризира с помощта на специален относителен показател, който беше кръстен коефициент на корелация.

В парната баня линейна зависимостблизостта на връзката се определя с помощта на коефициента на линейна корелация

Коефициентът на корелация варира от 0 Да се±1. c Ако коефициентът на корелация равно на нула, значи няма връзка, а ако е такава, значи връзката работи. Знакът на коефициента на корелация показва посоката на връзката ("+" - прав"-" - обратен). Колкото по-близък е коефициентът на корелация до единица, толкова по-тясна е връзката между характеристиките.

Квадратът на корелационния коефициент се нарича коефициент на детерминация (r2). Той показва каква част от общата вариация на получената характеристика се определя от изследвания фактор. Ако коефициентът на детерминация е изразен като процент, тогава той трябва да се чете по следния начин: вариацията (флуктуациите) на зависимата променлива с толкова много проценти се дължи на вариацията на фактора.

Между коефициента на линейна корелация (r) и коефициента на пълна регресияб) Връзка:

Следователно, знаейки коефициента на корелация (r) и стойностите на стандартните отклонения зах ИVможете да определите коефициента на регресия (b) и обратно, като знаете коефициента на регресия (b) и съответните стандартни отклонения, можете да изчислите коефициента на корелация (r).

При сдвоена линейна зависимост коефициентът на корелация и пълният коефициент на регресия имат еднакви знаци (плюс, минус).

Коефициентът на линейна корелация е предназначен да оцени степента на близост на връзката с линейна връзка. За случаите на нелинейна зависимост между характеристиките се използва друга формула за коефициента на корелация, която следва от правилото за добавяне на дисперсии:

От горното равенство става ясно, че колкото по-голямо е влиянието на даден фактор върху ефективния атрибут, толкова повече неговата стойност на дисперсията („m.gr) се доближава до стойността на общата дисперсия на ефективния атрибут.

Съответно, колкото повече "м.гри по-малко ае.гртолкова по-тясна е връзката между характеристиките и обратно. Следователно съотношението на междугруповите (факториални) и общите дисперсии се използва за оценка на силата на връзката между характеристиките. Формулата на коефициента на корелация е:

Като се има предвид, че шосг2я = о-а-огля!>, формулата за корелационния коефициент може да бъде представена като

И двете формули на коефициента на корелация се използват за изчисляване на силата на връзката за всяка форма на връзка.

От правилото за добавяне на дисперсии става ясно, че стойността на корелационния коефициент варира от 0 до 1. Знакът на корелационния коефициент не се извежда от формулата. Ако се изследва връзката между две характеристики (проста корелация по двойки), тогава посоката на връзката (знакът пред r) се определя непосредствено след знака преди регресионния коефициент на линейното уравнение.

При сдвоена криволинейна зависимост близостта на връзката с линейна зависимост се определя с помощта на специален индикатор, подобен на корелационния коефициент r, разгледан по-горе.

Този индикатор (за да се подчертае принадлежността му към криволинейна връзка) се обозначава със символа u и се нарича корелационен индекс:

Числената стойност на индекса на корелация е подобна на коефициента на корелация: ако ig= 1 - връзката е функционална, ако ig= 0 - няма връзка; Колкото u е по-близо до единицата, толкова по-тясна е връзката между характеристиките.

Ако коефициентите на регресия на уравнението на комуникацията са известни, тогава индексът на корелация може да се определи с помощта на друга, по-проста формула. По този начин, с параболична зависимост, формулата на индекса на корелация може да бъде представена като

Силата на връзката при множествена корелация се определя с помощта на коефициента на множествена корелация (ee) и коефициент на множествена детерминация (її2).По съдържание те са подобни на коефициентите на корелация и детерминация при комуникация по двойки. техните изчисления се основават на сравнение на междугрупови (факториални) и общи дисперсии:

Тази формула може да се приложи за определяне на плътността на връзката за всяка форма на връзка.

RF стойност варира от 0 до 1 и се счита за положителен, тъй като при множество зависимости връзката на получената характеристика с някои фактори може да бъде положителна, а с други - отрицателна.

В случай на зависимост на получената характеристика от два фактора, формулата за коефициента на множествена корелация има формата

където Gi са сдвоени коефициенти на линейна корелация.

Дадената формула се използва за определяне на плътността на връзката за линейна връзка.

За да се определи тясността на връзката между ефективната характеристика и всеки фактор, когато се изключи влиянието на други фактори, се определят частични коефициенти на корелация, които характеризират „чистото“ влияние на фактора върху ефективната характеристика. За изчисляването им се използват сдвоени коефициенти на корелация.

Ако резултантната характеристика зависи от два фактора (x1 и x2), могат да се изчислят три частични коефициента на корелация:

1) между Vи x1 с изключение на влиянието на x2:

Коефициентите на корелация за сдвоени и множество връзки, както и индексът на корелация, са относителни стойности, така че могат да се използват за сравняване на силата на връзките за няколко явления, които се анализират.

Трябва да се има предвид, че показателите за близостта на връзката зависят от обхвата на вариация на изследваните характеристики. Колкото по-голяма е вариацията на променливите, толкова по-висока е стойността на показателите за близостта на връзката.

Нека определим близостта на връзката между изследваните характеристики за нашия пример. Тъй като има линейна връзка между продуктивността на кравите и нивото на хранене, ще определим близостта на връзката с помощта на линейния корелационен коефициент

Коефициентът на корелация показва, че има тясна (силна) връзка между продуктивността на кравите и нивото на хранене.

Коефициентът на детерминация r2 = 0,93442 = 0,8731 показва, че 87,31% от общата вариация в продуктивността на кравите се дължи на разликите в нивото на хранене, а останалите 12,69% (100 - 87,31) се дължат на други фактори, които не са в това случай беше взет под внимание.

Коефициентът на корелация може да се намери с помощта на други формули.

Различни знаци могат да бъдат свързани помежду си.

Между тях има 2 вида връзки:

  • функционални;
  • корелация.

Корелацияпреведено на руски не е нищо повече от връзка.
В случай на корелационна връзка може да се проследи съответствието на няколко стойности на една характеристика с няколко стойности на друга характеристика. Като примери можем да разгледаме установените корелации между:

  • дължината на лапите, вратовете и човките на птици като чапли, жерави и щъркели;
  • показатели за телесна температура и пулс.

За повечето биомедицински процеси наличието на този тип връзка е статистически доказано.

Статистическите методи позволяват да се установи фактът на наличието на взаимозависимост на характеристиките. Използването на специални изчисления за това води до установяване на коефициенти на корелация (мерки за свързаност).

Такива изчисления се наричат корелационен анализ.Извършва се, за да се потвърди зависимостта на 2 променливи (случайни променливи) една от друга, която се изразява с коефициента на корелация.

Използването на метода на корелация ви позволява да решите няколко проблема:

  • установява наличието на връзка между анализираните параметри;
  • знанието за наличието на корелация ни позволява да решаваме проблеми с прогнозирането. По този начин има реална възможност да се предвиди поведението на даден параметър въз основа на анализ на поведението на друг корелиращ параметър;
  • извършване на класификация въз основа на избора на признаци, независими един от друг.

За променливи:

  • спрямо ординалната скала се изчислява коефициентът на Спирман;
  • свързани с интервалната скала – коефициент на Пиърсън.

Това са най-често използваните параметри, освен тях има и други.

Стойността на коефициента може да бъде изразена положително или отрицателно.

В първия случай, когато стойността на една променлива се увеличава, се наблюдава увеличение на втората. Ако коефициентът е отрицателен, моделът е обърнат.

За какво е коефициентът на корелация?

Случайни променливи, свързани помежду си, може да има напълно различен характер на тази връзка. Не е задължително да е функционален, когато може да се проследи пряка връзка между количествата. Най-често и двете величини се влияят от цял ​​набор от различни фактори; в случаите, когато те са общи за двете величини, се наблюдава формирането на свързани модели.

Това означава, че статистически доказаният факт за наличието на връзка между количествата не потвърждава, че е установена причината за наблюдаваните промени. Като правило изследователят заключава, че има две взаимосвързани последици.

Свойства на коефициента на корелация

Тази статистическа характеристика има следните свойства:

  • стойността на коефициента варира от -1 до +1. Колкото по-близо до екстремните стойности, толкова по-силна е положителната или отрицателната връзка между линейни параметри. При нулева стойност говорим за липса на корелация между характеристиките;
  • положителна стойност на коефициента показва, че ако стойността на една характеристика се увеличи, се наблюдава увеличение на втората (положителна корелация);
  • отрицателна стойност – при повишаване на стойността на една характеристика се наблюдава намаляване на втората (отрицателна корелация);
  • приближаването на стойността на индикатора до крайните точки (или -1, или +1) показва наличието на много силна линейна връзка;
  • показателите на дадена характеристика могат да се променят, докато стойността на коефициента остава непроменена;
  • коефициентът на корелация е безразмерна величина;
  • наличието на корелация не потвърждава непременно причинно-следствена връзка.

Стойности на коефициента на корелация

Силата на корелацията може да се характеризира чрез прибягване до скалата на Cheldock, в която определена числена стойност съответства на качествена характеристика.

В случай на положителна корелация със стойността:

  • 0-0,3 – корелацията е много слаба;
  • 0,3-0,5 – слаб;
  • 0,5-0,7 – средна якост;
  • 0,7-0,9 – високо;
  • 0,9-1 – много висока сила на корелация.

Скалата може да се използва и за отрицателна корелация. В този случай качествените характеристики се заменят с противоположни.

Можете да използвате опростената скала на Cheldock, която разграничава само 3 степени на корелационна сила:

  • много силен - показатели ±0,7 - ±1;
  • средно - показатели ±0,3 - ±0,699;
  • много слаб - показатели 0 - ±0.299.

The статистически показателпозволява не само да се тества предположението за съществуването на линейна връзка между характеристиките, но и да се установи нейната сила.

Видове коефициент на корелация

Коефициентите на корелация могат да бъдат класифицирани по знак и стойност:

  • положителен;
  • нула;
  • отрицателен.

В зависимост от анализираните стойности се изчислява коефициентът:

  • Pearson;
  • Копиеносец;
  • Кендал;
  • знаци на Фехнер;
  • съгласуване или множествена рангова корелация.

Коефициентът на корелация на Pearson се използва за установяване на директни връзки между абсолютните стойности на променливите. В този случай разпределението на двете серии от променливи трябва да се доближава до нормалното. Сравняваните променливи трябва да се различават по същия брой различни характеристики. Скалата, представяща променливите, трябва да бъде интервална или съотношителна скала.

  • точно установяване на силата на корелация;
  • сравнение на количествени характеристики.

Има няколко недостатъка при използването на линейния коефициент на корелация на Pearson:

  • методът е нестабилен в случай на отклонения от числови стойности;
  • Използвайки този метод, е възможно да се определи силата на корелация само за линейна връзка; за други видове взаимни връзки на променливи трябва да се използват методи на регресионен анализ.

Ранговата корелация се определя по метода на Спирман, който позволява статистически да се изследва връзката между явленията. Благодарение на този коефициент се изчислява действителната степен на паралелност на две количествено изразени серии от характеристики, както и се оценява плътността на идентифицираната връзка.

  • не изисква прецизно определяне на стойността на корелационната сила;
  • сравняваните показатели имат както количествено, така и атрибутивно значение;
  • сравнение на серии от характеристики с отворени варианти на стойности.

Методът на Spearman е непараметричен метод за анализ, така че не е необходимо да се проверява нормалността на разпределението на дадена характеристика. Освен това ви позволява да сравнявате показатели, изразени в различни скали. Например сравнение на броя на червените кръвни клетки в определен обем кръв (непрекъсната скала) и експертна оценка, изразена в точки (порядъчна скала).

Ефективността на метода се влияе отрицателно от голяма разлика между стойностите на сравняваните количества. Методът не е ефективен и в случаите, когато измерената стойност се характеризира с неравномерно разпределение на стойностите.

Стъпка по стъпка изчисляване на коефициента на корелация в Excel

Изчисляването на коефициента на корелация включва последователно извършване на редица математически операции.

Горната формула за изчисляване на коефициента на Pearson показва колко трудоемък е този процес, ако се извършва ръчно.
Използването на възможностите на Excel значително ускорява процеса на намиране на коефициента.

Достатъчно е да следвате прост алгоритъм от действия:

  • въвеждане на основна информация - колона от x стойности и колона от y стойности;
  • в инструментите изберете и отворете раздела „Формули“;
  • в раздела, който се отваря, изберете „Вмъкване на fx функция“;
  • в диалоговия прозорец, който се отваря, изберете статистическата функция „Corel“, която ви позволява да изчислите коефициента на корелация между 2 набора от данни;
  • прозорецът, който се отваря, въведете данните: масив 1 – диапазон от стойности на колона x (данните трябва да бъдат избрани), масив 2 – диапазон от стойности на колона y;
  • натиска се клавишът „ok“, резултатът от изчисляването на коефициента се появява в реда „стойност“;
  • заключение относно наличието на корелация между 2 набора от данни и нейната сила.

Кратка теория

Най-простите индикатори за близостта на връзката включват коефициента на корелация на знака, предложен от немския учен Г. Фехнер. Този показател се основава на оценка на степента на последователност на посоките на отклонения на индивидуалните стойности на факторните и произтичащи характеристики от съответните средни стойности. За да се изчисли, се изчисляват средните стойности на резултантните и факторните характеристики и след това знаците за отклонение се присвояват за всички стойности на взаимосвързани двойки характеристики.

Ако въведем следните обозначения: – броят на съвпаденията на признаците на отклонение на отделните стойности от средната стойност, – броят на несъответствията на знаците на отклоненията, тогава коефициентът на Фехнер може да се запише, както следва:

Коефициентът на Fechner може да приема различни стойности, вариращи от -1 до +1. Ако признаците на всички отклонения съвпадат, тогава индикаторът ще бъде равен на 1, което показва възможното наличие на директна връзка. Ако знаците на всички отклонения са различни, тогава коефициентът на Фехнер ще бъде равен на -1, което предполага наличието на обратна връзка.

Пример за решение на проблем

Задачата

Има данни за броя на едрия рогат добитък за 12 земеделски предприятия към 1 януари и средната годишна млечност от една крава. Определете честотата на свързване между тези фактори, като използвате корелационния коефициент на Fechner.

бр.селскостопански предприятия 1 1.2 35.8 2 1.6 30.0 3 2.8 34.8 4 1.8 31.3 5 2.9 36.9 6 3 37.1 7 1.6 27.9 8 1.7 30.0 9 2.6 35.8 10 1.3 32.1 11 2 29.1 12 3.3 34.3

Решението на проблема

Нека създадем таблица за изчисление:

бр.селскостопански предприятия Брой говеда към 1 януари хил. глави Средна годишна млечност от крава, кг 1 1.2 35.8 1.44 1281.64 42.96 2 1.6 30 2.56 900 48 3 2.8 34.8 7.84 1211.04 97.44 4 1.8 31.3 3.24 979.69 56.34 5 2.9 36.9 8.41 1361.61 107.01 6 3 37.1 9 1376.41 111.3 7 1.6 27.9 2.56 778.41 44.64 8 1.7 30 2.89 900 51 9 2.6 35.8 6.76 1281.64 93.08 10 1.3 32.1 1.69 1030.41 41.73 11 2 29.1 4 846.81 58.2 12 3.3 34.3 10.89 1176.49 113.19 Обща сума 25.8 395.1 61.28 13124.15 864.89

Коефициентът на Фехнер може да се изчисли по формулата:

Броят на съвпаденията на знаците за отклонения на отделните стойности от средните, , - броят на несъответствията на признаците на отклонения

1.2 35.8 1.6 30 2.8 34.8 1.8 31.3 2.9 36.9 3 37.1 1.6 27.9 1.7 30 2.6 35.8 1.3 32.1 2 29.1 3.3 34.3
Признаци за отклонения от средното Съвпадение (или несъответствие на знаци 1 - + b 2 - - а 3 + + а 4 - - а 5 + + а 6 + + а 7 - - а 8 - - а 9 + + а 10 - - а 11 - - а 12 + + а

Обикновено тази стойност на индикатора за близостта на връзката характеризира силна зависимост, но трябва да се има предвид, че тъй като коефициентът зависи само от знаците и не взема предвид големината на самите отклонения и тяхната средна стойност ценности, той практически характеризира не толкова близостта на връзката, а по-скоро нейното наличие и насоченост.

Цената е силно повлияна от спешността на решението (от ден до няколко часа). Онлайн помощ с изпити/тестове е достъпна след уговорка.

Можете да оставите заявка директно в чата, като предварително сте изпратили условията на задачите и сте информирали за крайните срокове за необходимото решение. Времето за реакция е няколко минути.

Изводи:

Получената стойност на коефициента на корелация на знаците е нула, тъй като броят на съвпаденията и броят на несъответствията на знаците са равни. Това е основният недостатък на този индикатор. Въз основа на този показател може да се приеме, че няма връзка.

Линеен коефициент на корелация

Проверка на значимостта на коефициента на корелация:

Изводи:

Получената стойност на коефициента на линейна корелация показва, че връзката между дела в общия запас от изгорени горива и очакваната продължителност на живота при раждане е умерена, което показва наличието на обратна зависимост.

Следователно, с вероятност от 95% можем да предположим, че корелацията все още е значителна.

Емпирично съотношение на корелация:

Проверка на значимостта на емпирична корелационна връзка:

Изводи:

Получената стойност на емпиричния корелационен коефициент показва умерена връзка между изследваните характеристики.

Следователно с вероятност от 95% можем да заключим, че корелацията между анализираните показатели е незначителна.

Коефициент на рангова корелация на Spearman:

Изводи:

Въз основа на резултатите от изчисляването на коефициента на Спирман може да се приеме, че има слаба обратна зависимост между дела в общото предлагане на изгорени горива и очакваната продължителност на живота при раждане.

Коефициент на корелация на ранг Kendal:

Изводи:

Въз основа на изчисления коефициент на рангова корелация можем да предположим, че има слаба обратна връзка между изследваните характеристики.

· Проверка на използваемостта линейна функциякато форма на връзка

Счита се за възможно да се използва линейно уравнениекорелационна зависимост, но за проверка на хипотезата за линейна зависимост е по-ефективно да се използва количеството .

Изводи:

Следователно хипотезата за линейността на връзката между дела в общия запас от изгорени горива и очакваната продължителност на живота при раждане е вярна.



Страни със средно ниво на човешко развитие

· Идентифициране на наличието на връзка между фактор и резултатна характеристика

Аналитично групиране

Емпирична регресионна линия


Изводи:

Сравнявайки средните стойности на получената характеристика по групи, може да се види следната тенденция: колкото по-висок е делът в общото предлагане на изгорени горива, толкова по-голяма е продължителността на живота при раждане (ако не вземем предвид скоковете, вероятно поради други фактори), т.е. можем да приемем наличието на пряка корелация между характеристиките.

Корелационно поле


Изводи:

Основната част от единиците образува облак, разположен предимно от долния ляв ъгъл на координатната система до горния десен ъгъл, може да се приеме, че има пряка връзка между характеристиките.

Корелационна таблица

При групиране по факторен признак броят на групите е 6. При групиране по ефективен признак задаваме броя на групите, равно на числотогрупи по факторни характеристики, т.е. Изключваме и страни, за които няма данни за факторния атрибут; броят на държавите е намален до тридесет, т.е.

Сега създаваме корелационна таблица:

Корелационна таблица Средна продължителност на живота при раждане, години
52,0-57,2 57,2-62,4 62,4-67,6 67,6-70,1 70,1-72,6 72,6-75,1 Обща сума
Дял в общия обем на доставките на изгорели горива, % 15-30
30-45
45-60
60-75
75-90
90-100
Обща сума

Изводи:

Трудно е да се определи посоката на корелационната връзка, главно честотите в корелационната таблица са разположени по диагонала от горния ляв ъгъл до долния десен ъгъл, т.е. големите стойности на факторната характеристика съответстват на големи стойности ​на резултантната, следователно можем да приемем наличието на пряка корелация между характеристиките.

· Показатели за оценка на степента на близост на връзката