Імовірнісний (статистичний) метод оцінки ризиків. Імовірнісно-статистичні методи моделювання економічних систем Числові характеристики випадкових величин

Частина 1. Фундамент прикладної статистики

1.2.3. Суть імовірнісно-статистичних методів прийняття рішень

Як підходи, ідеї та результати теорії ймовірностей та математичної статистики використовуються при прийнятті рішень?

Базою є імовірнісна модель реального явища чи процесу, тобто. математична модель, у якій об'єктивні співвідношення виражені термінах теорії ймовірностей. Імовірності використовуються передусім для опису невизначеностей, які необхідно враховувати під час прийняття рішень. Маються на увазі як небажані можливості (ризики), так і привабливі (щасливий випадок). Іноді випадковість вноситься в ситуацію свідомо, наприклад, під час жеребкування, випадкового відбору одиниць для контролю, проведення лотерей або опитувань споживачів.

Теорія ймовірностей дозволяє за одними ймовірностями розрахувати інші, які цікавлять дослідника. Наприклад, за ймовірністю випадання герба можна розрахувати ймовірність того, що при 10 кидання монет випаде не менше 3 гербів. Подібний розрахунок спирається на ймовірну модель, згідно з якою кидання монет описуються схемою незалежних випробувань, крім того, випадання герба і решітки рівноможливі, а тому ймовірність кожної з цих подій дорівнює ½. Більш складною є модель, де замість кидання монети розглядається перевірка якості одиниці виробленої продукції. Відповідна ймовірна модель спирається на припущення про те, що контроль якості різних одиниць продукції описується схемою незалежних випробувань. На відміну від моделі з киданням монет, необхідно ввести новий параметр – ймовірністьр

те, що одиниця продукції є дефектною. Модель буде повністю описана, якщо прийняти, що всі одиниці продукції мають однакову можливість виявитися дефектними. Якщо останнє припущення неправильне, число параметрів моделі зростає. Наприклад, можна прийняти, що кожна одиниця продукції має свою можливість виявитися дефектною. Подібний розрахунок спирається на ймовірну модель, згідно з якою кидання монет описуються схемою незалежних випробувань, крім того, випадання герба і решітки рівноможливі, а тому ймовірність кожної з цих подій дорівнює ½. Більш складною є модель, де замість кидання монети розглядається перевірка якості одиниці виробленої продукції. Відповідна ймовірна модель спирається на припущення про те, що контроль якості різних одиниць продукції описується схемою незалежних випробувань. На відміну від моделі з киданням монет, необхідно ввести новий параметр – ймовірністьОбговоримо модель контролю якості із загальною для всіх одиниць продукції ймовірністю дефектності Подібний розрахунок спирається на ймовірну модель, згідно з якою кидання монет описуються схемою незалежних випробувань, крім того, випадання герба і решітки рівноможливі, а тому ймовірність кожної з цих подій дорівнює ½. Більш складною є модель, де замість кидання монети розглядається перевірка якості одиниці виробленої продукції. Відповідна ймовірна модель спирається на припущення про те, що контроль якості різних одиниць продукції описується схемою незалежних випробувань. На відміну від моделі з киданням монет, необхідно ввести новий параметр – ймовірністьна деяке конкретне значення. Для цього необхідно вийти з рамок ймовірнісної моделі та звернутися до даних, отриманих під час контролю якості. Математична статистика вирішує зворотне завдання стосовно теорії ймовірностей. Її мета – на основі результатів спостережень (вимірювань, аналізів, випробувань, дослідів) отримати висновки про ймовірності, що лежать в основі ймовірнісної моделі.

Наприклад, на основі частоти появи дефектних виробів під час контролю можна зробити висновки про ймовірність дефектності (див. теорему Бернуллі вище). На основі нерівності Чебишева робилися висновки про відповідність частоти появи дефектних виробів гіпотезі про те, що ймовірність дефектності набуває певного значення. Таким чином, застосування математичної статистики спирається на ймовірну модель явища або процесу. Використовуються два паралельних ряду понять – які стосуються теорії (імовірнісної моделі) і які стосуються практики (вибірці результатів спостережень). Наприклад, теоретичній ймовірності відповідає частота, знайдена за вибіркою. Математичного очікування (теоретичний ряд) відповідає вибірковесереднє арифметичне

(Практичний ряд). Як правило, вибіркові характеристики є оцінками теоретичних. При цьому величини, що належать до теоретичного ряду, «перебувають у головах дослідників», відносяться до світу ідей (за давньогрецьким філософом Платоном), недоступні для безпосереднього виміру. Дослідники мають у своєму розпорядженні лише вибіркові дані, за допомогою яких вони намагаються встановити властивості теоретичної ймовірнісної моделі, що їх цікавлять.

Щоб перенести висновки з вибірки більш широку сукупність, необхідні ті чи інші припущення про зв'язок вибіркових характеристик з характеристиками цієї більшої сукупності. Ці припущення ґрунтуються на відповідній імовірнісній моделі.

Звичайно, можна обробляти вибіркові дані, не використовуючи ту чи іншу ймовірну модель. Наприклад, можна розраховувати вибіркове середнє арифметичне, підраховувати частоту виконання тих чи інших умов тощо. Проте результати розрахунків відноситимуться лише до конкретної вибірки, перенесення отриманих з їх допомогою висновків на будь-яку іншу сукупність некоректне. Іноді подібну діяльність називають "аналіз даних". Порівняно з імовірнісно-статистичними методами, аналіз даних має обмежену пізнавальну цінність.

Отже, використання імовірнісних моделей на основі оцінювання та перевірки гіпотез за допомогою вибіркових характеристик – ось суть імовірнісно-статистичних методів прийняття рішень.

Підкреслимо, що логіка використання вибіркових характеристик до ухвалення рішень з урахуванням теоретичних моделей передбачає одночасне використання двох паралельних рядів понять, одне із яких відповідає імовірнісним моделям, а другий – вибірковим даним. На жаль, у ряді літературних джерел, Традиційно застарілих чи написаних у рецептурному дусі, робиться різницю між вибірковими і теоретичними характеристиками, що призводить читачів до подивів і помилок при практичному використанні статистичних методів.

Попередня

При проведенні психолого-педагогічних досліджень важлива роль приділяється математичним методам моделювання процесів та обробки експериментальних даних. До таких методів слід віднести, передусім, звані, вероятностно-статистические методи дослідження. Це з тим, що у поведінка як окремої людини у його діяльності, і людини у колективі істотно впливає безліч випадкових чинників. Випадковість не дозволяє описувати явища в рамках детермінованих моделей, тому що проявляється як недостатня регулярність у масових явищах і, отже, не дає змоги з достовірністю передбачати настання певних подій. Однак щодо таких явищ виявляються певні закономірності. Нерегулярність, властива випадковим подіям, за великої кількості випробувань, зазвичай, компенсується появою статистичної закономірності, стабілізацією частот наступів випадкових подій. Отже, дані випадкові подіїмають певну ймовірність. Існують два принципово різняться вероятностно-статистических методу психолого-педагогічних досліджень: класичний і некласичний. Проведемо порівняльний аналіз цих методів.

Класичний імовірнісно-статистичний метод. В основі класичного імовірнісно-статистичного методу дослідження лежать теорія ймовірностей та математична статистика. Цей метод застосовується щодо масових явищ випадкового характеру, він включає кілька етапів, основні у тому числі наступні.

1. Побудова імовірнісної моделі реальності, з аналізу статистичних даних (визначення закону розподілу випадкової величини). Природно, що закономірності масових випадкових явищ виражаються тим паче виразно, що більше обсяг статистичного матеріалу. Вибіркові дані, отримані під час проведення експерименту, завжди обмежені і мають, строго кажучи, випадковий характер. У зв'язку з цим важлива роль відводиться узагальнення закономірностей, отриманих на вибірці, та поширення їх на всю генеральну сукупність об'єктів. З метою вирішення цього завдання приймається певна гіпотеза про характер статистичної закономірності, яка проявляється у досліджуваному явищі, наприклад, гіпотеза про те, що явище, що досліджується, підпорядковується закону нормального розподілу. Така гіпотеза носить назву нульової гіпотези, яка може виявитися помилковою, тому поряд з нульовою гіпотезою ще висувається і альтернативна чи конкуруюча гіпотеза. Перевірка того, наскільки отримані експериментальні дані відповідають тій чи іншій статистичній гіпотезі, здійснюється за допомогою так званих непараметричних статистичних критеріїв або критеріїв згоди. В даний час широко використовуються критерії згоди Колмогорова, Смирнова, омега-квадрат та ін. Основна ідея цих критеріїв полягає у вимірі відстані між функцією емпіричного розподілу та функцією повністю відомого теоретичного розподілу. Методологія перевірки статистичної гіпотези суворо розроблена та викладена у великій кількості робіт з математичної статистики.

2. Проведення необхідних розрахунків математичними засобами у межах імовірнісної моделі. Відповідно до встановленої ймовірнісної моделі явища проводяться обчислення характеристичних параметрів, наприклад, таких як математичне очікування або середнє значення, дисперсія, стандартне відхилення, мода, медіана, показник асиметрії та ін.

3. Інтерпретація імовірнісно-статистичних висновків стосовно реальної ситуації.

В даний час класичний імовірнісно-статистичний метод добре розроблений і широко використовується при проведенні досліджень у різних галузях природничих, технічних та суспільних наук. Детальний опис суті даного методу та його застосування до вирішення конкретних завдань можна знайти у великій кількості літературних джерел, наприклад.

Некласичний імовірнісно-статистичний метод. Некласичний ймовірно-статистичний метод досліджень відрізняється від класичного тим, що він застосовується не лише до масових, а й до окремих подій, які мають принципово випадковий характер. Даний метод може бути ефективно використаний при аналізі поведінки індивіда у процесі виконання тієї чи іншої діяльності, наприклад, у процесі засвоєння знань учням. Особливості некласичного вероятностно-статистического методу психолого-педагогічних досліджень розглянемо з прикладу поведінки учнів у процесі засвоєння знань.

Вперше вероятностно-статистична модель поведінки учнів у процесі засвоєння знань було запропоновано у роботі . Подальший розвиток цієї моделі було зроблено у роботі. Вчення як вид діяльності, мета якого набуття людиною знань, умінь та навичок, залежить від рівня розвитку свідомості учня. До структури свідомості входять такі пізнавальні процеси, як відчуття, сприйняття, пам'ять, мислення, уяву. Аналіз цих процесів показує, що їм притаманні елементи випадковості, зумовлені випадковим характером психічного та соматичного станів індивіда, а також фізіологічним, психологічним та інформаційним шумами під час роботи головного мозку. Останнє призвело при описі процесів мислення відмовитися від використання моделі детерміністської динамічної системи на користь моделі випадкової динамічної системи. Це означає, що детермінізм свідомості реалізується через випадковість. Звідси можна зробити висновок, що знання людини, що є фактично продуктом свідомості, також мають випадковий характер, і, отже, для опису поведінки кожного окремого учня в процесі засвоєння знань може бути використаний імовірнісно-статистичний метод.

Відповідно до цього методу учень ідентифікується функцією розподілу (щільністю ймовірності), що визначає ймовірність знаходження його в одиничній галузі інформаційного простору. У процесі навчання функція розподілу, з якою ідентифікується учень, еволюціонуючи, рухається інформаційному просторі. Кожен учень має індивідуальні властивості і допускається незалежна локалізація (просторова та кінематична) індивідів один щодо одного.

На основі закону збереження ймовірності записується система диференціальних рівнянь, що є рівняннями безперервності, які пов'язують зміну щільності ймовірності за одиницю часу у фазовому просторі (просторі координат, швидкостей і прискорень різних порядків) з дивергенцією потоку щільності ймовірності в аналізованому фазовому просторі. Проведено аналіз аналітичних рішень низки рівнянь безперервності (функцій розподілу), що характеризують поведінку окремих учнів у процесі навчання.

При проведенні експериментальних дослідженьповедінки учнів у процесі засвоєння знань використовується імовірнісно-статистичне шкалювання, відповідно до якого шкала вимірювань є впорядкованою системою , де A - деяке цілком упорядковане безліч об'єктів (індивідів), що володіють цікавими для нас ознаками (емпірична система з відносинами); Ly - функціональний простір (простір функцій розподілу) із відносинами; F - операція гомоморфного відображення A підсистему Ly; G – група допустимих перетворень; f - операція відображення функцій розподілу з підсистеми Ly на числові системи з відносинами n-мірного простору M. Імовірностно-статистичне шкалювання застосовується для знаходження та обробки експериментальних функцій розподілу і включає три етапи.

1. Знаходження експериментальних функцій розподілу за результатами контрольного заходу, наприклад, іспиту. Типовий вид індивідуальних функцій розподілу, знайдених під час використання двадцятибальної шкали, представлений на рис. 1. Методика знаходження таких функцій описана у .

2. Відображення функцій розподілу на числовий простір. Для цього він проводиться розрахунок моментів індивідуальних функцій розподілу. Насправді, зазвичай, досить обмежитися визначенням моментів першого порядку (математичного очікування), другого порядку (дисперсії) і третього порядку, що характеризує асиметрію функції розподілу.

3. Ранжування учнів за рівнем знань з урахуванням порівняння моментів різних порядків їх індивідуальних функцій розподілу.

Мал. 1. Типовий вид індивідуальних функцій розподілу студентів, які отримали на іспиті з загальної фізики різні оцінки: 1 – традиційна оцінка «2»; 2 – традиційна оцінка «3»; 3 – традиційна оцінка «4»; 4 – традиційна оцінка «5»

На основі адитивності індивідуальних функцій розподілу знайдено експериментальні функції розподілу для потоку студентів (рис. 2).


Мал. 2. Еволюція повної функції розподілу потоку студентів, апроксимованої гладкими лініями: 1 – після першого курсу; 2 – після другого курсу; 3 – після третього курсу; 4 – після четвертого курсу; 5 - після п'ятого курсу

Аналіз даних, поданих на рис. 2 показує, що в міру просування в інформаційному просторі функції розподілу розпливаються. Це відбувається через те, що математичні очікування функцій розподілу індивідів рухаються з різними швидкостями, а самі функції розпливаються через дисперсію. Подальший аналіз даних функцій розподілу може бути проведений у рамках класичного імовірнісно-статистичного методу.

Обговорення результатів. Аналіз класичного та некласичного імовірнісно-статистичних методів психолого-педагогічних досліджень показав, що між ними є суттєва відмінність. Воно, як це можна зрозуміти зі сказаного вище, полягає в тому, що класичний метод застосовний лише до аналізу масових подій, а некласичний метод застосовний як до аналізу масових, так і одиночних подій. У зв'язку з цим класичний метод може бути умовно названий масовим імовірнісно-статистичним методом (МВСМ), а некласичний метод - індивідуальним імовірнісно-статистичним методом (ІВСМ). У 4] показано, що жоден із класичних методів оцінки знань учнів у рамках ймовірносно-статистичної моделі індивіда не може бути застосований для цих цілей.

Відмінні риси методів МВСМ та ІВСМ розглянемо на прикладі вимірювання повноти знань учнів. З цією метою проведемо уявний експеримент. Припустимо, що є велика кількість абсолютно однакових за психічними і фізичними характеристиками учнів, які мають однакову передісторію, і нехай вони, не взаємодіючи один з одним, одночасно беруть участь в тому самому пізнавальному процесі, відчуваючи абсолютно однаковий строго детерміноване вплив. Тоді відповідно до класичних уявлень про об'єкти вимірювання всі учні мали б отримати однакові оцінки повноти знань з будь-якою заданою точністю вимірювань. Проте насправді за досить велику точність вимірювань оцінки повноти знань учнів відрізнятимуться . Пояснити такий результат вимірювань у рамках МВСМ неможливо, оскільки вихідно передбачається, що вплив на абсолютно однакових невзаємодіючих між собою учнів має строго детермінований характер. Класичний вероятностно-статистический метод не враховує те, що детермінізм процесу пізнання реалізується через випадковість, внутрішньо властиву кожному індивіду, що пізнає навколишній світ.

Випадковий характер поведінки учня у процесі засвоєння знань враховує ІВСМ. Застосування індивідуального вероятностно-статистического методу для аналізу поведінки аналізованого ідеалізованого колективу учнів показало, що вказати точно становище кожного учня у інформаційному просторі не можна, можна лише казати ймовірності перебування їх у тій чи іншій області інформаційного простору. Фактично кожен учень ідентифікується індивідуальною функцією розподілу, причому її параметри, такі як математичне очікування, дисперсія та інших., індивідуальні кожному за учня. Це означає, що індивідуальні функції розподілу будуть у різних галузях інформаційного простору. Причина такої поведінки учнів полягає у випадковому характері процесу пізнання.

Однак у ряді випадків результати досліджень, здобуті в рамках МВСМ, можуть бути інтерпретовані і в рамках ІВСМ. Припустимо, що викладач в оцінці знань учня використовує п'ятибальну шкалу вимірів. І тут похибка в оцінці знань становить ±0,5 бала. Отже, коли учню виставляється оцінка, наприклад, 4 бали, це означає, що його знання перебувають у проміжку від 3,5 до 4,5 балів. Фактично, положення індивіда в інформаційному просторі в даному випадку визначається прямокутною функцією розподілу, ширина якої дорівнює похибці вимірювання ±0,5 бала, а оцінка є математичним очікуванням. Ця похибка настільки велика, що дозволяє спостерігати справжній вид функції розподілу. Однак, незважаючи на таку грубу апроксимацію функції розподілу, вивчення її еволюції дозволяє отримати важливу інформацію як про поведінку окремого індивіда, так і колективу учнів в цілому.

На результат виміру повноти знань учня безпосередньо чи опосередковано впливає свідомість викладача (вимірника), якому також властива випадковість. У процесі педагогічних вимірів фактично має місце взаємодія двох випадкових динамічних систем, що ідентифікують поведінку учня та викладача у цьому процесі. В розглянуто взаємодію студентської підсистеми з професорсько-викладацькою підсистемою та показано, що швидкість руху математичного очікування індивідуальних функцій розподілу студентів в інформаційному просторі пропорційна функції впливу професорсько-викладацького колективу та обернено пропорційна функції інертності, що характеризує неподажність зміні положення математичного у механіці).

В даний час, незважаючи на значні досягнення у розробці теоретичних та практичних основ вимірів при проведенні психолого-педагогічних досліджень, проблема вимірів загалом ще далека від вирішення. Це пов'язано, перш за все, з тим, що досі немає достатньої інформації про вплив свідомості на процес вимірювання. Аналогічна ситуація склалася і під час вирішення проблеми вимірювань у квантовій механіці. Так, у роботі при розгляді концептуальних проблем квантової теорії вимірів йдеться про те, що дозволити деякі парадокси вимірів у квантовій механіці «навряд чи можливо без безпосереднього включення свідомості спостерігача у теоретичний опис квантового виміру». Далі йдеться, що «… несуперечливим є припущення у тому, що свідомість може зробити можливим деяке подія, навіть якщо за законами фізики (квантової механіки) ймовірність цієї події мала. Зробимо важливе уточнення формулювання: свідомість цього спостерігача може зробити ймовірним, що він побачить цю подію».

3. Суть імовірнісно-статистичних методів

Як підходи, ідеї та результати теорії ймовірностей та математичної статистики використовуються при обробці даних – результатів спостережень, вимірювань, випробувань, аналізів, дослідів з метою ухвалення практично важливих рішень?

Базою є імовірнісна модель реального явища чи процесу, тобто. математична модель, у якій об'єктивні співвідношення виражені термінах теорії ймовірностей. Імовірності використовуються передусім для опису невизначеностей, які необхідно враховувати під час прийняття рішень. Маються на увазі як небажані можливості (ризики), так і привабливі (щасливий випадок). Іноді випадковість вноситься в ситуацію свідомо, наприклад, під час жеребкування, випадкового відбору одиниць для контролю, проведення лотерей або опитувань споживачів.

Теорія ймовірностей дозволяє за одними ймовірностями розрахувати інші, які цікавлять дослідника. Наприклад, за ймовірністю випадання герба можна розрахувати ймовірність того, що при 10 кидання монет випаде не менше 3 гербів. Подібний розрахунок спирається на ймовірну модель, згідно з якою кидання монет описуються схемою незалежних випробувань, крім того, випадання герба і решітки рівноможливі, а тому ймовірність кожної з цих подій дорівнює ½. Більш складною є модель, де замість кидання монети розглядається перевірка якості одиниці виробленої продукції. Відповідна ймовірна модель спирається на припущення про те, що контроль якості різних одиниць продукції описується схемою незалежних випробувань. На відміну від моделі з киданням монет, необхідно ввести новий параметр – ймовірністьр

Обговоримо модель контролю якості із загальною для всіх одиниць продукції ймовірністю дефектності Подібний розрахунок спирається на ймовірну модель, згідно з якою кидання монет описуються схемою незалежних випробувань, крім того, випадання герба і решітки рівноможливі, а тому ймовірність кожної з цих подій дорівнює ½. Більш складною є модель, де замість кидання монети розглядається перевірка якості одиниці виробленої продукції. Відповідна ймовірна модель спирається на припущення про те, що контроль якості різних одиниць продукції описується схемою незалежних випробувань. На відміну від моделі з киданням монет, необхідно ввести новий параметр – ймовірність. Щоб під час аналізу моделі «дійти до числа», необхідно замінити Подібний розрахунок спирається на ймовірну модель, згідно з якою кидання монет описуються схемою незалежних випробувань, крім того, випадання герба і решітки рівноможливі, а тому ймовірність кожної з цих подій дорівнює ½. Більш складною є модель, де замість кидання монети розглядається перевірка якості одиниці виробленої продукції. Відповідна ймовірна модель спирається на припущення про те, що контроль якості різних одиниць продукції описується схемою незалежних випробувань. На відміну від моделі з киданням монет, необхідно ввести новий параметр – ймовірністьна деяке конкретне значення. Для цього необхідно вийти з рамок імовірнісної моделі та звернутися до даних, отриманих при контролі якості. Математична статистика вирішує зворотне завдання стосовно теорії ймовірностей. Її мета – на основі результатів спостережень (вимірювань, аналізів, випробувань, дослідів) отримати висновки про ймовірності, що лежать в основі ймовірнісної моделі. Наприклад, на основі частоти появи дефектних виробів під час контролю можна зробити висновки про ймовірність дефектності (див. обговорення вище з використанням теореми Бернуллі). На основі нерівності Чебишева робилися висновки про відповідність частоти появи дефектних виробів гіпотезі про те, що ймовірність дефектності набуває певного значення.

Таким чином, застосування математичної статистики спирається на ймовірну модель явища або процесу. Використовуються два паралельних ряду понять – які стосуються теорії (імовірнісної моделі) і які стосуються практики (вибірці результатів спостережень). Наприклад, теоретичній ймовірності відповідає частота, знайдена за вибіркою. Математичне очікування (теоретичний ряд) відповідає вибіркове середнє арифметичне (практичний ряд). Як правило, вибіркові показники є оцінками теоретичних. При цьому величини, що належать до теоретичного ряду, «перебувають у головах дослідників», відносяться до світу ідей (за давньогрецьким філософом Платоном), недоступні для безпосереднього виміру. Дослідники мають у своєму розпорядженні лише вибіркові дані, за допомогою яких вони намагаються встановити властивості теоретичної ймовірнісної моделі, що їх цікавлять.

(Практичний ряд). Як правило, вибіркові характеристики є оцінками теоретичних. При цьому величини, що належать до теоретичного ряду, «перебувають у головах дослідників», відносяться до світу ідей (за давньогрецьким філософом Платоном), недоступні для безпосереднього виміру. Дослідники мають у своєму розпорядженні лише вибіркові дані, за допомогою яких вони намагаються встановити властивості теоретичної ймовірнісної моделі, що їх цікавлять.

Щоб перенести висновки з вибірки більш широку сукупність, необхідні ті чи інші припущення про зв'язок вибіркових характеристик з характеристиками цієї більшої сукупності. Ці припущення ґрунтуються на відповідній імовірнісній моделі.

Звичайно, можна обробляти вибіркові дані, не використовуючи ту чи іншу ймовірну модель. Наприклад, можна розраховувати вибіркове середнє арифметичне, підраховувати частоту виконання тих чи інших умов тощо. Проте результати розрахунків відноситимуться лише до конкретної вибірки, перенесення отриманих з їх допомогою висновків на будь-яку іншу сукупність некоректне. Іноді подібну діяльність називають "аналіз даних". Порівняно з імовірнісно-статистичними методами, аналіз даних має обмежену пізнавальну цінність.

Отже, використання імовірнісних моделей на основі оцінювання та перевірки гіпотез за допомогою вибіркових характеристик – ось суть імовірнісно-статистичних методів прийняття рішень.

Підкреслимо, що логіка використання вибіркових характеристик до ухвалення рішень з урахуванням теоретичних моделей передбачає одночасне використання двох паралельних рядів понять, одне із яких відповідає імовірнісним моделям, а другий – вибірковим даним. На жаль, у ряді літературних джерел, зазвичай застарілих чи написаних у рецептурному дусі, немає різниці між вибірковими і теоретичними характеристиками, що призводить читачів до подивів і помилок при практичному використанні статистичних методів.

Попередня

Особливий інтерес становить кількісна оцінка підприємницького ризику з допомогою методів математичної статистики. Основними інструментами цього методу оцінки є:

§ ймовірність появи випадкової величини,

§ математичне очікування або середнє значення досліджуваної випадкової величини,

§ дисперсія,

§ стандартне (середньоквадратичне) відхилення,

§ коефіцієнт варіації ,

§ розподіл ймовірностей досліджуваної випадкової величини.

Для ухвалення рішення потрібно знати величину (ступінь) ризику, що вимірюється двома критеріями:

1) середнє очікуване значення (математичне очікування),

2) коливання (мінливість) можливого результату.

Середнє очікуване значення це середньозважене значення випадкової величини, пов'язане з невизначеністю ситуації:

,

де значення випадкової величини

Середнє очікуване значення вимірює результат, на який ми очікуємо в середньому.

Середнє значення є узагальненою якісною характеристикою і дозволяє прийняття рішення на користь якогось окремого значення випадкової величини.

Для ухвалення рішення необхідно виміряти коливання показників, тобто визначити міру мінливості можливого результату.

Коливання можливого результату є ступенем відхилення очікуваного значення від середньої величини.

Для цього на практиці зазвичай використовують два тісно пов'язані критерії: «дисперсія» та «середньоквадратичне відхилення».

Дисперсія – середньозважене із квадратів дійсних результатів від середнього очікуваного:

Середньоквадратичне відхилення - Це квадратний корінь з дисперсії. Воно є розмірною величиною і вимірюється в тих самих одиницях, в яких вимірюється досліджувана випадкова величина:

.

Дисперсія та середньоквадратичне відхилення є мірою абсолютного коливання. Для аналізу зазвичай використовується коефіцієнт варіації.

Коефіцієнт варіації є відношенням середньоквадратичного відхилення до середнього очікуваного значення, помножене на 100%

або .

На коефіцієнт варіації впливають абсолютні значення досліджуваного показника.

За допомогою коефіцієнта варіації можна порівнювати навіть коливання ознак, виражених у різних одиницях виміру. Коефіцієнт варіації може змінюватись від 0 до 100%. Чим більший коефіцієнт, тим більше коливання.


В економічній статистиці встановлено таку оцінку різних значень коефіцієнта варіації:

до 10% – слабке коливання, 10 – 25% – помірне, понад 25% – високе.

Відповідно, чим вищі коливання, тим більший ризик.

приклад.Власник невеликого магазину спочатку кожного дня закуповує для реалізації деякий продукт, що швидко псується. Одиниця цього продукту коштує 200 грн. Ціна реалізації – 300 грн. за одиницю. Зі спостережень відомо, що попит на цей продукт протягом дня може бути 4, 5, 6 або 7 одиниць з відповідними ймовірностями 0,1; 0,3; 0,5; 0,1. Якщо продукт протягом дня не буде реалізований, то наприкінці його завжди куплять за ціною 150 грн. за одиницю. Скільки одиниць цього продукту має купити власник магазину на початку дня?

Рішення. Побудуємо матрицю прибутку власника магазину. Обчислимо прибуток, яку отримає власник, якщо, наприклад, він закупить 7 одиниць продукту, а реалізує протягом дня 6 та наприкінці дня одну одиницю. Кожна одиниця продукту, реалізована протягом дня, дає прибуток у 100 грн., а наприкінці дня – втрати 200 – 150 = 50 грн. Таким чином, прибуток у цьому випадку становитиме:

Аналогічно проводяться розрахунки при інших поєднаннях пропозиції та попиту.

Очікуваний прибуток обчислюється як математичне очікування можливих значень прибутку кожного рядка збудованої матриці з урахуванням відповідних ймовірностей. Як бачимо, серед очікуваних прибутків найбільша рівна 525 грн. Вона відповідає закупівлі розглянутого продукту у кількості 6 одиниць.

Для обґрунтування остаточної рекомендації щодо закупівлі необхідної кількості одиниць продукту обчислимо дисперсію, середньоквадратичне відхилення та коефіцієнт варіації для кожного можливого поєднання пропозиції та попиту продукту (кожного рядка матриці прибутку):

400 0,1 40 16000
400 0,3 120 48000
400 0,5 200 80000
400 0,1 40 16000
1,0 400 160000
350 0,1 35 12250
500 0,3 150 75000
500 0,5 250 125000
500 0,1 50 25000
1,0 485 2372500
300 0,1 30 9000
450 0,3 135 60750
600 0,5 300 180000
600 0,1 60 36000
1,0 525 285750

Що стосується закупівлі власником магазину 6 одиниць продукту порівняно з 5 та 4 одиницями, то це неочевидно, оскільки ризик при закупівлі 6 одиниць продукту (19,2%) більший, ніж при закупівлі 5 одиниць (9,3%) і тим більше, ніж при закупівлі 4 одиниць (0%).

Таким чином, маємо всю інформацію про очікувані прибутки та ризики. І вирішувати, скільки одиниць продукту потрібно закупити щоранку власнику магазину з урахуванням свого досвіду, схильності до ризику.

На наш погляд, власнику магазину слід рекомендувати щоранку закуповувати 5 одиниць продукту і його середній очікуваний прибуток дорівнюватиме 485 грн. і якщо порівняти це із закупівлею 6 одиниць продукту, за якої середній очікуваний прибуток становить 525 грн., що на 40 грн. більше, але ризик у цьому випадку буде більшим у 2,06 раза.

Надіслати свою гарну роботу до бази знань просто. Використовуйте форму нижче

Студенти, аспіранти, молоді вчені, які використовують базу знань у своєму навчанні та роботі, будуть вам дуже вдячні.

Розміщено на http://www.allbest.ru/

Розміщено на http://www.allbest.ru/

Вступ

1. Розподіл "хі-квадрат"

Висновок

додаток

Вступ

Як підходи, ідеї та результати теорії ймовірностей використовуються у нашому житті? математичний квадрат теорія

Базою є імовірнісна модель реального явища чи процесу, тобто. математична модель, у якій об'єктивні співвідношення виражені термінах теорії ймовірностей. Імовірності використовуються, перш за все, для опису невизначеностей, які необхідно враховувати під час прийняття рішень. Маються на увазі як небажані можливості (ризики), так і привабливі ("щасливий випадок"). Іноді випадковість вноситься в ситуацію свідомо, наприклад, під час жеребкування, випадкового відбору одиниць для контролю, проведення лотерей або опитувань споживачів.

Теорія ймовірностей дозволяє за одними ймовірностями розрахувати інші, які цікавлять дослідника.

Імовірнісна модель явища чи процесу є фундаментом математичної статистики. Використовуються два паралельних ряду понять - які стосуються теорії (імовірнісної моделі) і які стосуються практики (вибірці результатів спостережень). Наприклад, теоретичній ймовірності відповідає частота, знайдена за вибіркою. Математичне очікування (теоретичний ряд) відповідає вибіркове середнє арифметичне (практичний ряд). Як правило, вибіркові характеристики є оцінками теоретичних. При цьому величини, що належать до теоретичного ряду, "перебувають у головах дослідників", відносяться до світу ідей (за давньогрецьким філософом Платоном), недоступні для безпосереднього виміру. Дослідники мають у своєму розпорядженні лише вибіркові дані, за допомогою яких вони намагаються встановити властивості теоретичної ймовірнісної моделі, що їх цікавлять.

Навіщо ж потрібна імовірнісна модель? Справа в тому, що тільки з її допомогою можна перенести властивості, встановлені за результатами аналізу конкретної вибірки, на інші вибірки, а також на так звану генеральну сукупність. Термін "генеральна сукупність" використовується, коли йдеться про велику, але кінцеву сукупність одиниць, що вивчаються. Наприклад, про сукупність всіх жителів Росії або сукупність всіх споживачів розчинної кави в Москві. Мета маркетингових чи соціологічних опитувань у тому, щоб твердження, отримані за вибіркою із сотень чи тисяч жителів, перенести на генеральні сукупності кілька мільйонів. Під час контролю якості у ролі генеральної сукупності виступає партія продукції.

Щоб перенести висновки з вибірки більш широку сукупність, необхідні ті чи інші припущення про зв'язок вибіркових характеристик з характеристиками цієї більшої сукупності. Ці припущення ґрунтуються на відповідній імовірнісній моделі.

Звичайно, можна обробляти вибіркові дані, не використовуючи ту чи іншу ймовірну модель. Наприклад, можна розраховувати вибіркове середнє арифметичне, підраховувати частоту виконання тих чи інших умов тощо. Проте результати розрахунків відноситимуться лише до конкретної вибірки, перенесення отриманих з їх допомогою висновків на будь-яку іншу сукупність некоректне. Іноді таку діяльність називають "аналіз даних". Порівняно з імовірнісно-статистичними методами, аналіз даних має обмежену пізнавальну цінність.

Отже, використання імовірнісних моделей на основі оцінювання та перевірки гіпотез за допомогою вибіркових характеристик – ось суть імовірнісно-статистичних методів прийняття рішень.

1. Розподіл "хі-квадрат"

За допомогою нормального розподілу визначаються три розподіли, які часто використовуються при статистичній обробці даних. Це розподіли Пірсона ("хі - квадрат"), Стьюдента та Фішера.

Ми зупинимося на розподілі ("хі – квадрат"). Вперше цей розподіл було досліджено астрономом Ф. Хельмертом у 1876 році. У зв'язку з гауссівською теорією помилок він досліджував суми квадратів n незалежних стандартно нормально розподілених випадкових величин. Пізніше Карл Пірсон (Karl Pearson) дав ім'я цієї функції розподілу "хі - квадрат". І зараз розподіл носить його ім'я.

Завдяки тісному зв'язку з нормальним розподілом, ч2-розподіл відіграє важливу роль у теорії ймовірностей та математичної статистики. ч2-розподіл, та багато інших розподілів, які визначаються за допомогою ч2-розподілу (наприклад - розподіл Стьюдента), описують вибіркові розподіли різних функцій від нормально розподілених результатів спостережень і використовуються для побудови довірчих інтервалів та статистичних критеріїв.

Розподіл Пірсона (хі - квадрат) - розподіл випадкової величини де X1, X2, ..., Xn - нормальні незалежні випадкові величини, причому математичне очікування кожної їх дорівнює нулю, а середнє квадратичне відхилення - одиниці.

Сума квадратів

розподілено згідно із законом ("хі - квадрат").

У цьому кількість доданків, тобто. n, називається "числом ступенів свободи" розподілу хі - квадрат. Зі збільшенням числа ступенів свободи розподіл повільно наближається до нормального.

Щільність цього розподілу

Отже, розподіл ч2 залежить від одного параметра n – числа ступенів свободи.

Функція розподілу ч2 має вигляд:

якщо ч2?0. (2.7.)

На Малюнку 1 зображено графік густини ймовірності та функції ч2 - розподілу для різних ступенів свободи.

Рисунок 1 Залежність щільності ймовірності ц (x) у розподілі ч2 (хі - квадрат) при різному числі ступенів свободи

Моменти розподілу "хі-квадрат":

Розподіл "хі-квадрат" використовують при оцінюванні дисперсії (за допомогою довірчого інтервалу), при перевірці гіпотез згоди, однорідності, незалежності, насамперед для якісних (категоризованих) змінних, що приймають кінцеву кількість значень, та в багатьох інших завданнях статистичного аналізу даних.

2. "Хі-квадрат" у завданнях статистичного аналізу даних

Статистичні методи аналізу даних застосовуються практично у всіх сферах діяльності людини. Їх використовують завжди, коли необхідно отримати та обґрунтувати будь-які судження про групу (об'єктів чи суб'єктів) з деякою внутрішньою неоднорідністю.

Сучасний етап розвитку статистичних методів можна відраховувати з 1900 року, коли англієць К. Пірсон заснував журнал "Biometrika". Перша третина ХХ ст. пройшла під знаком параметричної статистики. Вивчалися методи, засновані на аналізі даних параметричних сімейств розподілів, що описуються кривими сімейства Пірсона. Найбільш популярним був нормальний розподіл. Для перевірки гіпотез використовувалися критерії Пірсона, Стьюдента, Фішера. Було запропоновано метод максимальної правдоподібності, дисперсійний аналіз, сформульовано основні ідеї планування експерименту.

Розподіл "хі-квадрат" є одним із найбільш широко використовуваних у статистиці для перевірки статистичних гіпотез. На основі розподілу "хі-квадрат" побудований один із найпотужніших критеріїв згоди - критерій "хі-квадрату" Пірсона.

Критерієм згоди називають критерій перевірки гіпотези про передбачуваний закон невідомого розподілу.

Критерій ч2 (хі-квадрат) використовується для перевірки гіпотези різних розподілів. У цьому полягає його перевага.

Розрахункова формула критерію дорівнює

де m і m" - відповідно емпіричні та теоретичні частоти

розглянутого розподілу;

n – число ступенів свободи.

Для перевірки нам необхідно порівнювати емпіричні (спостерігаються) та теоретичні (обчислені у припущенні нормального розподілу) частоти.

При повному збігу емпіричних частот із частотами, обчисленими або очікуваними S (Е - Т) = 0 і критерій ч2 теж буде дорівнює нулю. Якщо ж S (Е - Т) не дорівнює нулю, це вкаже на невідповідність обчислених частот емпіричним частотам ряду. У разі необхідно оцінити значимість критерію ч2, який теоретично може змінюватися від нуля до нескінченності. Це здійснюється шляхом порівняння фактично отриманої величини ч2ф з його критичним значенням (ч2st). (a) та числа ступенів свободи (n).

Розподіл ймовірних значень випадкової величини ч2 безперервно та асиметрично. Воно залежить від числа ступенів свободи (n) і наближається до нормального розподілу зі збільшенням числа спостережень. Тому застосування критерію ч2 до оцінки дискретних розподілівпов'язано з деякими похибками, які позначаються на його величині, особливо на нечисленних вибірках. Для отримання більш точних оцінок вибірка, що розподіляється в варіаційний ряд, повинна мати щонайменше 50 варіантів. Правильне застосування критерію ч2 вимагає також, щоб частоти варіантів у крайніх класах були б менше 5; якщо їх менше 5, то вони поєднуються з частотами сусідніх класів, щоб у сумі становили величину більшу або рівну 5. Відповідно до об'єднання частот зменшується і число класів (N). Число ступенів свободи встановлюється за вторинним числом класів з урахуванням кількості обмежень свободи варіації.

Так як точність визначення критерію ч2 значною мірою залежить від точності розрахунку теоретичних частот (Т), для отримання різниці між емпіричними та обчисленими частотами слід використовувати неокруглені теоретичні частоти.

Як приклад візьмемо дослідження, опубліковане на сайті, присвяченому застосуванню статистичних методів у гуманітарних науках.

Критерій "Хі-квадрат" дозволяє порівнювати розподіл частот через незалежно від того, розподілені вони нормально чи ні.

Під частотою розуміється кількість появ будь-якої події. Зазвичай, з частотою появи події мають справу, коли змінні виміряні в шкалі найменувань та інші характеристики, крім частоти підібрати неможливо або проблематично. Інакше кажучи, коли змінна має якісні властивості. Також багато дослідників схильні переводити бали тесту до рівнів (високий, середній, низький) і будувати таблиці розподілів балів, щоб дізнатися кількість людей за цими рівнями. Щоб довести, що в одному з рівнів (в одній із категорій) кількість людей дійсно більша (менша) так само використовується коефіцієнт Хі-квадрат.

Розберемо найпростіший приклад.

Серед молодших підлітків було проведено тест виявлення самооцінки. Бали тесту були переведені на три рівні: високий, середній, низький. Частоти розподілилися так:

Високий (В) 27 чол.

Середній (С) 12 чол.

Низький (Н) 11 чол.

Очевидно, що дітей із високою самооцінкою більшість, проте це потрібно довести статистично. Для цього використовуємо критерій хі-квадрат.

Наше завдання – перевірити, чи відрізняються отримані емпіричні дані від теоретично рівноймовірних. Для цього потрібно знайти теоретичні частоти. У нашому випадку теоретичні частоти - це рівноймовірні частоти, які знаходяться шляхом складання всіх частот і поділу на кількість категорій.

У нашому випадку:

(В + С + Н) / 3 = (27 +12 +11) / 3 = 16,6

Формула для розрахунку критерію хі-квадрат:

ч2 = ?(Е - Т)І/Т

Будуємо таблицю:

Емпірич. (Е)

Теоретич. (Т)

(Е - Т)І/Т

Знаходимо суму останнього стовпця:

Тепер потрібно знайти критичне значення критерію таблиці критичних значень (Таблиця 1 у додатку). Для цього нам знадобиться кількість ступенів свободи (n).

n = (R - 1) * (C - 1)

де R – кількість рядків у таблиці, C – кількість стовпців.

У нашому випадку лише один стовпець (маються на увазі вихідні емпіричні частоти) і три рядки (категорії), тому формула змінюється – виключаємо стовпці.

n = (R - 1) = 3-1 = 2

Для ймовірності помилки p?0,05 та n = 2 критичне значення ч2 = 5,99.

Отримане емпіричне значення більше критичного - відмінності частот достовірні (ч2 = 9,64; p? 0,05).

Як бачимо, розрахунок критерію дуже простий і не займає багато часу. Практична цінність критерію хі-квадрат величезна. Цей метод виявляється найбільш цінним під час аналізу відповіді питання анкет.

Розберемо складніший приклад.

Наприклад, психолог хоче дізнатися, чи справді те, що вчителі більш упереджено ставляться до хлопчиків, ніж до дівчаток. Тобто. більш схильні хвалити дівчаток. Для цього психологом були проаналізовані характеристики учнів, написані вчителями, на предмет частоти трьох слів: "активний", "старальний", "дисциплінований", синоніми слів так само підраховувалися.

Дані про частоту слів були занесені в таблицю:

Для обробки отриманих даних використовуємо критерій хі-квадрат.

І тому побудуємо таблицю розподілу емпіричних частот, тобто. тих частот, які ми спостерігаємо:

Теоретично, ми очікуємо, що частоти розподіляться рівноймовірно, тобто. частота розподілиться пропорційно між хлопчиками та дівчатками. Побудуємо таблицю теоретичних частот. Для цього помножимо суму по рядку на суму по стовпцю і розділимо число, що вийшло, на загальну суму (s).

Підсумкова таблиця для обчислень виглядатиме так:

Емпірич. (Е)

Теоретич. (Т)

(Е - Т)І/Т

Хлопчики

"Активний"

"Дивний"

"Дисциплінований"

"Активний"

"Дивний"

"Дисциплінований"

Сума: 4,21

ч2 = ?(Е - Т)І/Т

де R - кількість рядків у таблиці.

У нашому випадку хі-квадрат = 4,21; n = 2.

За таблицею критичних значень критерію знаходимо: при n = 2 та рівні помилки 0,05 критичне значення ч2 = 5,99.

Отримане значення менше критичного, а отже, приймається нульова гіпотеза.

Висновок: вчителі не надають значення стать дитини при написанні їй характеристики.

Висновок

Студенти майже всіх спеціальностей вивчають наприкінці курсу вищої математикиРозділ "теорія ймовірностей і математична статистика", реально вони знайомляться лише з деякими основними поняттями та результатами, яких явно не достатньо для практичної роботи. З деякими математичними методами дослідження студенти зустрічаються в спеціальних курсах(наприклад, таких, як "Прогнозування та техніко-економічне планування", "Техніко-економічний аналіз", "Контроль якості продукції", "Маркетинг", "Контролінг", "Математичні методи прогнозування", "Статистика" та ін. - випадку студентів економічних спеціальностей), проте виклад у більшості випадків має дуже скорочений і рецептурний характер. В результаті знань у фахівців із прикладної статистики недостатньо.

Тому велике значеннямає курс "Прикладна статистика" в технічних вузах, а в економічних вишах- курс "Економетрика", оскільки економетрика - це, як відомо, статистичний аналіз конкретних економічних даних.

Теорія ймовірності та математична статистика дають фундаментальні знання для прикладної статистики та економетрики.

Вони потрібні фахівцям для практичної роботи.

Я розглянула безперервну ймовірнісну модель і постаралася на прикладах показати її використання.

І наприкінці своєї роботи я дійшла висновку, що грамотна реалізація основних процедур математико-статичного аналізу даних, статична перевірка гіпотез неможлива без знання моделі "хі-квадрат", а також уміння користуватись її таблицею.

Список використаної літератури

1. Орлов А.І. Прикладна статистика М: Видавництво "Іспит", 2004.

2. Гмурман В.Є. Теорія ймовірностей та математична статистика. М.: вища школа, 1999. – 479с.

3. Айвозян С.А. Теорія ймовірностей та прикладна статистика, т.1. М.: Юніті, 2001. – 656с.

4. Хамітов Г.П., Ведернікова Т.І. Імовірності та статистика. Іркутськ: БДУЕП, 2006 – 272с.

5. Єжова Л.М. Економетрики. Іркутськ: БДУЕП, 2002. – 314с.

6. Мостеллер Ф. П'ятдесят цікавих ймовірнісних завдань із рішеннями. М.: Наука, 1975. – 111с.

7. Мостеллер Ф. Імовірність. М.: Світ, 1969. – 428с.

8. Яглом А.М. Можливість та інформація. М.: Наука, 1973. – 511с.

9. Чистяков В.П. Курс теорії ймовірностей. М.: Наука, 1982. – 256с.

10. Кремер Н.Ш. Теорія ймовірностей та математична статистика. М.: ЮНІТІ, 2000. – 543с.

11. Математична енциклопедія, т.1. М.: Радянська енциклопедія, 1976. – 655с.

12. http://psystat.at.ua/ - Статистика в психології та педагогіці. Критерій Хі-квадрат.

додаток

Критичні точки розподілу ч2

Таблиця 1

Розміщено на Allbest.ru

...

Подібні документи

    Імовірнісна модель та аксіоматика О.М. Колмогорова. Випадкові величини та вектори, класична гранична проблема теорії ймовірностей. Первинне оброблення статистичних даних. Точкові оцінки числових показників. Статистична перевірка гіпотез.

    методичка, доданий 02.03.2010

    Правила виконання та оформлення контрольних робітдля заочного відділення. Завдання та приклади вирішення задач з математичної статистики та теорії ймовірності. Таблиці довідкових даних розподілів, густина стандартного нормального розподілу.

    методичка , доданий 29.11.2009

    Основні методи формалізованого опису та аналізу випадкових явищ, обробки та аналізу результатів фізичних та чисельних експериментівтеорії ймовірності. Основні поняття та аксіоми теорії ймовірності. Основні поняття математичної статистики.

    курс лекцій, доданий 08.04.2011

    Визначення закону розподілу ймовірностей результатів виміру математичної статистики. Перевірка відповідності емпіричного розподілу теоретичному. Визначення довірчого інтервалу, у якому лежить значення вимірюваної величини.

    курсова робота , доданий 11.02.2012

    Збіжність послідовностей випадкових величин та ймовірнісних розподілів. Метод характеристичних функций. Перевірка статистичних гіпотез та виконання центральної граничної теореми для заданих послідовностей незалежних випадкових величин.

    курсова робота , доданий 13.11.2012

    Основні етапи обробки даних натуральних спостережень методом математичної статистики. Оцінка отриманих результатів, їх використання при прийнятті управлінських рішень у галузі охорони природи та природокористування. Перевірка статистичних гіпотез.

    практична робота , доданий 24.05.2013

    Сутність закону розподілу та його практичне застосуваннядля вирішення статистичних завдань. Визначення дисперсії випадкової величини, математичного очікуваннята середньоквадратичного відхилення. Особливості однофакторного дисперсійного аналізу.

    контрольна робота , доданий 07.12.2013

    Імовірність та її загальне визначення. Теореми складання та множення ймовірностей. Дискретні випадкові величини та його числові характеристики. Закон великих чисел. Статистичне розподілення вибірки. Елементи кореляційного та регресійного аналізу.

    курс лекцій, доданий 13.06.2015

    Програма курсу, основні поняття та формули теорії ймовірностей, їх обґрунтування та значення. Місце та роль математичної статистики в дисципліні. Приклади та роз'яснення щодо вирішення найпоширеніших завдань з різним темамданих навчальних дисциплін.

    методичка, доданий 15.01.2010

    Теорія ймовірностей та математична статистика є науками про методи кількісного аналізумасових випадкових явищ. Безліч значень випадкової величини називається вибіркою, а елементи множини – вибірковими значеннями випадкової величини.