Probabilistička (statistička) metoda procjene rizika. Probabilističke i statističke metode za modeliranje ekonomskih sustava. Numeričke karakteristike slučajnih varijabli

Dio 1. Temelji primijenjene statistike

1.2.3. Bit probabilističkih i statističkih metoda odlučivanja

Kako se pristupi, ideje i rezultati teorije vjerojatnosti i matematičke statistike koriste u donošenju odluka?

Osnova je probabilistički model stvarne pojave ili procesa, tj. matematički model u kojem su objektivni odnosi izraženi u terminima teorije vjerojatnosti. Vjerojatnosti se prvenstveno koriste za opisivanje neizvjesnosti koje se moraju uzeti u obzir pri donošenju odluka. To se odnosi kako na nepoželjne prilike (rizike), tako i na one privlačne („sretna prilika”). Ponekad se slučajnost namjerno uvodi u situaciju, na primjer, prilikom izvlačenja ždrijeba, nasumičnog odabira jedinica za kontrolu, provođenja lutrije ili anketiranja potrošača.

Teorija vjerojatnosti dopušta korištenje jedne vjerojatnosti za izračun drugih od interesa za istraživača. Na primjer, koristeći vjerojatnost dobivanja grba, možete izračunati vjerojatnost da ćete u 10 bacanja novčića dobiti najmanje 3 grba. Takav izračun temelji se na probabilističkom modelu, prema kojem su bacanja novčića opisana uzorkom neovisnih pokušaja, a osim toga, grb i oznake su jednako mogući, pa je stoga vjerojatnost svakog od ovih događaja jednaka; do ½. Složeniji model je onaj koji razmatra provjeru kvalitete jedinice proizvodnje umjesto bacanja novčića. Odgovarajući probabilistički model temelji se na pretpostavci da je kontrola kvalitete različitih jedinica proizvodnje opisana nezavisnom shemom testiranja. Za razliku od modela bacanja novčića, potrebno je uvesti novi parametar - vjerojatnost R da je proizvod neispravan. Model će biti u potpunosti opisan ako pretpostavimo da sve proizvodne jedinice imaju istu vjerojatnost da budu neispravne. Ako je zadnja pretpostavka netočna, tada se broj parametara modela povećava. Na primjer, možete pretpostaviti da svaka jedinica proizvodnje ima vlastitu vjerojatnost da će biti neispravna.

Raspravljajmo o modelu kontrole kvalitete s vjerojatnošću neispravnosti zajedničkom za sve jedinice proizvodnje R. Da bi se “došlo do broja” pri analizi modela potrebno je zamijeniti R na neku određenu vrijednost. Da bi se to postiglo, potrebno je izaći iz okvira probabilističkog modela i okrenuti se podacima dobivenim tijekom kontrole kvalitete. Matematička statistika rješava obrnuti problem u odnosu na teoriju vjerojatnosti. Cilj mu je na temelju rezultata opažanja (mjerenja, analiza, testova, eksperimenata) doći do zaključaka o vjerojatnostima na kojima se temelji probabilistički model. Na primjer, na temelju učestalosti pojavljivanja neispravnih proizvoda tijekom pregleda, mogu se izvući zaključci o vjerojatnosti neispravnosti (vidi Bernoullijev teorem gore). Na temelju Chebyshevljeve nejednakosti izvedeni su zaključci o podudarnosti učestalosti pojavljivanja neispravnih proizvoda s hipotezom da vjerojatnost neispravnosti ima određenu vrijednost.

Dakle, primjena matematičke statistike temelji se na vjerojatnosnom modelu neke pojave ili procesa. Koriste se dva paralelna niza pojmova - oni koji se odnose na teoriju (probabilistički model) i oni koji se odnose na praksu (uzorkovanje rezultata promatranja). Na primjer, teorijska vjerojatnost odgovara učestalosti dobivenoj iz uzorka. Matematičko očekivanje (teorijska serija) odgovara aritmetičkoj sredini uzorka (praktična serija). Karakteristike uzorka u pravilu su procjene teoretskih. Istovremeno, količine vezane uz teorijski niz “nalaze se u glavama istraživača”, odnose se na svijet ideja (prema starogrčkom filozofu Platonu) i nisu dostupne za izravno mjerenje. Istraživači imaju samo ogledne podatke s kojima pokušavaju utvrditi svojstva teorijskog probabilističkog modela koji ih zanimaju.

Zašto nam je potreban probabilistički model? Činjenica je da se samo uz njegovu pomoć svojstva utvrđena analizom određenog uzorka mogu prenijeti na druge uzorke, kao i na cjelokupnu tzv. opću populaciju. Izraz "populacija" koristi se kada se govori o velikoj, ali ograničenoj zbirci jedinica koje se proučavaju. Na primjer, o ukupnosti svih stanovnika Rusije ili ukupnosti svih potrošača instant kave u Moskvi. Cilj marketinških ili socioloških istraživanja je prijenos izjava dobivenih na uzorku od stotina ili tisuća ljudi na populacije od nekoliko milijuna ljudi. U kontroli kvalitete, serija proizvoda djeluje kao opća populacija.

Za prijenos zaključaka iz uzorka na veću populaciju potrebne su neke pretpostavke o odnosu karakteristika uzorka sa karakteristikama ove veće populacije. Ove pretpostavke temelje se na odgovarajućem probabilističkom modelu.

Naravno, moguće je obraditi uzorke podataka bez korištenja jednog ili drugog probabilističkog modela. Na primjer, možete izračunati uzorak aritmetičke sredine, brojati učestalost ispunjavanja određenih uvjeta itd. Međutim, rezultati izračuna odnosit će se samo na određeni uzorak; prijenos zaključaka dobivenih uz njihovu pomoć na bilo koju drugu populaciju nije točan. Ova se aktivnost ponekad naziva "analiza podataka". U usporedbi s probabilističko-statističkim metodama, analiza podataka ima ograničenu obrazovnu vrijednost.

Dakle, primjena probabilističkih modela temeljenih na procjeni i testiranju hipoteza korištenjem karakteristika uzorka bit je probabilističko-statističkih metoda odlučivanja.

Naglašavamo da logika korištenja karakteristika uzorka za donošenje odluka temeljenih na teorijskim modelima uključuje istovremenu upotrebu dva paralelna niza koncepata, od kojih jedan odgovara probabilističkim modelima, a drugi podacima uzorka. Nažalost, u brojnim literaturnim izvorima, najčešće zastarjelim ili pisanim recepturama, ne pravi se razlika između uzorka i teorijskih karakteristika, što čitatelje dovodi u zabunu i pogreške u praktičnoj uporabi statističkih metoda.

Prethodno

U provođenju psihološko-pedagoških istraživanja važnu ulogu imaju matematičke metode modeliranja procesa i obrade eksperimentalnih podataka. U te metode spadaju prije svega tzv. probabilističko-statističke metode istraživanja. To je zbog činjenice da na ponašanje pojedinca u procesu njegove aktivnosti i osobe u timu značajno utječu mnogi slučajni čimbenici. Slučajnost nam ne dopušta opisivanje pojava u okviru determinističkih modela, budući da se očituje kao nedovoljna pravilnost u masovnim pojavama i stoga ne omogućuje pouzdano predviđanje nastanka određenih događaja. Međutim, proučavanjem takvih pojava otkrivaju se određeni obrasci. Nepravilnost svojstvena slučajnim događajima, s velikim brojem testova, obično se kompenzira pojavom statističkog obrasca, stabilizacijom učestalosti pojavljivanja slučajnih događaja. Stoga ti slučajni događaji imaju određenu vjerojatnost. Dvije su bitno različite vjerojatnosno-statističke metode psihološko-pedagoških istraživanja: klasične i neklasične. Provedimo usporednu analizu ovih metoda.

Klasična probabilističko-statistička metoda. Klasična probabilističko-statistička metoda istraživanja temelji se na teoriji vjerojatnosti i matematičkoj statistici. Ova metoda se koristi u proučavanju masovnih pojava slučajne prirode; uključuje nekoliko faza, od kojih su glavne sljedeće.

1. Konstrukcija probabilističkog modela stvarnosti na temelju analize statističkih podataka (određivanje zakona distribucije slučajne varijable). Naravno, obrasci masovnih slučajnih pojava to su jasnije izraženi što je veći volumen statističkog materijala. Podaci o uzorku dobiveni tijekom eksperimenta uvijek su ograničeni i, strogo govoreći, nasumične su prirode. U tom smislu, važnu ulogu ima generalizacija obrazaca dobivenih iz uzorka i njihovo proširenje na cjelokupnu populaciju objekata. Da bi se riješio ovaj problem, prihvaća se određena hipoteza o prirodi statističkog obrasca koji se očituje u fenomenu koji se proučava, na primjer, hipoteza da se fenomen koji se proučava pokorava zakonu normalne distribucije. Ova se hipoteza naziva nulta hipoteza, koja se može pokazati netočnom, stoga se uz nultu hipotezu postavlja i alternativna ili konkurentska hipoteza. Provjera koliko dobro dobiveni eksperimentalni podaci odgovaraju određenoj statističkoj hipotezi provodi se pomoću tzv. neparametarskih statističkih testova ili testova podudarnosti. Trenutno se naširoko koriste Kolmogorovljev, Smirnovljev, omega-kvadrat itd. kriteriji prilagodbe. Osnovna ideja ovih testova je izmjeriti udaljenost između empirijske funkcije distribucije i potpuno poznate teorijske funkcije distribucije. Metodologija testiranja statističke hipoteze rigorozno je razvijena i opisana u velikom broju radova o matematičkoj statistici.

2. Izvođenje potrebnih proračuna matematičkim sredstvima u okviru probabilističkog modela. U skladu s utvrđenim probabilističkim modelom pojave, provode se izračuni karakterističnih parametara, na primjer, kao što su matematičko očekivanje ili srednja vrijednost, disperzija, standardna devijacija, moda, medijan, indeks asimetrije itd.

3. Interpretacija probabilističkih i statističkih zaključaka u odnosu na stvarno stanje.

Trenutno je klasična probabilističko-statistička metoda dobro razvijena i naširoko se koristi u istraživanjima u različitim područjima prirodnih, tehničkih i društvenih znanosti. Detaljan opis suštine ove metode i njezine primjene u rješavanju konkretnih problema nalazi se u velikom broju literaturnih izvora, npr.

Neklasična probabilističko-statistička metoda. Neklasična probabilističko-statistička metoda istraživanja razlikuje se od klasične po tome što se primjenjuje ne samo na masovne događaje, već i na pojedinačne događaje koji su temeljno slučajne prirode. Ova se metoda može učinkovito koristiti u analizi ponašanja pojedinca u procesu obavljanja određene aktivnosti, na primjer, u procesu asimilacije znanja od strane učenika. Osobitosti neklasične probabilističko-statističke metode psihološko-pedagoškog istraživanja razmotrit ćemo na primjeru ponašanja učenika u procesu stjecanja znanja.

U radu je prvi put predložen vjerojatnosno-statistički model ponašanja učenika u procesu stjecanja znanja. U radu je napravljen daljnji razvoj ovog modela. Nastava kao vrsta djelatnosti, čija je svrha stjecanje znanja, vještina i sposobnosti od strane osobe, ovisi o stupnju razvoja učenikove svijesti. Struktura svijesti uključuje takve kognitivne procese kao što su osjet, percepcija, pamćenje, razmišljanje, mašta. Analiza ovih procesa pokazuje da ih karakteriziraju elementi slučajnosti, zbog slučajnosti mentalnih i somatskih stanja pojedinca, kao i fizioloških, psihičkih i informacijskih šuma tijekom rada mozga. Potonje je dovelo, pri opisivanju misaonih procesa, do napuštanja upotrebe determinističkog modela dinamičkog sustava u korist modela slučajnog dinamičkog sustava. To znači da se determinizam svijesti ostvaruje putem slučajnosti. Iz ovoga možemo zaključiti da ljudsko znanje, koje je zapravo proizvod svijesti, također ima slučajnu prirodu, te se stoga vjerojatnosno-statističkom metodom može opisati ponašanje svakog pojedinog učenika u procesu stjecanja znanja.

Sukladno ovoj metodi, student se identificira funkcijom distribucije (gustoća vjerojatnosti), koja određuje vjerojatnost da će se on naći u pojedinoj regiji informacijskog prostora. Tijekom procesa učenja distribucijska funkcija s kojom se učenik poistovjećuje kreće se u informacijskom prostoru kako se razvija. Svaki student ima individualna svojstva i dopuštena je neovisna lokalizacija (prostorna i kinematička) pojedinaca u odnosu na druge.

Na temelju zakona o održanju vjerojatnosti napisan je sustav diferencijalnih jednadžbi, a to su jednadžbe kontinuiteta koje povezuju promjenu gustoće vjerojatnosti po jedinici vremena u faznom prostoru (prostoru koordinata, brzina i ubrzanja raznih redova) s divergencijom toka gustoće vjerojatnosti u faznom prostoru koji se razmatra. Provedena je analiza analitičkih rješenja niza jednadžbi kontinuiteta (funkcija distribucije) koje karakteriziraju ponašanje pojedinih učenika u procesu učenja.

Pri provođenju eksperimentalnih istraživanja ponašanja učenika u procesu stjecanja znanja koristi se vjerojatnosno-statističko skaliranje prema kojem je mjerna ljestvica uređen sustav , gdje je A neki potpuno uređen skup objekata (pojedinaca) koji posjeduju karakteristike koje nas zanimaju (empirijski sustav s relacijama); Ly - funkcionalni prostor (prostor distribucijskih funkcija) s relacijama; F je operacija homomorfnog preslikavanja A u podsustav Ly; G - skupina dopuštenih transformacija; f je operacija preslikavanja funkcija distribucije iz podsustava Ly u numeričke sustave s relacijama n-dimenzionalnog prostora M. Probabilističko-statističko skaliranje koristi se za pronalaženje i obradu eksperimentalnih funkcija distribucije i uključuje tri faze.

1. Pronalaženje eksperimentalnih funkcija distribucije na temelju rezultata kontrolnog događaja, npr. ispita. Tipičan oblik pojedinačnih funkcija raspodjele dobiven korištenjem ljestvice od dvadeset stupnjeva prikazan je na slici. 1. Metoda za pronalaženje takvih funkcija opisana je u.

2. Preslikavanje funkcija distribucije na brojevni prostor. U tu svrhu izračunavaju se momenti pojedinih funkcija raspodjele. U praksi je u pravilu dovoljno ograničiti se na određivanje trenutaka prvog reda (matematičko očekivanje), drugog reda (varijanca) i trećeg reda, karakterizirajući asimetriju funkcije distribucije.

3. Rangiranje učenika po razini znanja na temelju usporedbe momenata različitih redova njihovih pojedinačnih funkcija raspodjele.

Riža. 1. Tipični oblik pojedinačnih funkcija raspodjele učenika koji su na ispitu iz opće fizike dobili različite ocjene: 1 - tradicionalna ocjena “2”; 2 - tradicionalna ocjena "3"; 3 - tradicionalna ocjena "4"; 4 - tradicionalna ocjena "5"

Na temelju aditivnosti pojedinih funkcija raspodjele, pronađene su eksperimentalne funkcije raspodjele za protok učenika (slika 2).


Riža. 2. Evolucija potpune funkcije distribucije protoka studenata, aproksimirana glatkim linijama: 1 - nakon prve godine; 2 - nakon druge godine; 3 - nakon treće godine; 4 - nakon četvrte godine; 5 - nakon pete godine

Analiza podataka prikazanih na Sl. Slika 2 pokazuje da kako se krećemo kroz informacijski prostor, distribucijske funkcije postaju zamagljene. To se događa zbog činjenice da se matematička očekivanja funkcija distribucije pojedinaca kreću različitim brzinama, a same funkcije se zamagljuju zbog disperzije. Daljnja analiza ovih funkcija distribucije može se provesti u okviru klasične probabilističko-statističke metode.

Rasprava o rezultatima. Analiza klasičnih i neklasičnih probabilističko-statističkih metoda psihološko-pedagoških istraživanja pokazala je da među njima postoji značajna razlika. Kao što se može razumjeti iz navedenog, klasična metoda je primjenjiva samo na analizu masovnih događaja, a neklasična metoda je primjenjiva i na analizu masovnih i pojedinačnih događaja. S tim u vezi, klasičnu metodu možemo uvjetno nazvati masovnom probabilističko-statističkom metodom (MPSM), a neklasičnu metodu - individualnom probabilističko-statističkom metodom (IPSM). U 4] je pokazano da se nijedna od klasičnih metoda provjere znanja učenika u okviru vjerojatnosno-statističkog modela pojedinca ne može primijeniti u te svrhe.

Razmotrimo posebnosti metoda MVSM i IVSM na primjeru mjerenja potpunosti znanja učenika. U tu svrhu, provedimo misaoni eksperiment. Pretpostavimo da postoji velik broj učenika koji su apsolutno identični po mentalnim i fizičkim karakteristikama i imaju isto podrijetlo, te neka oni, bez međusobne interakcije, istovremeno sudjeluju u istom kognitivnom procesu, doživljavajući apsolutno iste, strogo određene utjecaj. Tada bi, u skladu s klasičnim predodžbama o objektima mjerenja, svi učenici trebali dobiti iste ocjene potpunosti znanja uz bilo koju zadanu točnost mjerenja. Međutim, u stvarnosti, uz dovoljno visoku točnost mjerenja, procjene cjelovitosti znanja učenika će se razlikovati. Ovaj mjerni rezultat nije moguće objasniti u okviru MVSM-a, budući da se u početku pretpostavlja da je utjecaj na potpuno identične učenike koji ne stupaju u međusobnu interakciju strogo determinističke prirode. Klasična probabilističko-statistička metoda ne uzima u obzir činjenicu da se determinizam spoznajnog procesa ostvaruje kroz slučajnost koja je svojstvena svakom pojedincu koji spoznaje svijet oko sebe.

Slučajnost ponašanja učenika u procesu stjecanja znanja uzima u obzir IVSM. Korištenje individualne vjerojatnosno-statističke metode za analizu ponašanja idealizirane skupine učenika koje razmatramo pokazalo bi da je nemoguće naznačiti točan položaj svakog učenika u informacijskom prostoru, već se može reći samo o vjerojatnosti njegovog pronalaska jedno ili drugo područje informacijskog prostora. Zapravo, svaki je učenik identificiran individualnom funkcijom distribucije, a njezini parametri, poput matematičkog očekivanja, varijance itd., individualni su za svakog učenika. To znači da će pojedine distribucijske funkcije biti smještene u različitim područjima informacijskog prostora. Razlog ovakvog ponašanja učenika leži u slučajnoj prirodi procesa učenja.

Međutim, u određenom broju slučajeva rezultati istraživanja dobiveni u okviru IVSM mogu se interpretirati u okviru IVSM. Pretpostavimo da učitelj koristi mjernu ljestvicu od pet stupnjeva pri ocjenjivanju znanja učenika. U ovom slučaju pogreška u ocjenjivanju znanja iznosi ±0,5 bodova. Dakle, kada student dobije ocjenu od npr. 4 boda, to znači da je njegovo znanje u rasponu od 3,5 boda do 4,5 boda. Naime, položaj pojedinca u informacijskom prostoru u ovom je slučaju određen pravokutnom funkcijom raspodjele čija je širina jednaka pogrešci mjerenja od ±0,5 bodova, a procjena je matematičko očekivanje. Ta je pogreška toliko velika da nam ne omogućuje promatranje pravog oblika funkcije distribucije. Međutim, unatoč tako gruboj aproksimaciji funkcije distribucije, proučavanje njezine evolucije omogućuje nam dobivanje važnih informacija kako o ponašanju pojedinca, tako i o ponašanju skupine učenika u cjelini.

Na rezultat mjerenja cjelovitosti znanja učenika izravno ili neizravno utječe svijest nastavnika (mjeritelja), koju također karakterizira slučajnost. U procesu pedagoških mjerenja zapravo postoji interakcija između dva slučajna dinamička sustava koji identificiraju ponašanje učenika i nastavnika u tom procesu. Razmatra se interakcija studentskog podsustava s nastavnim podsustavom i pokazuje da je brzina kretanja matematičkog očekivanja pojedinih distribucijskih funkcija učenika u informacijskom prostoru proporcionalna funkciji utjecaja nastavnog osoblja i obrnuto proporcionalna funkciji utjecaja nastavnog osoblja. proporcionalna funkciji tromosti, koja karakterizira nepopustljivost promjene položaja matematičkog očekivanja u prostoru (analog Aristotelovog zakona u mehanici).

Trenutno, unatoč značajnim postignućima u razvoju teorijskih i praktičnih temelja mjerenja pri provođenju psiholoških i pedagoških istraživanja, problem mjerenja u cjelini još je daleko od rješenja. To je, prije svega, zbog činjenice da još uvijek nema dovoljno informacija o utjecaju svijesti na proces mjerenja. Slična situacija nastala je pri rješavanju problema mjerenja u kvantnoj mehanici. Tako se u radu, kada se razmatraju konceptualni problemi kvantne teorije mjerenja, kaže da je rješavanje nekih paradoksa mjerenja u kvantnoj mehanici „... teško moguće bez izravnog uključivanja svijesti promatrača u teorijski opis kvantno mjerenje." Dalje se kaže da je “... dosljedno pretpostaviti da svijest može neki događaj učiniti vjerojatnim, čak i ako je, prema zakonima fizike (kvantne mehanike), vjerojatnost tog događaja mala. Napravimo važno pojašnjenje formulacije: svijest određenog promatrača može učiniti vjerojatnim da će on vidjeti ovaj događaj.”

3. Bit probabilističko-statističkih metoda

Kako se pristupi, ideje i rezultati teorije vjerojatnosti i matematičke statistike koriste pri obradi podataka – rezultata opažanja, mjerenja, testova, analiza, eksperimenata za donošenje praktično važnih odluka?

Osnova je probabilistički model stvarne pojave ili procesa, tj. matematički model u kojem su objektivni odnosi izraženi u terminima teorije vjerojatnosti. Vjerojatnosti se prvenstveno koriste za opisivanje neizvjesnosti koje se moraju uzeti u obzir pri donošenju odluka. To se odnosi kako na nepoželjne prilike (rizike), tako i na one privlačne („sretna prilika”). Ponekad se slučajnost namjerno uvodi u situaciju, na primjer, prilikom izvlačenja ždrijeba, nasumičnog odabira jedinica za kontrolu, provođenja lutrije ili anketiranja potrošača.

Teorija vjerojatnosti dopušta korištenje jedne vjerojatnosti za izračun drugih od interesa za istraživača. Na primjer, koristeći vjerojatnost dobivanja grba, možete izračunati vjerojatnost da ćete u 10 bacanja novčića dobiti najmanje 3 grba. Takav izračun temelji se na probabilističkom modelu, prema kojem su bacanja novčića opisana uzorkom neovisnih pokušaja, a osim toga, grb i oznake su jednako mogući, pa je stoga vjerojatnost svakog od ovih događaja jednaka; do ½. Složeniji model je onaj koji razmatra provjeru kvalitete jedinice proizvodnje umjesto bacanja novčića. Odgovarajući probabilistički model temelji se na pretpostavci da je kontrola kvalitete različitih jedinica proizvodnje opisana nezavisnom shemom testiranja. Za razliku od modela bacanja novčića, potrebno je uvesti novi parametar - vjerojatnost R da je proizvod neispravan. Model će biti u potpunosti opisan ako pretpostavimo da sve proizvodne jedinice imaju istu vjerojatnost da budu neispravne. Ako je zadnja pretpostavka netočna, tada se broj parametara modela povećava. Na primjer, možete pretpostaviti da svaka jedinica proizvodnje ima vlastitu vjerojatnost da će biti neispravna.

Raspravljajmo o modelu kontrole kvalitete s vjerojatnošću neispravnosti zajedničkom za sve jedinice proizvodnje R. Da bi se “došlo do broja” pri analizi modela potrebno je zamijeniti R na neku određenu vrijednost. Da bi se to postiglo, potrebno je izaći iz okvira probabilističkog modela i okrenuti se podacima dobivenim tijekom kontrole kvalitete. Matematička statistika rješava obrnuti problem u odnosu na teoriju vjerojatnosti. Cilj mu je na temelju rezultata opažanja (mjerenja, analiza, testova, eksperimenata) doći do zaključaka o vjerojatnostima na kojima se temelji probabilistički model. Na primjer, na temelju učestalosti pojavljivanja neispravnih proizvoda tijekom pregleda, mogu se izvući zaključci o vjerojatnosti neispravnosti (vidi gornju raspravu korištenjem Bernoullijevog teorema). Na temelju Chebyshevljeve nejednakosti izvedeni su zaključci o podudarnosti učestalosti pojavljivanja neispravnih proizvoda s hipotezom da vjerojatnost neispravnosti ima određenu vrijednost.

Dakle, primjena matematičke statistike temelji se na vjerojatnosnom modelu neke pojave ili procesa. Koriste se dva paralelna niza pojmova - oni koji se odnose na teoriju (probabilistički model) i oni koji se odnose na praksu (uzorkovanje rezultata promatranja). Na primjer, teorijska vjerojatnost odgovara učestalosti dobivenoj iz uzorka. Matematičko očekivanje (teorijska serija) odgovara aritmetičkoj sredini uzorka (praktična serija). Karakteristike uzorka u pravilu su procjene teoretskih. Istovremeno, količine vezane uz teorijski niz “nalaze se u glavama istraživača”, odnose se na svijet ideja (prema starogrčkom filozofu Platonu) i nisu dostupne za izravno mjerenje. Istraživači imaju samo ogledne podatke s kojima pokušavaju utvrditi svojstva teorijskog probabilističkog modela koji ih zanimaju.

Zašto nam je potreban probabilistički model? Činjenica je da se samo uz njegovu pomoć svojstva utvrđena analizom određenog uzorka mogu prenijeti na druge uzorke, kao i na cjelokupnu tzv. opću populaciju. Izraz "populacija" koristi se kada se govori o velikoj, ali ograničenoj zbirci jedinica koje se proučavaju. Na primjer, o ukupnosti svih stanovnika Rusije ili ukupnosti svih potrošača instant kave u Moskvi. Cilj marketinških ili socioloških istraživanja je prijenos izjava dobivenih na uzorku od stotina ili tisuća ljudi na populacije od nekoliko milijuna ljudi. U kontroli kvalitete, serija proizvoda djeluje kao opća populacija.

Za prijenos zaključaka iz uzorka na veću populaciju potrebne su neke pretpostavke o odnosu karakteristika uzorka sa karakteristikama ove veće populacije. Ove pretpostavke temelje se na odgovarajućem probabilističkom modelu.

Naravno, moguće je obraditi uzorke podataka bez korištenja jednog ili drugog probabilističkog modela. Na primjer, možete izračunati uzorak aritmetičke sredine, brojati učestalost ispunjavanja određenih uvjeta itd. Međutim, rezultati izračuna odnosit će se samo na određeni uzorak; prijenos zaključaka dobivenih uz njihovu pomoć na bilo koju drugu populaciju nije točan. Ova se aktivnost ponekad naziva "analiza podataka". U usporedbi s probabilističko-statističkim metodama, analiza podataka ima ograničenu obrazovnu vrijednost.

Dakle, primjena probabilističkih modela temeljenih na procjeni i testiranju hipoteza korištenjem karakteristika uzorka bit je probabilističko-statističkih metoda odlučivanja.

Naglašavamo da logika korištenja karakteristika uzorka za donošenje odluka temeljenih na teorijskim modelima uključuje istovremenu upotrebu dva paralelna niza koncepata, od kojih jedan odgovara probabilističkim modelima, a drugi podacima uzorka. Nažalost, u brojnim literaturnim izvorima, najčešće zastarjelim ili pisanim recepturama, ne pravi se razlika između uzorka i teorijskih karakteristika, što čitatelje dovodi u zabunu i pogreške u praktičnoj uporabi statističkih metoda.

Prethodno

Posebno je zanimljiva kvantitativna procjena rizika poslovanja metodama matematičke statistike. Glavni alati ove metode procjene su:

§ vjerojatnost pojavljivanja slučajne varijable,

§ matematičko očekivanje ili prosječna vrijednost slučajne varijable koja se proučava,

§ disperzija,

§ standardna (srednja kvadratna) devijacija,

§ koeficijent varijacije,

§ distribucija vjerojatnosti slučajne varijable koja se proučava.

Za donošenje odluke potrebno je znati veličinu (stupanj) rizika koji se mjeri pomoću dva kriterija:

1) prosječna očekivana vrijednost (matematičko očekivanje),

2) fluktuacije (varijabilnost) mogućeg rezultata.

Prosječna očekivana vrijednost ovo je ponderirani prosjek slučajne varijable, koji je povezan s nesigurnošću situacije:

,

gdje je vrijednost slučajne varijable.

Prosječna očekivana vrijednost mjeri ishod koji očekujemo u prosjeku.

Prosječna vrijednost je generalizirana kvalitativna karakteristika i ne dopušta donošenje odluke u korist bilo koje određene vrijednosti slučajne varijable.

Za donošenje odluke potrebno je izmjeriti fluktuacije pokazatelja, odnosno odrediti mjeru varijabilnosti mogućeg rezultata.

Varijacija u mogućem ishodu je stupanj do kojeg očekivana vrijednost odstupa od prosječne vrijednosti.

U tu svrhu u praksi se obično koriste dva blisko povezana kriterija: “disperzija” i “standardna devijacija”.

Disperzija – ponderirani prosjek kvadrata stvarnih rezultata od očekivanog prosjeka:

Standardna devijacija je kvadratni korijen varijance. To je dimenzionalna veličina i mjeri se u istim jedinicama u kojima se mjeri slučajna varijabla koja se proučava:

.

Varijanca i standardna devijacija predstavljaju mjeru apsolutne varijacije. Za analizu se obično koristi koeficijent varijacije.

Koeficijent varijacije predstavlja omjer standardne devijacije i prosječne očekivane vrijednosti, pomnožen sa 100%

ili .

Na koeficijent varijacije ne utječu apsolutne vrijednosti proučavanog pokazatelja.

Pomoću koeficijenta varijacije možete čak usporediti fluktuacije karakteristika izraženih u različitim mjernim jedinicama. Koeficijent varijacije može varirati od 0 do 100%. Što je veći koeficijent, veće su fluktuacije.


U ekonomskoj statistici utvrđuje se sljedeća procjena različitih vrijednosti koeficijenta varijacije:

do 10% - slaba fluktuacija, 10 – 25% - umjerena, preko 25% - visoka.

Sukladno tome, što su veće fluktuacije, to je veći rizik.

Primjer. Vlasnik male trgovine na početku svakog dana kupi neki kvarljivi proizvod za prodaju. Jedinica ovog proizvoda košta 200 UAH. Prodajna cijena - 300 UAH. za jedinicu. Iz opažanja je poznato da potražnja za ovim proizvodom tijekom dana može biti 4, 5, 6 ili 7 jedinica s odgovarajućom vjerojatnošću od 0,1; 0,3; 0,5; 0,1. Ako se proizvod ne proda tijekom dana, tada će se na kraju dana uvijek kupiti po cijeni od 150 UAH. za jedinicu. Koliko jedinica ovog proizvoda vlasnik trgovine treba kupiti na početku dana?

Riješenje. Izgradimo matricu profita za vlasnika trgovine. Izračunajmo dobit koju će vlasnik dobiti ako npr. kupi 7 jedinica proizvoda, a proda jednu jedinicu tijekom 6. dana i na kraju dana. Svaka jedinica proizvoda prodana tijekom dana donosi dobit od 100 UAH, a na kraju dana - gubitak od 200 - 150 = 50 UAH. Dakle, dobit će u ovom slučaju biti:

Izračuni se provode na sličan način za druge kombinacije ponude i potražnje.

Očekivana dobit izračunava se kao matematičko očekivanje mogućih vrijednosti dobiti za svaki red konstruirane matrice, uzimajući u obzir odgovarajuće vjerojatnosti. Kao što vidite, među očekivanim profitima najveći je 525 UAH. Odgovara kupnji dotičnog proizvoda u količini od 6 jedinica.

Kako bismo opravdali konačnu preporuku za kupnju potrebnog broja jedinica proizvoda, izračunavamo varijancu, standardnu ​​devijaciju i koeficijent varijacije za svaku moguću kombinaciju ponude i potražnje za proizvodom (svaki redak matrice dobiti):

400 0,1 40 16000
400 0,3 120 48000
400 0,5 200 80000
400 0,1 40 16000
1,0 400 160000
350 0,1 35 12250
500 0,3 150 75000
500 0,5 250 125000
500 0,1 50 25000
1,0 485 2372500
300 0,1 30 9000
450 0,3 135 60750
600 0,5 300 180000
600 0,1 60 36000
1,0 525 285750

Što se tiče vlasnika trgovine koji kupuje 6 jedinica proizvoda u usporedbi s 5 i 4 jedinice, to nije očito, budući da je rizik pri kupnji 6 jedinica proizvoda (19,2%) veći nego pri kupnji 5 jedinica (9,3%), pa čak i više nego pri kupnji 4 jedinice (0%).

Dakle, imamo sve informacije o očekivanoj dobiti i rizicima. A vlasnik trgovine odlučuje koliko jedinica proizvoda mora kupiti svako jutro, uzimajući u obzir svoje iskustvo i sklonost riziku.

Po našem mišljenju, vlasniku trgovine treba preporučiti kupnju 5 jedinica proizvoda svako jutro i njegova će prosječna očekivana dobit biti 485 UAH. i ako to usporedite s kupnjom 6 jedinica proizvoda, pri čemu je prosječna očekivana dobit 525 UAH, što je 40 UAH. više, ali će rizik u ovom slučaju biti 2,06 puta veći.

Pošaljite svoj dobar rad u bazu znanja jednostavno je. Koristite obrazac u nastavku

Studenti, diplomanti, mladi znanstvenici koji koriste bazu znanja u svom studiju i radu bit će vam vrlo zahvalni.

Objavljeno na http://www.allbest.ru/

Objavljeno na http://www.allbest.ru/

Uvod

1. Hi-kvadrat distribucija

Zaključak

Primjena

Uvod

Kako se pristupi, ideje i rezultati teorije vjerojatnosti koriste u našim životima? matematička teorija kvadrata

Osnova je probabilistički model stvarne pojave ili procesa, tj. matematički model u kojem su objektivni odnosi izraženi u terminima teorije vjerojatnosti. Vjerojatnosti se prvenstveno koriste za opisivanje neizvjesnosti koje se moraju uzeti u obzir pri donošenju odluka. To se odnosi kako na nepoželjne prilike (rizike), tako i na one privlačne („sretna prilika”). Ponekad se slučajnost namjerno uvodi u situaciju, na primjer, prilikom izvlačenja ždrijeba, nasumičnog odabira jedinica za kontrolu, provođenja lutrije ili anketiranja potrošača.

Teorija vjerojatnosti dopušta korištenje jedne vjerojatnosti za izračun drugih od interesa za istraživača.

Vjerojatnosni model neke pojave ili procesa temelj je matematičke statistike. Koriste se dva paralelna niza pojmova - oni koji se odnose na teoriju (probabilistički model) i oni koji se odnose na praksu (uzorkovanje rezultata promatranja). Na primjer, teorijska vjerojatnost odgovara učestalosti dobivenoj iz uzorka. Matematičko očekivanje (teorijska serija) odgovara aritmetičkoj sredini uzorka (praktična serija). Karakteristike uzorka u pravilu su procjene teoretskih. Istovremeno, količine vezane uz teorijski niz “nalaze se u glavama istraživača”, odnose se na svijet ideja (prema starogrčkom filozofu Platonu) i nisu dostupne za izravno mjerenje. Istraživači imaju samo ogledne podatke s kojima pokušavaju utvrditi svojstva teorijskog probabilističkog modela koji ih zanimaju.

Zašto nam je potreban probabilistički model? Činjenica je da se samo uz njegovu pomoć svojstva utvrđena analizom određenog uzorka mogu prenijeti na druge uzorke, kao i na cjelokupnu tzv. opću populaciju. Izraz "populacija" koristi se kada se govori o velikoj, ali ograničenoj zbirci jedinica koje se proučavaju. Na primjer, o ukupnosti svih stanovnika Rusije ili ukupnosti svih potrošača instant kave u Moskvi. Cilj marketinških ili socioloških istraživanja je prijenos izjava dobivenih na uzorku od stotina ili tisuća ljudi na populacije od nekoliko milijuna ljudi. U kontroli kvalitete, serija proizvoda djeluje kao opća populacija.

Za prijenos zaključaka iz uzorka na veću populaciju potrebne su neke pretpostavke o odnosu karakteristika uzorka sa karakteristikama ove veće populacije. Ove pretpostavke temelje se na odgovarajućem probabilističkom modelu.

Naravno, moguće je obraditi uzorke podataka bez korištenja jednog ili drugog probabilističkog modela. Na primjer, možete izračunati uzorak aritmetičke sredine, brojati učestalost ispunjavanja određenih uvjeta itd. Međutim, rezultati izračuna odnosit će se samo na određeni uzorak; prijenos zaključaka dobivenih uz njihovu pomoć na bilo koju drugu populaciju nije točan. Ova se aktivnost ponekad naziva "analiza podataka". U usporedbi s probabilističko-statističkim metodama, analiza podataka ima ograničenu obrazovnu vrijednost.

Dakle, primjena probabilističkih modela temeljenih na procjeni i testiranju hipoteza korištenjem karakteristika uzorka bit je probabilističko-statističkih metoda odlučivanja.

1. Hi-kvadrat distribucija

Pomoću normalne distribucije definirane su tri distribucije koje se danas često koriste u statističkoj obradi podataka. To su Pearson ("chi-kvadrat"), Student i Fisher distribucije.

Usredotočit ćemo se na distribuciju (“hi-kvadrat”). Ovu distribuciju prvi je proučavao astronom F. Helmert 1876. godine. U vezi s Gaussovom teorijom pogrešaka, proučavao je zbrojeve kvadrata n neovisnih standardno normalno distribuiranih slučajnih varijabli. Kasnije je Karl Pearson ovoj distribucijskoj funkciji dao naziv "hi-kvadrat". I sada distribucija nosi njegovo ime.

Zbog svoje bliske povezanosti s normalnom distribucijom, h2 distribucija igra važnu ulogu u teoriji vjerojatnosti i matematičkoj statistici. H2 distribucija i mnoge druge distribucije koje su određene h2 distribucijom (na primjer, Studentova distribucija), opisuju distribucije uzoraka različitih funkcija iz normalno distribuiranih rezultata promatranja i koriste se za konstruiranje intervala pouzdanosti i statističkih testova.

Pearsonova distribucija (chi - kvadrat) - distribucija slučajne varijable, gdje su X1, X2,..., Xn normalne neovisne slučajne varijable, a matematičko očekivanje svake od njih je nula, a standardna devijacija je jedan.

Zbroj kvadrata

raspoređeni prema zakonu (“hi - kvadrat”).

U ovom slučaju broj termina, tj. n se naziva "broj stupnjeva slobode" hi-kvadrat distribucije. Kako se broj stupnjeva slobode povećava, raspodjela se polako približava normalnoj.

Gustoća ove distribucije

Dakle, distribucija h2 ovisi o jednom parametru n - broju stupnjeva slobode.

Funkcija distribucije h2 ima oblik:

ako je h2?0. (2.7.)

Slika 1 prikazuje graf gustoće vjerojatnosti i funkcija h2 distribucije za različite stupnjeve slobode.

Slika 1 Ovisnost gustoće vjerojatnosti q (x) u distribuciji h2 (hi - kvadrat) za različite brojeve stupnjeva slobode

Momenti hi-kvadrat distribucije:

Hi-kvadrat distribucija koristi se u procjeni varijance (koristeći interval pouzdanosti), testiranju hipoteza slaganja, homogenosti, neovisnosti, prvenstveno za kvalitativne (kategorizirane) varijable koje poprimaju konačan broj vrijednosti, te u mnogim drugim zadacima statističke analize podataka. .

2. "Chi-kvadrat" u problemima statističke analize podataka

Statističke metode analize podataka koriste se u gotovo svim područjima ljudske djelatnosti. Koriste se kad god je potrebno dobiti i opravdati bilo kakav sud o grupi (objektima ili subjektima) s nekom unutarnjom heterogenošću.

Suvremeni stadij razvoja statističkih metoda može se računati od 1900. godine, kada je Englez K. Pearson utemeljio časopis "Biometrika". Prva trećina dvadesetog stoljeća. prošao pod znakom parametarske statistike. Metode su proučavane na temelju analize podataka iz parametarskih obitelji distribucija opisanih Pearsonovim obiteljskim krivuljama. Najpopularnija je bila normalna distribucija. Za testiranje hipoteza korišteni su Pearsonov, Studentov i Fisherov test. Predložena je metoda najveće vjerojatnosti i analiza varijance te su formulirane osnovne ideje planiranja pokusa.

Distribucija hi-kvadrat jedna je od najčešće korištenih u statistici za testiranje statističkih hipoteza. Na temelju hi-kvadrat distribucije konstruiran je jedan od najsnažnijih testova prilagodbe - Pearsonov hi-kvadrat test.

Kriterij slaganja je kriterij za provjeru hipoteze o pretpostavljenom zakonu nepoznate distribucije.

H2 test ("hi-kvadrat") koristi se za testiranje hipoteza različitih distribucija. Ovo je njegovo dostojanstvo.

Formula za izračun kriterija jednaka je

gdje su m i m" empirijske i teorijske frekvencije

distribucija u pitanju;

n je broj stupnjeva slobode.

Da bismo to provjerili, moramo usporediti empirijske (promatrane) i teorijske (izračunate pod pretpostavkom normalne distribucije) frekvencije.

Ako se empirijske frekvencije potpuno poklapaju s izračunatim ili očekivanim frekvencijama, S (E - T) = 0 i kriterij h2 također će biti jednak nuli. Ako S (E - T) nije jednak nuli, to će ukazivati ​​na odstupanje između izračunatih frekvencija i empirijskih frekvencija niza. U takvim slučajevima potrebno je procijeniti značajnost kriterija h2, koja teoretski može varirati od nule do beskonačnosti. To se radi usporedbom stvarne vrijednosti h2f s njegovom kritičnom vrijednošću (h2st). Nulta hipoteza, tj. pretpostavka da je razlika između empirijskih i teoretskih ili očekivanih frekvencija slučajna, pobija se ako je h2f veća ili jednaka h2st. za prihvaćenu razinu značajnosti (a) i broj stupnjeva slobode (n).

Distribucija vjerojatnih vrijednosti slučajne varijable h2 je kontinuirana i asimetrična. Ovisi o broju stupnjeva slobode (n) i približava se normalnoj distribuciji kako se broj promatranja povećava. Stoga je primjena h2 kriterija za ocjenu diskretnih distribucija povezana s određenim pogreškama koje utječu na njegovu vrijednost, osobito na malim uzorcima. Kako bi se dobile točnije procjene, uzorak raspoređen u niz varijacija mora imati najmanje 50 opcija. Ispravna primjena kriterija h2 također zahtijeva da učestalosti varijanti u ekstremnim klasama ne budu manje od 5; ako ih je manje od 5, tada se kombiniraju s frekvencijama susjednih klasa tako da ukupni iznos bude veći ili jednak 5. Prema kombinaciji frekvencija smanjuje se broj klasa (N). Broj stupnjeva slobode utvrđuje se sekundarnim brojem klasa, uzimajući u obzir broj ograničenja slobode varijacije.

Budući da točnost određivanja kriterija h2 uvelike ovisi o točnosti izračuna teoretskih frekvencija (T), za dobivanje razlike između empirijskih i izračunatih frekvencija treba koristiti nezaokružene teorijske frekvencije.

Kao primjer, uzmimo studiju objavljenu na web stranici posvećenoj primjeni statističkih metoda u humanističkim znanostima.

Hi-kvadrat test omogućuje vam usporedbu distribucija frekvencija bez obzira na to jesu li normalno raspodijeljene ili ne.

Učestalost se odnosi na broj pojavljivanja događaja. Obično se o učestalosti pojavljivanja događaja govori kada se varijable mjere na ljestvici imena i njihove druge karakteristike, osim učestalosti, nemoguće je ili problematično odabrati. Drugim riječima, kada varijabla ima kvalitativne karakteristike. Također, mnogi istraživači nastoje pretvoriti rezultate testova u razine (visoka, srednja, niska) i napraviti tablice distribucije rezultata kako bi saznali broj ljudi na tim razinama. Da bi se dokazalo da je na jednoj od razina (u jednoj od kategorija) broj ljudi stvarno veći (manji) također se koristi hi-kvadrat koeficijent.

Pogledajmo najjednostavniji primjer.

Proveden je test među mlađim adolescentima za utvrđivanje samopoštovanja. Rezultati testa pretvoreni su u tri razine: visoku, srednju i nisku. Frekvencije su raspoređene na sljedeći način:

Visoko (B) 27 osoba.

Prosjek (C) 12 osoba.

Niska (L) 11 osoba

Očito je da većina djece ima visoko samopoštovanje, ali to treba statistički dokazati. Da bismo to učinili, koristimo hi-kvadrat test.

Naš zadatak je provjeriti razlikuju li se dobiveni empirijski podaci od teorijski jednako vjerojatnih. Da biste to učinili, morate pronaći teorijske frekvencije. U našem slučaju, teorijske frekvencije su jednako vjerojatne frekvencije, koje se nalaze zbrajanjem svih frekvencija i dijeljenjem s brojem kategorija.

U našem slučaju:

(B + C + H)/3 = (27+12+11)/3 = 16,6

Formula za izračunavanje hi-kvadrat testa:

h2 = ?(E - T)I / T

Gradimo stol:

Empirijski (E)

Teorijski (T)

(E - T)I / T

Pronađite zbroj posljednjeg stupca:

Sada trebate pronaći kritičnu vrijednost kriterija pomoću tablice kritičnih vrijednosti (Tablica 1 u Dodatku). Da bismo to učinili potreban nam je broj stupnjeva slobode (n).

n = (R - 1) * (C - 1)

gdje je R broj redaka u tablici, C je broj stupaca.

U našem slučaju postoji samo jedan stupac (što znači izvorne empirijske frekvencije) i tri retka (kategorije), pa se formula mijenja - izuzimamo stupce.

n = (R - 1) = 3-1 = 2

Za vjerojatnost pogreške p?0,05 i n = 2, kritična vrijednost je h2 = 5,99.

Dobivena empirijska vrijednost veća je od kritične vrijednosti - razlike u frekvencijama su značajne (h2 = 9,64; p? 0,05).

Kao što vidite, izračun kriterija je vrlo jednostavan i ne oduzima puno vremena. Praktična vrijednost hi-kvadrat testa je ogromna. Ova metoda je najvrjednija kada se analiziraju odgovori na upitnike.

Pogledajmo složeniji primjer.

Na primjer, psiholog želi znati je li istina da su učitelji pristraniji prema dječacima nego prema djevojčicama. Oni. vjerojatnije će hvaliti djevojke. Da bi to učinio, psiholog je analizirao karakteristike učenika koje su napisali učitelji za učestalost pojavljivanja triju riječi: "aktivan", "marljiv", "discipliniran"; također su prebrojani sinonimi riječi.

Podaci o učestalosti pojavljivanja riječi uneseni su u tablicu:

Za obradu dobivenih podataka koristimo hi-kvadrat test.

Da bismo to učinili, napravit ćemo tablicu distribucije empirijskih frekvencija, tj. te frekvencije koje promatramo:

Teoretski, očekujemo da će frekvencije biti jednako raspoređene, tj. učestalost će biti proporcionalno raspoređena između dječaka i djevojčica. Napravimo tablicu teoretskih frekvencija. Da biste to učinili, pomnožite zbroj retka sa zbrojem stupca i podijelite dobiveni broj s ukupnim zbrojem (s).

Konačna tablica za izračune izgledat će ovako:

Empirijski (E)

Teorijski (T)

(E - T)I / T

dečki

"Aktivan"

"Marljiv"

"disciplinirano"

"Aktivan"

"Marljiv"

"disciplinirano"

Iznos: 4,21

h2 = ?(E - T)I / T

gdje je R broj redaka u tablici.

U našem slučaju, hi-kvadrat = 4,21; n = 2.

Pomoću tablice kritičnih vrijednosti kriterija nalazimo: s n = 2 i razinom pogreške od 0,05, kritična vrijednost h2 = 5,99.

Dobivena vrijednost manja je od kritične vrijednosti, što znači da je nulta hipoteza prihvaćena.

Zaključak: učitelji ne pridaju važnost spolu djeteta kada pišu karakteristike za njega.

Zaključak

Studenti gotovo svih specijalnosti proučavaju odjeljak "teorija vjerojatnosti i matematička statistika" na kraju kolegija više matematike; u stvarnosti se upoznaju samo s nekim osnovnim konceptima i rezultatima, koji očito nisu dovoljni za praktični rad. Studenti se upoznaju s nekim matematičkim istraživačkim metodama u posebnim kolegijima (npr. „Predviđanje i tehničko-ekonomsko planiranje“, „Tehničko-ekonomska analiza“, „Kontrola kvalitete proizvoda“, „Marketing“, „Kontroling“, „Matematičke metode predviđanja“ ”), „Statistika” itd. - u slučaju studenata ekonomskih specijalnosti), međutim, prikaz je u većini slučajeva vrlo skraćen i formulatičan. Zbog toga je znanje stručnjaka za primijenjenu statistiku nedovoljno.

Stoga je predmet “Primijenjena statistika” na tehničkim sveučilištima od velike važnosti, a kolegij “Ekonometrija” na ekonomskim sveučilištima, budući da je ekonometrija, kao što je poznato, statistička analiza specifičnih ekonomskih podataka.

Teorija vjerojatnosti i matematička statistika pružaju temeljno znanje za primijenjenu statistiku i ekonometriju.

Potrebni su stručnjacima za praktičan rad.

Pogledao sam kontinuirani probabilistički model i pokušao primjerima pokazati njegovu upotrebu.

I na kraju rada došao sam do zaključka da je kompetentna implementacija osnovnih postupaka matematičko-statičke analize podataka i statičkog testiranja hipoteza nemoguća bez poznavanja hi-kvadrat modela, kao i sposobnosti korištenja njegovog stol.

Bibliografija

1. Orlov A.I. Primijenjena statistika. M.: Izdavačka kuća "Ispit", 2004.

2. Gmurman V.E. Teorija vjerojatnosti i matematička statistika. M.: Viša škola, 1999. - 479 str.

3. Ayvozyan S.A. Teorija vjerojatnosti i primijenjena statistika, sv. M.: Jedinstvo, 2001. - 656 str.

4. Khamitov G.P., Vedernikova T.I. Vjerojatnosti i statistika. Irkutsk: BGUEP, 2006. - 272 str.

5. Ezhova L.N. Ekonometrija. Irkutsk: BGUEP, 2002. - 314 str.

6. Mosteller F. Pedeset zabavnih probabilističkih problema s rješenjima. M.: Nauka, 1975. - 111 str.

7. Mosteller F. Vjerojatnost. M.: Mir, 1969. - 428 str.

8. Yaglom A.M. Vjerojatnost i informacija. M.: Nauka, 1973. - 511 str.

9. Čistjakov V.P. Predmet teorije vjerojatnosti. M.: Nauka, 1982. - 256 str.

10. Kremer N.Sh. Teorija vjerojatnosti i matematička statistika. M.: JEDINSTVO, 2000. - 543 str.

11. Matematička enciklopedija, sv.1. M.: Sovjetska enciklopedija, 1976. - 655 str.

12. http://psystat.at.ua/ - Statistika u psihologiji i pedagogiji. Članak Hi-kvadrat test.

Primjena

Kritične distribucijske točke h2

stol 1

Objavljeno na Allbest.ru

...

Slični dokumenti

    Probabilistički model i aksiomatika A.N. Kolmogorov. Slučajne varijable i vektori, klasični granični problem teorije vjerojatnosti. Primarna obrada statističkih podataka. Točkaste procjene numeričkih karakteristika. Statističko testiranje hipoteza.

    priručnik za obuku, dodan 03.02.2010

    Pravila za izvođenje i popunjavanje testova za dopisni odjel. Zadatci i primjeri rješavanja zadataka iz matematičke statistike i teorije vjerojatnosti. Tablice referentnih podataka distribucija, gustoća standardne normalne distribucije.

    priručnik za obuku, dodan 29.11.2009

    Osnovne metode formaliziranog opisa i analize slučajnih pojava, obrada i analiza rezultata fizikalnih i numeričkih eksperimenata u teoriji vjerojatnosti. Osnovni pojmovi i aksiomi teorije vjerojatnosti. Osnovni pojmovi matematičke statistike.

    tečaj predavanja, dodan 08.04.2011

    Određivanje zakona distribucije vjerojatnosti rezultata mjerenja u matematičkoj statistici. Provjera usklađenosti empirijske distribucije s teoretskom. Određivanje intervala pouzdanosti u kojem se nalazi vrijednost mjerene veličine.

    kolegij, dodan 11.02.2012

    Konvergencija nizova slučajnih varijabli i distribucija vjerojatnosti. Metoda karakterističnih funkcija. Testiranje statističkih hipoteza i izvođenje središnjeg graničnog teorema za zadane nizove nezavisnih slučajnih varijabli.

    kolegij, dodan 13.11.2012

    Glavne faze obrade podataka prirodnih opažanja metodom matematičke statistike. Vrednovanje dobivenih rezultata, njihova upotreba u donošenju upravljačkih odluka u području očuvanja prirode i upravljanja okolišem. Testiranje statističkih hipoteza.

    praktični rad, dodano 24.05.2013

    Bit zakona raspodjele i njegova praktična primjena za rješavanje statističkih problema. Određivanje varijance slučajne varijable, matematičko očekivanje i standardna devijacija. Značajke jednosmjerne analize varijance.

    test, dodan 07.12.2013

    Vjerojatnost i njezina opća definicija. Teoremi o zbrajanju i množenju vjerojatnosti. Diskretne slučajne varijable i njihove numeričke karakteristike. Zakon velikih brojeva. Statistička distribucija uzorka. Elementi korelacijske i regresijske analize.

    tečaj predavanja, dodan 13.06.2015

    Program kolegija, osnovni pojmovi i formule teorije vjerojatnosti, njihovo obrazloženje i značenje. Mjesto i uloga matematičke statistike u disciplini. Primjeri i objašnjenja za rješavanje najčešćih zadataka iz različitih tema iz ovih akademskih disciplina.

    priručnik za obuku, dodan 15.1.2010

    Teorija vjerojatnosti i matematička statistika su znanosti o metodama kvantitativne analize masovnih slučajnih pojava. Skup vrijednosti slučajne varijable naziva se uzorak, a elementi skupa nazivaju se uzorci vrijednosti slučajne varijable.