Tolygiai paskirstyto atsitiktinio dydžio sklaida. Vienodas tikimybių pasiskirstymas

Paskirstymo funkcija šiuo atveju pagal (5.7) bus tokia:

kur: m - tikėtina vertė, s – standartinis nuokrypis.

Vokiečių matematiko Gauso vardu normalusis skirstinys dar vadinamas Gauso. Tai, kad atsitiktinis dydis turi normalųjį skirstinį su parametrais: m,, žymimas taip: N (m, s), kur: m =a =M ;

Gana dažnai formulėse matematinis lūkestis žymimas a . Jeigu atsitiktinis dydis pasiskirsto pagal dėsnį N(0,1), tai jis vadinamas normalizuotu arba standartizuotu normaliuoju dydžiu. Jo paskirstymo funkcija yra tokia:

.

Normaliojo skirstinio tankio grafikas, kuris vadinamas normaliąja kreive arba Gauso kreive, parodytas 5.4 pav.

Ryžiai. 5.4. Normalus pasiskirstymo tankis

Skaitinių charakteristikų apibrėžimas atsitiktinis kintamasis pagal jo tankį nagrinėjamas pavyzdyje.

6 pavyzdys.

Nepertraukiamas atsitiktinis dydis nustatomas pagal pasiskirstymo tankį: .

Nustatykite skirstinio tipą, raskite matematinę lūkesčius M(X) ir dispersiją D(X).

Palyginus pateiktą pasiskirstymo tankį su (5.16), galime daryti išvadą, kad yra duotas normaliojo pasiskirstymo dėsnis su m =4. Todėl matematinė lūkestis M(X)=4, dispersija D(X)=9.

Standartinis nuokrypis s=3.

Laplaso funkcija, kurios forma:

,

yra susijęs su normaliojo pasiskirstymo funkcija (5.17), ryšiu:

F 0 (x) \u003d F (x) + 0,5.

Laplaso funkcija yra keista.

Ф(-x)=-Ф(x).

Laplaso funkcijos Ф(х) reikšmės pateikiamos lentelėse ir paimtos iš lentelės pagal x reikšmę (žr. 1 priedą).

Tikimybių teorijoje ir tikrovės aprašyme svarbų vaidmenį vaidina normalus nuolatinio atsitiktinio dydžio skirstinys, jis labai paplitęs atsitiktiniuose gamtos reiškiniuose. Praktikoje labai dažnai pasitaiko atsitiktinių dydžių, kurie susidaro būtent dėl ​​daugelio atsitiktinių terminų sumavimo. Visų pirma, matavimo klaidų analizė rodo, kad jos yra įvairių rūšių klaidų suma. Praktika rodo, kad matavimo paklaidų pasiskirstymas yra artimas normaliajam dėsniui.

Naudojant Laplaso funkciją, galima išspręsti tikimybės patekti į tam tikrą intervalą ir tam tikro normalaus atsitiktinio dydžio nuokrypio skaičiavimo uždavinius.

Ištisinio atsitiktinio dydžio tikimybių skirstinys X, kuris paima visas vertes iš intervalo , vadinamas uniforma, jei jo tikimybės tankis šiame atkarpoje yra pastovus, o išorėje lygus nuliui. Taigi ištisinio atsitiktinio dydžio tikimybės tankis X, tolygiai paskirstytas segmente , atrodo kaip:

Apibrėžkime tikėtina vertė, dispersija o atsitiktiniam dydžiui vienodo pasiskirstymo.

, , .

Pavyzdys. Visos tolygiai paskirstyto atsitiktinio dydžio reikšmės yra segmente . Raskite tikimybę, kad atsitiktinis dydis pateks į intervalą (3;5) .

a = 2, b = 8, .

Binominis skirstinys

Tegul jis gaminamas n testus ir įvykio tikimybę A kiekviename teste yra p ir nepriklauso nuo kitų bandymų (nepriklausomų bandymų) rezultatų. Nuo įvykio tikimybės A viename teste yra p, tada jo neįvykimo tikimybė lygi q = 1 p.

Tegul įvykis A atėjo n išbandymai m kartą. Šis sudėtingas įvykis gali būti parašytas kaip produktas:

.

Tada tikimybė, kad n bandomasis renginys A Ateis m kartų , apskaičiuojamas pagal formulę:

arba (1)

Formulė (1) vadinama Bernulio formulė.

Leisti X yra atsitiktinis dydis, lygus įvykio įvykių skaičiui A in n testai, kurie ima reikšmes su tikimybėmis:

Gautas atsitiktinio dydžio pasiskirstymo dėsnis vadinamas binominio skirstymo dėsnis.

X m n
P

Tikėtina vertė, dispersija ir standartinis nuokrypis atsitiktiniai dydžiai, paskirstyti pagal dvinarį dėsnį, nustatomi pagal formules:

, , .

Pavyzdys.Į taikinį paleidžiami trys šūviai, kurių kiekvieno smūgio tikimybė yra 0,8. Mes laikome atsitiktinį kintamąjį X- smūgių į taikinį skaičius. Raskite jo pasiskirstymo dėsnį, matematinį lūkestį, dispersiją ir standartinį nuokrypį.

p=0,8, q = 0,2, n=3, , , .

- 0 pataikymo tikimybė;



Vieno smūgio tikimybė;

Dviejų smūgių tikimybė;

yra trijų smūgių tikimybė.

Gauname platinimo įstatymą:

X
P 0,008 0,096 0,384 0,512

Užduotys

1. Moneta metama 7 kartus. Raskite tikimybę, kad jis apvirs 4 kartus.

2. Moneta metama 8 kartus. Raskite tikimybę, kad herbas pasirodys ne daugiau kaip tris kartus.

3. Tikimybė pataikyti į taikinį šaudant iš ginklo p=0,6. Raskite matematinį lūkestį iš viso pataiko, jei paleidžiama 10 šūvių.

4. Raskite matematinį lūkesčius, kiek loterijos bilietų laimės nupirkus 20 bilietų, o tikimybė laimėti už vieną bilietą yra 0,3.

Šis klausimas jau seniai buvo išsamiai ištirtas, o polinių koordinačių metodas, kurį 1958 m. pasiūlė George'as Boxas, Mervynas Mulleris ir George'as Marsaglia, buvo plačiausiai naudojamas. Šis metodas leidžia gauti porą nepriklausomų normaliai paskirstytų atsitiktinių dydžių, kurių vidurkis 0 ir dispersija 1:

Kur Z 0 ir Z 1 yra norimos reikšmės, s \u003d u 2 + v 2, o u ir v yra atsitiktiniai dydžiai, tolygiai paskirstyti atkarpoje (-1, 1), parinkti taip, kad būtų įvykdyta sąlyga 0< s < 1.
Daugelis naudoja šias formules net nesusimąstydami, o daugelis net neįtaria jų egzistavimo, nes naudoja paruoštus įgyvendinimus. Tačiau yra žmonių, kuriems kyla klausimų: „Iš kur atsirado ši formulė? Ir kodėl iš karto gaunate porą vertybių? Toliau pabandysiu aiškiai atsakyti į šiuos klausimus.


Pirmiausia leiskite man priminti, kas yra tikimybės tankis, atsitiktinio dydžio pasiskirstymo funkcija ir atvirkštinė funkcija. Tarkime, kad yra koks nors atsitiktinis dydis, kurio pasiskirstymas pateikiamas tankio funkcija f(x), kuri turi tokią formą:

Tai reiškia, kad tikimybė, kad šio atsitiktinio dydžio reikšmė bus intervale (A, B), yra lygi užtemdyto ploto plotui. Dėl to visos užtamsintos srities plotas turėtų būti lygus vienybei, nes bet kokiu atveju atsitiktinio dydžio reikšmė pateks į funkcijos f sritį.
Atsitiktinio dydžio pasiskirstymo funkcija yra tankio funkcijos integralas. Ir šiuo atveju tai apytikslis vaizdas bus taip:

Čia reiškia, kad atsitiktinio dydžio reikšmė bus mažesnė už A su tikimybe B. Dėl to funkcija niekada nemažėja, o jos reikšmės yra intervale .

Atvirkštinė funkcija yra funkcija, kuri grąžina pradinės funkcijos argumentą, jei perduodate jai pradinės funkcijos reikšmę. Pavyzdžiui, funkcijai x 2 atvirkštinė bus šaknies ištraukimo funkcija, sin (x) – arcsin (x) ir t. t.

Kadangi dauguma generatorių yra pseudo atsitiktiniai skaičiai išvestis duoda tik vienodą pasiskirstymą, tada dažnai tenka ją transformuoti į kokį nors kitą. Šiuo atveju įprastam Gauso:

Visų vienodo skirstinio transformavimo į bet kurį kitą skirstinį metodų pagrindas yra atvirkštinės transformacijos metodas. Tai veikia taip. Surandama funkcija, kuri yra atvirkštinė reikiamo skirstinio funkcijai, ir jai kaip argumentas perduodamas atsitiktinis dydis, tolygiai paskirstytas atkarpoje (0, 1). Išvestyje gauname reikšmę su reikiamu pasiskirstymu. Aiškumo dėlei pateikiame toliau pateiktą paveikslėlį.

Taigi, vienodas segmentas tarsi ištepamas pagal naują skirstymą ir per atvirkštinę funkciją projektuojamas į kitą ašį. Tačiau problema ta, kad Gauso skirstinio tankio integralą nėra lengva apskaičiuoti, todėl minėti mokslininkai turėjo sukčiauti.

Yra chi kvadrato skirstinys (Pearson skirstinys), kuris yra k nepriklausomų normaliųjų atsitiktinių dydžių kvadratų sumos skirstinys. Ir tuo atveju, kai k = 2, šis skirstinys yra eksponentinis.

Tai reiškia, kad jei taškas stačiakampėje koordinačių sistemoje turi atsitiktines X ir Y koordinates, paskirstytas normaliai, tada konvertavus šias koordinates į poliarinę sistemą (r, θ), spindulio kvadratas (atstumas nuo pradžios iki taško) pasiskirstys eksponentiškai, nes spindulio kvadratas yra koordinačių kvadratų suma (pagal Pitagoro dėsnį). Tokių taškų pasiskirstymo tankis plokštumoje atrodys taip:


Kadangi jis yra lygus visomis kryptimis, kampas θ turės tolygų pasiskirstymą diapazone nuo 0 iki 2π. Taip pat yra atvirkščiai: jei nurodysite polinės koordinačių sistemos tašką naudodami du nepriklausomus atsitiktinius dydžius (kampas pasiskirstęs tolygiai, o spindulys pasiskirstęs eksponentiškai), tada šio taško stačiakampės koordinatės bus nepriklausomi normalūs atsitiktiniai dydžiai. O eksponentinį skirstinį iš vienodo skirstinio jau daug lengviau gauti, naudojant tą patį atvirkštinės transformacijos metodą. Tai yra Box-Muller polinio metodo esmė.
Dabar gaukime formules.

(1)

Norint gauti r ir θ, reikia sugeneruoti du atsitiktinius dydžius, tolygiai paskirstytus atkarpoje (0, 1) (vadinkime juos u ir v), kurių vieno (tarkime v) skirstinį reikia konvertuoti į eksponentinį į gauti spindulį. Eksponentinio paskirstymo funkcija atrodo taip:

Jo atvirkštinė funkcija:

Kadangi vienodas pasiskirstymas yra simetriškas, transformacija veiks panašiai su funkcija

Iš chi kvadrato pasiskirstymo formulės išplaukia, kad λ = 0,5. Šia funkcija pakeičiame λ, v ir gauname spindulio kvadratą, o tada patį spindulį:

Kampą gauname ištempę vieneto segmentą iki 2π:

Dabar pakeičiame r ir θ į formules (1) ir gauname:

(2)

Šios formulės yra paruoštos naudoti. X ir Y bus nepriklausomi ir normaliai pasiskirstę su dispersija 1, o vidurkiu 0. Norint gauti skirstinį su kitomis charakteristikomis, pakanka funkcijos rezultatą padauginti iš standartinio nuokrypio ir pridėti vidurkį.
Tačiau yra būdas atsikratyti trigonometrinės funkcijos, nurodant kampą ne tiesiogiai, o netiesiogiai per atsitiktinio apskritimo taško stačiakampes koordinates. Tada per šias koordinates bus galima apskaičiuoti spindulio vektoriaus ilgį, o tada rasti kosinusą ir sinusą, atitinkamai padalijus x ir y iš jo. Kaip ir kodėl tai veikia?
Atsitiktinį tašką pasirenkame iš tolygiai paskirstyto vienetinio spindulio apskritime ir šio taško spindulio vektoriaus ilgio kvadratą pažymime raide s:

Pasirinkimas atliekamas priskiriant atsitiktines x ir y stačiakampes koordinates, tolygiai paskirstytas intervale (-1, 1), ir atmetant taškus, kurie nepriklauso apskritimui, taip pat centrinį tašką, kuriame yra spindulio vektoriaus kampas. neapibrėžtas. Tai yra, sąlyga 0< s < 1. Тогда, как и в случае с Гауссовским распределением на плоскости, угол θ будет распределен равномерно. Это очевидно - количество точек в каждом направлении одинаково, значит каждый угол равновероятен. Но есть и менее очевидный факт - s тоже будет иметь равномерное распределение. Полученные s и θ будут независимы друг от друга. Поэтому мы можем воспользоваться значением s для получения экспоненциального распределения, не генерируя третью случайную величину. Подставим теперь s в формулы (2) вместо v, а вместо тригонометрических функций - их расчет делением координаты на длину радиус-вектора, которая в данном случае является корнем из s:

Gauname formules, kaip ir straipsnio pradžioje. Šio metodo trūkumas yra taškų, kurie neįtraukti į ratą, atmetimas. Tai yra, naudojant tik 78,5% sugeneruotų atsitiktinių dydžių. Senesniuose kompiuteriuose trigonometrinių funkcijų trūkumas vis dar buvo didelis privalumas. Dabar, kai viena procesoriaus instrukcija vienu metu akimirksniu apskaičiuoja sinusą ir kosinusą, manau, kad šie metodai vis tiek gali konkuruoti.

Asmeniškai aš turiu dar du klausimus:

  • Kodėl s reikšmė pasiskirsto tolygiai?
  • Kodėl dviejų normalių atsitiktinių dydžių kvadratų suma pasiskirsto eksponentiškai?
Kadangi s yra spindulio kvadratas (paprastumo dėlei spindulys yra spindulio vektoriaus ilgis, nurodantis atsitiktinio taško vietą), pirmiausia išsiaiškiname, kaip spinduliai pasiskirsto. Kadangi apskritimas užpildytas tolygiai, akivaizdu, kad taškų, kurių spindulys r, skaičius yra proporcingas apskritimo, kurio spindulys r, apskritimui. Apskritimo perimetras proporcingas spinduliui. Tai reiškia, kad spindulių pasiskirstymo tankis tolygiai didėja nuo apskritimo centro iki jo kraštų. O tankio funkcija intervale (0, 1) yra f(x) = 2x. Koeficientas 2, kad figūros plotas po grafiku būtų lygus vienetui. Kai toks tankis yra kvadratas, jis tampa vienodas. Kadangi teoriškai šiuo atveju tam reikia padalyti tankio funkciją iš transformacijos funkcijos išvestinės (tai yra iš x 2). Ir vizualiai tai vyksta taip:

Jei panaši transformacija atliekama normaliam atsitiktiniam dydžiui, tada jo kvadrato tankio funkcija pasirodys panaši į hiperbolę. O dviejų normalių atsitiktinių dydžių kvadratų pridėjimas jau yra daug sudėtingesnis procesas, susijęs su dviguba integracija. Ir tai, kad rezultatas yra eksponentinis pasiskirstymas, aš asmeniškai turiu patikrinti čia praktinis metodas arba priimti kaip aksiomą. O besidomintiems siūlau iš arčiau susipažinti su tema, semtis žinių iš šių knygų:

  • Wentzel E.S. Tikimybių teorija
  • Knutas D.E. Programavimo menas 2 tomas

Baigdamas pateiksiu normaliai paskirstyto atsitiktinių skaičių generatoriaus „JavaScript“ diegimo pavyzdį:

Funkcija Gauss() ( var ready = false; var second = 0.0; this.next = funkcija(vidurkis, dev) ( vidurkis = vidurkis == neapibrėžtas ? 0.0: vidurkis; dev = dev == neapibrėžtas ? 1.0: dev; if ( this.ready) ( this.ready = false; grąžinti this.second * dev + mean; ) else ( var u, v, s; do ( u = 2.0 * Math.random() - 1.0; v = 2.0 * Math. atsitiktinis() - 1,0; s = u * u + v * v; ) while (s > 1,0 || s == 0,0); var r = Math.sqrt(-2,0 * Math.log(s) / s); this.second = r * u; this.ready = true; return r * v * dev + medium; ) ); ) g = new Gauss(); // sukurti objektą a = g.next(); // sugeneruokite reikšmių porą ir gaukite pirmąją b = g.next(); // gauti antrąjį c = g.next(); // dar kartą sugeneruokite verčių porą ir gaukite pirmąją
Vidutinis (matematinis tikėjimas) ir dev (standartinis nuokrypis) parametrai yra neprivalomi. Atkreipiu jūsų dėmesį į tai, kad logaritmas yra natūralus.

Kaip nuolatinio atsitiktinio dydžio pavyzdį, apsvarstykite atsitiktinį kintamąjį X, tolygiai paskirstytą intervale (a; b). Sakome, kad atsitiktinis dydis X tolygiai paskirstytas intervale (a; b), jei jo pasiskirstymo tankis šiame intervale nėra pastovus:

Iš normalizavimo sąlygos nustatome konstantos c reikšmę. Plotas po pasiskirstymo tankio kreive turėtų būti lygus vienetui, bet mūsų atveju tai yra stačiakampio su pagrindu (b - α) ir aukščiu c plotas (1 pav.).

Ryžiai. 1 Vienodo pasiskirstymo tankis
Iš čia randame konstantos c reikšmę:

Taigi tolygiai paskirstyto atsitiktinio dydžio tankis yra lygus

Dabar raskime paskirstymo funkciją pagal formulę:
1) už
2) už
3) 0+1+0=1.
Šiuo būdu,

Pasiskirstymo funkcija yra ištisinė ir nemažėja (2 pav.).

Ryžiai. 2 Tolygiai paskirstyto atsitiktinio dydžio pasiskirstymo funkcija

Raskime matematinis tolygiai paskirstyto atsitiktinio dydžio lūkestis pagal formulę:

Vienodo pasiskirstymo dispersija apskaičiuojamas pagal formulę ir yra lygus

1 pavyzdys. Skalės padalijimo vertė matavimo prietaisas lygus 0,2. Prietaiso rodmenys suapvalinami iki artimiausios visos padalos. Raskite tikimybę, kad skaitymo metu bus padaryta klaida: a) mažesnė nei 0,04; b) didelis 0,02
Sprendimas. Apvalinimo paklaida yra atsitiktinis dydis, tolygiai paskirstytas intervale tarp gretimų sveikųjų skaičių padalų. Laikykime intervalą (0; 0,2) tokiu padalijimu (a pav.). Apvalinimas gali būti atliekamas tiek link kairiosios kraštinės - 0, tiek į dešinę - 0,2, o tai reiškia, kad paklaida, mažesnė arba lygi 0,04, gali būti padaryta du kartus, į kurią reikia atsižvelgti skaičiuojant tikimybę:



P = 0,2 + 0,2 = 0,4

Antruoju atveju paklaidos reikšmė taip pat gali viršyti 0,02 abiejose padalijimo ribose, tai yra, ji gali būti didesnė nei 0,02 arba mažesnė nei 0,18.


Tada tokios klaidos tikimybė:

2 pavyzdys. Daryta prielaida, kad apie šalies ekonominės padėties stabilumą (karų, stichinių nelaimių ir pan. nebuvimą) per pastaruosius 50 metų galima spręsti pagal gyventojų pasiskirstymo pagal amžių pobūdį: esant ramiai turėtų būti uniforma. Atlikus tyrimą buvo gauti tokie vienos iš šalių duomenys.

Ar yra pagrindo manyti, kad šalyje buvo nestabili padėtis?

Sprendimą atliekame naudodami skaičiuotuvą Hipotezių tikrinimas. Rodiklių skaičiavimo lentelė.

GrupėsIntervalas vidurys, x iKiekis, fix i * f iKaupiamasis dažnis, S|x - x cf |*f(x - x sr) 2 *fDažnis, f i /n
0 - 10 5 0.14 0.7 0.14 5.32 202.16 0.14
10 - 20 15 0.09 1.35 0.23 2.52 70.56 0.09
20 - 30 25 0.1 2.5 0.33 1.8 32.4 0.1
30 - 40 35 0.08 2.8 0.41 0.64 5.12 0.08
40 - 50 45 0.16 7.2 0.57 0.32 0.64 0.16
50 - 60 55 0.13 7.15 0.7 1.56 18.72 0.13
60 - 70 65 0.12 7.8 0.82 2.64 58.08 0.12
70 - 80 75 0.18 13.5 1 5.76 184.32 0.18
1 43 20.56 572 1
Paskirstymo centro metrika.
svertinis vidurkis


Variacijos rodikliai.
Absoliutus kitimo rodikliai.
Variacijų diapazonas yra skirtumas tarp didžiausios ir minimalios pirminės serijos atributo verčių.
R = X max - X min
R = 70 - 0 = 70
Sklaida- apibūdina sklaidos matą aplink jo vidutinę vertę (dispersijos matą, t. y. nuokrypį nuo vidurkio).


Standartinis nuokrypis.

Kiekviena serijos reikšmė nuo vidutinės 43 vertės skiriasi ne daugiau kaip 23,92
Hipotezių apie pasiskirstymo tipą tikrinimas.
4. Hipotezės apie vienodas paskirstymas gyventojų.
Siekiant patikrinti hipotezę apie vienodą X pasiskirstymą, t.y. pagal dėsnį: f(x) = 1/(b-a) intervale (a,b)
būtina:
1. Įvertinkite parametrus a ir b – intervalo, kuriame galai galimas vertes X pagal formules (per ženklą * žymi parametrų įvertinimus):

2. Raskite apskaičiuotojo skirstinio f(x) = 1/(b * - a *) tikimybių tankį.
3. Raskite teorinius dažnius:
n 1 \u003d nP 1 \u003d n \u003d n * 1 / (b * - a *) * (x 1 - a *)
n 2 \u003d n 3 \u003d ... \u003d n s-1 \u003d n * 1 / (b * - a *) * (x i - x i-1)
n s = n*1/(b * - a *)* (b * - x s-1)
4. Palyginkite empirinius ir teorinius dažnius, naudodami Pirsono testą, darydami prielaidą, kad laisvės laipsnių skaičius k = s-3, kur s yra pradinių atrankos intervalų skaičius; jei vis dėlto buvo sudarytas mažų dažnių derinys, taigi ir patys intervalai, tai s yra intervalų, likusių po derinio, skaičius.

Sprendimas:
1. Raskite tolygaus skirstinio parametrų a * ir b * įverčius pagal formules:


2. Raskite tariamo vienodo skirstinio tankį:
f(x) = 1/(b * - a *) = 1/(84,42 - 1,58) = 0,0121
3. Raskite teorinius dažnius:
n 1 \u003d n * f (x) (x 1 - a *) \u003d 1 * 0,0121 (10-1,58) \u003d 0,1
n 8 \u003d n * f (x) (b * - x 7) \u003d 1 * 0,0121 (84,42-70) \u003d 0,17
Likusios n s bus lygios:
n s = n*f(x)(x i – x i-1)

in in*in i - n * i(n i – n* i) 2(n i - n * i) 2 /n * i
1 0.14 0.1 0.0383 0.00147 0.0144
2 0.09 0.12 -0.0307 0.000943 0.00781
3 0.1 0.12 -0.0207 0.000429 0.00355
4 0.08 0.12 -0.0407 0.00166 0.0137
5 0.16 0.12 0.0393 0.00154 0.0128
6 0.13 0.12 0.0093 8.6E-5 0.000716
7 0.12 0.12 -0.000701 0 4.0E-6
8 0.18 0.17 0.00589 3.5E-5 0.000199
Iš viso 1 0.0532
Apibrėžkime kritinės srities ribą. Kadangi Pirsono statistika matuoja skirtumą tarp empirinio ir teorinio skirstinio, kuo didesnė jo stebima K obs reikšmė, tuo stipresnis argumentas prieš pagrindinę hipotezę.
Todėl šios statistikos kritinė sritis visada yra dešiniarankė :)