To cite this paper / Pentru a cita lucrarea:
Petrisor AI (2000), Notiuni introductive de biostatistica, curs pentru reprezentantii lotului olimpic roman la Olimpiada internationala de biologie, Catedra UNESCO-Cousteau de ecologie sistemica si managementul mediului, Facultatea de biologie, Universitatea Bucuresti, Bucuresti, Romania, 26 mai 2000

Notiuni introductive de biostatistica

Alexandru-Ionut Petrisor
Master īn biostatistica, doctorand īn ecologie
Universitatea din Carolina de Sud


1. Conceptul de probabilitate

Exista mai multe definitii ale conceptului de probabilitate. Unele dintre acestea poate fi ilustrate de un exemplu.

a. Definitia clasica: probabilitatea de producere a unui eveniment este raportul dintre numarul de cazuri favorabile evenimentului respectiv si numarul total de cazuri.

Exemplu. Care este probabilitatea ca un nou-nascut sa fie baiat?
Toata lumea raspunde, aproape intuitiv, "50%". Cum poate fi calculata? Avem de-a face, evident, cu doua evenimente posibile:
(i) Noul-nascut este baiat
(ii) Noul-nascut este fata
Numarul total de cazuri este 2, iar dintre acestea numai primul (i) este favorabil evenimentului de interes.
1 / 2 = 0,5 sau 50%

b. Alti autori definesc probabilitatea ca fiind numarul spre care tinde frecventa relativa de producere a unui eveniment. Astfel, īn cazul de mai sus, sa ne imaginam ca avem de-a face cu un numar de familii care au cāte doi copii.
2 familii - 1 baiat si 3 fete, adica 25% baieti
4 familii - 5 baieti si 3 fete, adica 62,5% baieti
100 familii - 104 baieti si 96 fete, adica 52% baieti
1 milion de familii - 999.992 baieti si 1.000.008 fete, adica 49,9996% baieti
Se observa ca, pe masura ce numarul de "īncercari" creste, proportia baietilor se apropie din ce īn ce mai mult de cea teoretica (50%).

2. Media, mediana, dispersia si abaterea standard. Aplicatii

a. Notiunea de tendinta centrala: se pune adesea problema care este cea mai reprezentativa valoare pentru un sir de date, care este valoarea tipica a acestui sir. Astfel de probleme se pun, spre exemplu, cānd o anumita caracteristica masurabila reprezinta un criteriu de delimitare a speciilor sau cānd se stabilesc standarde de "normalitate".

i. Cel mai bine cunoscut si frecvent utilizat parametru de tendinta centrala este media, calculata ca suma valorilor unui sir raportata la numarul acestora.

ii. Mediana este valoarea care īmparte o serie statistica ordonata crescator īn doua subserii de volume egale, ca numar de unitati statistice sau fractiuni ale acestora. In cazul unei serii de volum impar, aceasta este termenul "din mijloc", iar īn cazul unei serii de volum par, semisuma termenilor din mijloc.

Mediana prezinta avantajul ca este simplu de calculat, si poate fi calculata īn situatii (teoretice sau practice) īn care calculul mediei este dificil sau chiar imposibil, prin simpla ordonare a unitatilor statistice urmate de masurarea exemplarului (sau exemplarelor) median(e).

b. Notiunea de īmprastiere este strāns legata de precedenta, vorbindu-se de īmprastiere ca o abatere de la un parametru de tendinta centrala, de exemplu media si mediana.

i. Dispersia se calculeaza ca suma a patratelor abaterilor valorilor sirului de la media aritmetica, raportata la numarul acestora.

ii. Abaterea standard este radacina patrata a dispersiei.