Hľa, človek štatistik.

Autor: dispersus | 27.5.2011 o 14:36 | (upravené 2.6.2011 o 15:04) Karma článku: 4,06 | Prečítané:  1272x

V poslednom období sa v médiách často spomínali štatistici. Vedia ale vôbec, kto to je? Poznajú ľudia inú štatistiku ako tú demografickú a sociologickú?  Je štatistik matematik? Je štatistik informatik? Môže byť štatistik biológ, či fyzik? A ďalšie otázky, na ktoré si snažím nájsť odpoveď.

Family=unique(Izrael(:,2));

for i=1: size(Family,1)

Members= strcmp(Izrael(:,2),Family(i,1));

Freq(i)=size(find(strcmp(Izrael(Members,3),'M')),1);

end

 

Približne takto by v súčasnosti mohla vyzerať prvá zmienka o štatistike v jazyku Matlab, ktorú adresoval Boh v štvrtej knihe Mojžišovej.

„Spočítajte všetkých mužov celej pospolitosti Izraelových synov podľa  ich rodov a rodín, podľa počtu mien všetky mužské osoby, hlavu po hlave." (Numeri  1-5).

 

Všeobecne nezáleží na tom, či to boli Protosumeri alebo Tóra, na počiatku štatistiky bolo slovo, respektíve matematický operátor: Suma. Zmenil sa jazyk, vylepšili sa metódy, rozšírili sa objekty skúmania. Suma však pretrvala.

Takýto úvod ma napadol pri predstave paralely súčasnej a historickej štatistiky.

 

 

Ecce homo statistic

Čitateľ mi dúfam odpustí drastický časový posun, ktorého sa dopustím, keď preskočím vplyv Pascala (1623-1662) i Fermata (1601-1665) s ich hazardnou korešpondenciou, Bernoulliho (1700-1782) s jeho Zákonom veľkých čísel, Achilla Guillarda, autora termínu „Demographie" (1799-1876), kontroverzného Bayesa (1702- 1761), veľkého Gaussa (1777-1855), alebo Poissona (1781-1840) a dokonca i modernistov ako bol Fischer (1890-1962), Gosset (1876-1937), Pearson (1895-1980) a skočím rovno do  súčasnosti.

 

V októbri minulého roka, presnejšie 20.10.2010, štatistici prvý krát v histórií slávili „svoj deň".  Otázky, ktoré sa mi usadili v mysli po zhliadnutí prezentačných klipov a správ v médiách, zostali dodnes úplne nezodpovedné.

  • Kto mal oslavovať tento deň?
  • Kto sú všetko štatistici?

Najhlasnejšou „trúbou" štatistiky po celom svete sa stali štatistické úrady, ktorých činnosť je azda najvernejšou kópiou spomínaného Božieho poslania. Tieto úrady  aj v drvivej väčšine reprezentujú predstavy bežných obyvateľov, ktoré sa asociujú pri slove „štatistika".

„Štatistik je zamestnanec  štatistického úradu."

1.JPG

S týmto tvrdením si dovolím nesúhlasiť, nakoľko ja tvrdím:

„Štatistik je aj zamestnanec štatistického úradu."

3.JPG

Rozdiel sa skrýva v úsudku, ktorý ľudia a médiá (hlavne v poslednom období) robia a ktorý z môjho pohľadu štatistike ako vednému odboru ubližuje. Oberá ju totiž o jej mohutný palebný arzenál a preraďuje ju na loď inej triedy a iného užšieho (striktne zákonom vymedzeného) zamerania. Tým, samozrejme, nechcem znižovať váhu klasického jadra popisnej štatistiky, ale nemôžeme sa tváriť, že tie rakety s vyvinutým samo-navádzacím prediktívnym systémom (robustná a neparametrická analýza, časové rady, rozhodovacie stromy,  zhluková analýza,  analýza hlavných komponent, diskriminačná analýza, asociačná analýza, viacrozmerné škálovanie a mnohé iné výdobytky 20. storočia), ktoré v sebe vlajková loď „Štatistika" nesie, jej nepatria. Tie zďaleka nie sú nástroje pasívneho monitorovania a vykazovania, práve naopak. Sú nedeliteľnou súčasťou palebného arzenálu tohto plavidla.  Ich úlohu je aktívne vyhľadávať ciele a bojovať v reálnom čase, útočiť neustále a hlavne všade, bez ohľadu na druh, povahu a charakter dát.

 

Ja si však dovolím ísť ešte ďalej. Dnešnej vede dominujú  názvy ako genetické algoritmy, strojové učenie, neurónové siete atď. Čo však majú so štatistikou? Pravoverní štatistici alebo informatici odmietavo  proklamujú, že to štatistika nie je.  Ponúka sa mi následná otázka: „A čo je to?" Odpoveďou by pravdepodobne boli oblasť kybernetiky a umelej inteligencie.

Profesor David Hand, bývalý prezident Kráľovskej štatistickej spoločnosti,  ktorý ako jediný od čias Lorda Georga Hamiltona (1915) zastával svoje funkčné obdobie dva krát, by tento odmietavý názor asi ani prinajmenšom nezdieľal [3].  Je samozrejmosťou, že sa tento muž za štatistika považuje a málokto ho môže obviniť, že si uzurpuje identitu, ktorá mu právom nepatrí. Výpočtové oblasti, ktorých anglické názvy sa kvôli svojej lepšej vypovedacej schopnosti zaužívali (angl. Feature detection, Data mining) a ktorým sa, okrem iného, aktívne venuje už od svojich vedeckých prvopočiatkov, považuje za nedeliteľnú súčasť štatistickej vedy. Podľa slov Johna Chambersa [1] za širšiu štatistiku.

Je možné, aby človek, ktorý by sa mal hrdo hlásiť ku kybernetikom bol predsedom štatistikov? Veď to je v príkrom rozpore s tvrdeniami obrancov  čistoty štatistickej disciplíny.

Práve táto kacírska vízia štatistiky je blízka i môjmu videniu.  Oblasť klasickej štatistiky alebo demografie, (reprezentovaná hlavne činnosťou štatistických úradov) môže v konfrontácií so súčasnými požiadavkami naraziť na svoje deskriptívne limity a tie môže prekročiť implementáciou poznatkov a hlavne spôsobu myslenia z iných odborov.  Paradoxne, práve ostatné odbory si úspešne požičiavajú a implementujú matematicko-štatistický aparát.  Je preto pre mňa smutným faktom, že sa pravoverní štatistici sami bránia vylepšeniu  svojho streleckého arzenálu, ktorý poskytujú ostatné odbory.

Štatistici, bez schopnosti programovať, brániaci sa prijať teoretické koncepty numerickej matematiky, biológie, fyziky, alebo naopak programátori bez schopnosti implementovať pokročilejšie štatistické metódy a matematické vzorce, sú z dlhodobého hľadiska odsúdení k preradeniu na nižší rýchlostný stupeň. Samozrejme, každý zo spomínaných odborov má svoju špecifickú príchuť.

Hĺbková analýza údajov (angl. data mining) zameraná na mohutné dátové sklady, strojové učenie bazírujúce na optimalizácií algoritmov, analýza obrazu posadnutá filtrami, text mining a matematická lingvistika stojace na sémantike, bioinformatika štúdujúca genóm a procesy v mozgu, banková a poistná analytika riadiaca finančné riziká.  Toto všetko zastrešujú tie isté matematicko-štatistické nástroje zložených súm, priemerov, pravdepodobností a rozdelení.

Štatistika prerástla kvetináč vedy o štáte, ekonomike a obyvateľstve, v ktorom sa jej najviac darilo rásť. Prešla obrovským prerodom od doby, keď ju pokrstil Gerolamo Ghilini v názve svojho diela "Ristretto della civile, politica, statistica e militare scienza" (1589) a keď sa prvý krát objavil vyučovací predmet s rovnakým názvom v rozvrhu študentov Univerzity v Gottingene (1768). Bolo by chybou, keby sa o svoje deti z iných odborov „pravoverná" veda o štáte nezaujímala a neučila sa od nich.

 

Záver

Pred päťdesiatimi rokmi by možno bolo jednoznačne rozlíšiteľné, kto je a čím sa štatistik zaoberá. V dnešnej dobe je už situácia neporovnateľná. S informačným progresom vytýčené hranice medzi vednými odbormi padajú, strácajú zmysel, stávajú sa čoraz hmlistejšími a sú skôr bariérou vo vzájomnej komunikácií.

Aj z tohto dôvodu mal 20.október 2010 patriť všetkým, ktorí dávajú dátam zmysel, informácií použiteľnosť a rozhodovaniu potrebnú znalosť. Ani zďaleka sa nedomnievam, že táto moja definícia je bezchybná. Má veľa chýb, nedostatkov, možno i logických nezrovnalostí. Ale to má i svet okolo nás. Štatistika sa rozhodla (s výnimkou pravdepodobnosti) nepôsobiť vo svete postulátov, viet a dôkazov. Naopak, chce pôsobiť vo svete nezrovnalostí, chýb a nedostatkov a  poskytovať živnú pôdu pre rozhodovanie v tomto prostredí neistoty, ktorý nás obklopuje. A i vďaka (žiaľ) tomuto údelu, ktorý si na seba vzala, nebude štatistika nikdy ovenčená aureolou dokonalosti a jednoznačnosti ostatných vied a bude pod ostrou paľbou verejnosti.

Matematika je jediný jazyk, ktorý zdieľajú všetky ľudské bytosti. Štatistika je ale jediný učiteľ, ktorý nás ho dokáže naučiť používať v praxi a v náš prospech.

 

LukasPastorek.jpg

Lukáš Pastorek

Step Out of Range

Informácie a perličky zo sveta analytiky a vedy  - facebook- klub dispersus

Článok vychádza v diskusnej rubrike časopisu Slovenskej štatistickej a demografickej spoločnosti.

 


 

 

Literatúra:

 

[1] CHAMBERS, J.M. 1993. Greater or lesser statistics: a choice for future research. Stat Comput 3, 1993 s. 182-184.

[2] GIUSEPPE, L. 2000. The birth of statistics and the origins of the new natural science. In: Metron - International Journal of Statistics, , roč. 58, 2000, s. 185-211.

[3] HAND, D.J. 2010. Statistics_An_Overview. [online]. Dostupné z z WWW: <http://www.ekfak.kg.ac.rs/mlovric/Statistics_An_Overview_David_Hand.pdf >

cit. 20.5.2011

[4] HAND, D.J. 2008. Statistics: a very short introduction. Oxford: Oxford University Press, 2008.

[5] MADARÁSZ, Š. & MADARÁSZOVÁ E. 2011. Historický vývoj štatistiky I. História demografie od prvopočiatku po 20. storočie. In: Forum statisticum slovacum, roč. 7, č. 1/2011, 2011, s. 68-81

 

Páčil sa Vám tento článok? Pridajte si blogera medzi obľúbených a my Vám pošleme email keď napíše ďalší článok
Pridaj k obľúbeným

Hlavné správy

DOMOV

Minúta po minúte: Fico na sneme opäť útočil aj na médiá

Vo funkcii podpredsedov skončia Dušan Čaplovič a Pavol Paška.

DOMOV

Odhalila kauzu predsedníctva. Odkiaľ prišla Zuzana Hlávková?

Gymnázium, ktoré navštevovala, jej plánuje vyjadriť verejnú podporu.

EKONOMIKA

RegioJet skracuje svoje vlaky do Košíc, na prevádzku má málo vozňov

Jazdiť bude len so siedmimi vozňami.


Už ste čítali?