Estadística

Gràfica de la distribució normal

L'estadística o estatística[1] és la ciència matemàtica relacionada amb la recopilació, anàlisi, interpretació i representació de dades. S'utilitza en diverses disciplines acadèmiques, de les ciències físiques a les ciències socials i humanitats. A l'enginyeria l'estadística aplicada s'utilitza sobretot per a obtenir resultats empírics i per al control de la qualitat i de lleis i normatives. També s'utilitza en la presa informada de decisions en les diverses àrees dels negocis i del govern.

Els mètodes estadístics s'utilitzen per resumir o descriure un grup de dades; això s'anomena estadística descriptiva. A més, els patrons de les dades es poden modelar considerant l'aleatorietat i la incertesa de les observacions per tal d'inferir quant al procés o la població que es vol estudiar; això s'anomena estadística inferencial o inductiva. L'estadística descriptiva i l'estadística inferencial són part de l'estadística aplicada. També existeix l'estadística matemàtica que estudia els conceptes teòrics de la disciplina.

L'estadística és la pràctica de desenvolupar coneixement humà mitjançant l'ús de dades empíriques. Es basa en la teoria estadística, que és una branca de la matemàtica aplicada. Seguint aquesta teoria, la incertesa i l'aleatorietat es modelen utilitzant la teoria de probabilitats. La pràctica de l'estadística inclou la planificació, resum i interpretació d'observacions incertes. Com que l'objectiu de l'estadística és produir la millor informació amb la informació disponible, alguns autors la consideren una branca de la teoria de decisions.

Història

Article principal: història de l'estadística

Si bé el nom d'estadística és relativament recent – en general s'atribueix l'origen del nom al segle XVIII de l'alemany Staatskunde (coneixement d'estat) – aquesta activitat sembla que ha existit des del naixement de les primeres estructures socials. D'altra banda, els primers texts escrits que s'han trobat eren censos de bestiar, informacions sobre el seu curs i contractes diversos. Es té així rastre de censos a la Xina al segle XXIII aC o a Egipte al segle XVIII aC. Aquest sistema de recull de dades prossegueix fins al segle XVII. A Europa, el paper de col·lector és sovint mantingut per gremis comercials, i després pels intendents de l'Estat. És només al segle XVIII que es veu aparèixer el paper preventiu de les estadístiques amb la construcció de les primeres taules de mortalitat.

L'estadística matemàtica es va recolzar en els primers treballs en relació amb les probabilitats desenvolupats per Fermat i Pascal. És probablement amb Thomas Bayes que es viu aparèixer un embrió d'estadística inferencial. Condorcet i Laplace encara parlaven de probabilitat allà on avui es parlaria de freqüència. Però és a Adolphe Quételet a qui es deu la idea que l'estadística és una ciència que es recolza en les probabilitats.

Al segle XIX aquesta activitat pren el seu desenvolupament ple. Es van promulgar regles precises sobre la recol·lecció i la interpretació de les dades. La primera aplicació industrial de les estadístiques va tenir lloc en el moment del padró americà de 1890, que va fer servir la targeta perforada inventada per l'estadístic Herman Hollerith. Aquest havia dipositat una patent a l' Oficina de patents dels Estats Units.

Al segle XX, aquestes aplicacions industrials es van desenvolupar en principi als Estats Units, que anaven avançats en ciències de gestió, i només després de la Primera guerra mundial a Europa. El règim nazi va fer servir mètodes estadístics a partir de 1934 per al rearmament.

A Catalunya, el Servei Central d'Estadística va ser creat per la Generalitat el 1934 i dirigit per Josep Anton Vandellós i Solà, catedràtic d'Estadística de la Universitat de Barcelona.[2]

L'adveniment de la informàtica en els anys 1940 (als Estats Units), i després a Europa (en els anys 1960) va permetre tractar més dades, però sobretot creuar sèries de dades de tipus diferents entre elles. És el desenvolupament del que s'anomena l' anàlisi multidimensional. En el transcurs del segle, apareixen diversos corrents de pensament enfrontats:

  • els objectivistes o freqüentistes que pensen que les probabilitats subministren un model que permet idealitzar la distribució en freqüència i que aquí s'acaba el seu paper;
  • els subjectivistes que veuen les probabilitats com un mitjà per mesurar la confiança que es pot tenir en una previsió;
  • els neobayesianistes que sostenen que les dades estadístiques soles no permeten donar el model probabilista idealitzant la distribució en freqüència: és necessari proposar una forma general del model per ajustar-hi el resultat.