55 Estadísticas
55 Estadísticas
La estadística es una ciencia matemática
especializada en el análisis de grandes volúmenes de información para de ella
extraer conclusiones. Tras analizar los datos deduce determinadas
características de dicha información.
Se puede distinguir entre:
Estadística descriptiva: analiza un conjunto de datos y extrae conclusiones.
Ejemplo: se analiza la estatura y el
peso de los alumnos de una clase y se determina cual es el valor medio, cuales
son los máximos y los mínimos, cual son los valores más repetidos.
Estadística inferencia: en base a un conjunto de datos permite predecir cómo se puede comportar
la variable en un futuro, o bajo determinadas circunstancias.
Ejemplo: se analiza una serie de
variables económicas (consumo, renta, paro, etc.) y a partir de ahí se predice
cual puede ser la evolución futura de la economía.
En un estudio estadístico distinguimos:
a) Población: representa todo el conjunto de elementos que posee la información que
vamos a analizar.
Por ejemplo: si vamos a analizar la
estatura media de los españoles la población sería todos los ciudadanos
españoles.
b) Muestra: del total de la población se selecciona un grupo representativo que es el
que vamos a estudiar.
Por ejemplo: para analizar la estatura
media de los españoles no podemos recoger esta información de los 44 millones
de ciudadanos españoles sino que tenemos que definir un grupo de estudio, por
ejemplo seleccionar a 2.000 personas. Este grupo tiene que ser representativo
de la sociedad española por lo que tiene que incluir a hombres y a mujeres,
gente de la ciudad y del campo, gente de diversos niveles de renta, de diversas
edades. Es decir, la muestra tiene que ser como una imagen “en miniatura” de la
población.
No podríamos seleccionar estas 2.000
personas exclusivamente del entorno urbano y de niveles elevados de renta ya
que muy probablemente su estatura sea superior a la de la media de los
españoles, y por lo tanto las conclusiones que obtengamos no sean aplicables a
la población española en su conjunto.
c) Individuo: cada elemento de la muestra. En este ejemplo cada ciudadano del grupo de
2.000 que hemos seleccionado.
d) Variable estadística: es la información que vamos a analizar. En nuestro ejemplo, la estatura
media.
Se pueden analizar varias variables: por ejemplo podríamos analizar la estatura (1ª variable) distinguiendo
por sexo (2ª variable) y por edades (3ª variable).
Las variables pueden ser:
Cualitativas: características que no se pueden representar numéricamente. Por ejemplo,
sexo.
Cuantitativas: características que sí se pueden representar numéricamente. Por ejemplo,
altura y edad.
Estas variables numéricas a veces pueden
tomar valores muy concretos (por ejemplo, número de años en el colegio: de 1 a
15), en cuyo caso se denominan variables cuantitativas discretas, y
otras veces pueden tomar un número casi ilimitado de valores (por ejemplo,
estatura; 1,41, 1,42, ... 1,54, 1,55, … 1,81, 1,82, ….) en cuyo caso se
denominan variables cuantitativas continuas.
Para hacer más manejable la
información, las variables cuantitativas continuas se suelen agrupar
por intervalos: por ejemplo estatura de 1,40 a 1,45, de 1,46 a 1,50, de
1,55 a 1,60, …. De esta manera reducimos los grupos de respuesta.
Cuando agrupamos la información por
intervalos podemos denominarlos indicando el valor inferior y superior de cada
intervalo (por ejemplo, intervalo del 1,40 al 1,45), o también podemos
denominarlo indicando el valor central de cada intervalo (por ejemplo el
intervalo 1,40 al 1,45 lo identificaríamos por 1,425). A este valor
representativo de cada intervalo se denomina “marca de clase”.
e) Modalidad: son los valores que pueden tomar las variables.
Sexo: puede ser masculino o femenino
Edad: 18 años, 19 años, 20 años hasta,
80, 90, … (si limitamos nuestro estudio a la población adulta)
Altura: ... 1,40 m, 1,41 m… , 1,60 m,
1,61 m... 2,10 m…
Estudio estadístico
Una vez definida las variables que vamos a
estudiar y la muestra que vamos a analizar, hay que comenzar por obtener
información (preguntamos a las 2.000 personas de la muestra su
estatura, su edad y su sexo).
Dato estadístico es cada una de las informaciones obtenidas:
Joaquín P.: hombre, 47 años, 1,77 m
María C.: mujer, 33 años, 1,68 m
Los datos obtenidos en la observación hay
que ordenarlos y recogerlos en una tabla que se denomina tabla
estadística.
El número de observaciones realizadas se
denomina “tamaño de la muestra”.
En nuestro ejemplo, el tamaño de la
muestra es de 2.000 observaciones.
La frecuencia absoluta de
un dato es el número de veces que aparece ese dato en las observaciones y
la frecuencia relativa es el porcentaje que representa la
frecuencia absoluta respecto del total.
Por ejemplo: el rango de estaturas 1,40
- 1,45 m figura 34 veces en las 2.000 observaciones:
Frecuencia absoluta: 34
Frecuencia relativa: 34 / 2.000 = 1,7%
Para resumir la información obtenida de la
muestra se utilizan una serie de parámetros que se denominan medidas de
centralización.
1.- La media aritmética representa el valor medio que toman los datos de una observación
estadística. Se calcula sumando todos los resultados y dividiendo la suma entre
el número de registros. La media aritmética tan sólo se puede calcular con
datos numéricos (no se puede calcular con datos cualitativos).
Por ejemplo, en nuestro ejemplo
sumaríamos las 2.000 estaturas obtenidas y la suma la dividiríamos entre 2.000.
Media = suma de estaturas / 2.000 =
3.341,55 / 2000 = 1,671 m
2.- Moda: es el
resultado más repetido en una observación estadística (se puede calcular con
datos numéricos y cualitativos).
Vemos que en este ejemplo el rango de
valores más repetido es 1,65 – 1,70, con 372 resultados. Este rango sería la
moda de la muestra.
3.- Mediana: es el valor que toma la variable de manera que al ordenarla de menor a
mayor quedaría justo en el centro, siendo el 50% de los registros menores que
ella y el otro 50% superiores a ella.
En nuestro ejemplo ordenaríamos las
2.000 estaturas de menor a mayor y buscaríamos la que ocupase la posición 1.000
(por ejemplo 1,68), de manera que la mitad de los resultados serían inferiores
y la otra mitad superiores.
Las frecuencias absolutas o relativas se
pueden representar sobre una gráfica de barras. Cada barra
representa un valor de la variable. La altura de cada barra representa el valor
de la frecuencia.
En este gráfico hemos representado la
frecuencia absoluta.
También se puede utilizar el diagrama
de sectores para representar las frecuencias (absolutas o relativas).
Se utiliza un círculo dividido en sectores; cada sector representa un valor de
la variable; la superficie del sector mide la frecuencia (absoluta o relativa).
Comentarios
Publicar un comentario