Estadísticas Class: estadísticas descriptiva

jueves

Tipo de tablas

Tablas tipo I:

Cuando el tamaño de la muestra y el recorrido de la variable son pequeños, por ejemplo si tenemos una muestra de las edades de 5 personas, por lo que no hay que hacer nada especial simplemente anotarlas de manera ordenada en filas o columnas.

Edad de los 5 miembros de una familia:

5, 8, 16, 38, 45

Tablas tipo II:

Cuando el tamaño de la muestra es grande y el recorrido de la variable es pequeño, por lo que hay valores de la variable que se repiten. Por ejemplo, si preguntamos el número de personas activas que hay en 50 familias obtenemos la siguiente tabla:

Personas Activas en 50 familias

2	1	2	2	1	2	4	2	1	1
2	3	2	1	1	1	3	4	2	2
2	2	1	2	1	1	1	3	2	2
3	2	3	1	2	4	2	1	4	1
1	3	4	3	2	2	2	1	3	3

Podemos observar que la variable toma valores comprendidos entre 1 y 4, por lo que precisaremos una tabla en la que resumamos estos datos quedando la siguiente tabla:

Personas Activas	Número de Familias
1	16
2	20
3	9
4	5
Total	50

Tablas tipo III:

Cuando el tamaño de la muestra y el recorrido de la variable son grandes, por lo que será necesario agrupar en intervalos los valores de la variable. Por ejemplo si a un grupo de 30 alumnos les preguntamos el dinero que en ese momento llevan encima, nos encontramos con los siguientes datos:

Evidentemente, la variable estadística tiene un recorrido muy grande, 4998 pesetas, por lo que sí queremos hacer una tabla con estos datos tendremos que tomar intervalos. Para decidir la amplitud de los intervalos, necesitaremos decidir ¿cuántos intervalos queremos?. Normalmente se suele trabajar con no más de 10 o 12 intervalos.

Amplitud =4998/10 = 499,8 Por lo que tomaremos intervalos de amplitud 500

Debemos tener en cuenta las siguientes consideraciones:

Tomar pocos intervalos implica que la "pérdida de información" sea mayor.

Los intervalos serán siempre Cerrados por la izquierda y Abiertos por la Derecha

[ L_i-1 , L_i )

Procuraremos que en la decisión de intervalos los valores observados no coincidan con los valores de los extremos del intervalo y si esto ocurre que no sea en más de un 5% del total de observaciones.

Con estas recomendaciones tendremos la siguiente tabla:

[ L_i-1 , L_i)	Frecuencia
[ 0,500)	16
[ 500, 1000)	6
[ 1000,1500)	3
[ 1500, 2000)	2
[ 2000, 2500)	1
[ 2500, 3000)	1
[ 3000, 3500)	0
[ 3500, 4000)	0
[ 4000, 4500)	0
[ 4500, 5000)	0
[ 5000,5500)	1

• Otra forma de calcular la cantidad de intervalos es aplicando los siguientes metodos:

Método Sturges: k = 1 + 3,332 log n

donde:

k= número de clases

n= tamaño muestral

martes

Conceptos estadísticos

Variable: Característica que puede presentar distintas modalidades. Por ejemplo, la variable "género" solo presenta dos modalidades (mujer y hombre), y la variable "depresión" presenta un número infinito de modalidades, (las magnitudes de gravedad con que puede afectar a las personas).

Constante: Característica que presenta una sola modalidad

Datos: Son números que representan las modalidades de las variables. Por ejemplo, el 1 puede representar la modalidad "Mujer", el 6.3 representa una de las magnitudes que podemos registrar en la variable "grado de conocimiento de las técnicas estadísticas". Los datos pueden ser clasificados según diferentes criterios, uno de los cuales se basa en las modalidades que presentan: Se dirá que son datos dicotómicos los que provienen de variables que solo admiten dos modalidades (por ejemplo la variable "género"), son datos dicotomizados aquellos que presentan dos categorías pero provienen de variables con más de dos modalidades (por ejemplo datos con valores 1 y 0 que representan aprobado y suspenso).

Población: Conjunto completo de indivíduos, objetos o fenómenos.

Muestra: Subconjunto de la población.

Muestreo: Procedimiento de selección de las muestras.

Representatividad de la muestra: Las muestras son partes de la población, pero no son la población completa. Por ello, sus características no suelen coincidir con las de la población. La medida en que la muestra aproxima a la población se denomina representatividad.

Sesgo: Es la discrepancia entre las características de las muestras y las de la población.

Análisis univariado: Analiza una sola variable. Es más sencillo, más fácil de entender y de interpretar. En cambio, la sencillez puede comportar una simplificación excesiva de la realidad. Por ejemplo, un investigador quiere hacer un estudio del rendimiento académico universitario, para lo cual recoge las calificaciones de los estudiantes en los exámenes finales. Es claro que una caracterización del rendimiento basada exclusivamente en las calificaciones académicas es incompleta y que, si queremos conocer los condicionantes del rendimiento deberíamos incluir otros variables (como actitud, preparación previa, etc.) y estudiar cómo interactúan para dar cuenta de las variables de interés.

Análisis multivariado: Analiza los datos teniendo en cuenta las relaciones entre las variables. Es más complejo y de comprensión más dificultosa, pero proporciona información más completa del objeto estudiado.

Estadísticas Class

Páginas

jueves

Tipo de tablas

martes

Conceptos estadísticos

Tienes dudas?