domingo, 5 de junio de 2016

EN ESTADÍSTICA: TABULACIÓN Y DISTRIBUCIÓN DE FRECUENCIA, HISTOGRAMA Y POLÍGONO DE FRECUENCIA

TABULACIÓN

La tabulación de los datos consiste en el recuento de las respuestas contenidas en los instrumentos, a través del conteo de los códigos numéricos de las alternativas de las preguntas cerradas y de los códigos asignados a las respuestas de las preguntas abiertas, con la finalidad de generar resultados que se muestran en cuadros (o tablas) y en gráficos.

La tabulación puede ser tratada de forma manual o mecánica:

ü  Tabulación Manual: es recomendada cuando el tamaño de la muestra es muy pequeño, sin embargo, la descripción del proceso de este tipo de tabulación, ayudaría a evitar posibles errores en la presentación de los resultados al procesar los datos a través de una tabulación electrónica.

ü  Tabulación Electrónica: cuando los datos por tabular sean un número relativamente grande es recomendable acudir al procesamiento electrónico de datos, a través de Excel o de paquetes de computación que facilitan la realización de cuadros o tablas estadísticas.

DISTRIBUCIÓN DE FRECUENCIAS

Una distribución de frecuencia o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.

Tipos de Frecuencias:

ü  Frecuencia Absoluta

La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio estadístico.

Se representa por:

La suma de las frecuencias absolutas es igual al número total de datos, que se representa por:

Para indicar resumidamente estas sumas se utiliza la letra griega (sigma mayúscula) que se lee suma o sumatoria.


ü  Frecuencia Relativa


La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos.

Se puede expresar en tantos por ciento y se representa por:


La suma de las frecuencias relativas es igual a 1.

ü  Frecuencia Acumulada

La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado.

Se representa por:

ü  Frecuencia Relativa Acumulada

La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento.

Ej.: Durante el mes de Febrero, en una determinada ciudad se han registrado las siguientes temperaturas máximas:

32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.

A continuación se muestra la construcción de una Tabla de Frecuencia:
En la primera columna de la tabla se coloca la variable ordenada de menor a mayor, en la segunda se hace el recuento y en la tercera se anota la frecuencia absoluta.


Este tipo de tablas de frecuencias se utiliza con variables discretas.

DISTRIBUCIÓN DE FRECUENCIAS AGRUPADAS

La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un número grande de valores o la variable es continua.

Se agrupan los valores en intervalos que tengan la misma amplitud  denominados clases. A cada clase se le asigna su frecuencia correspondiente.

Límites de la clase:
Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase.

Amplitud de la clase:
La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase.

Marca de clase:
La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el cálculo de algunos parámetros.

Ej.: Construcción de una Tabla de Datos Agrupados

3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.

Primero, se localizan los valores menor y mayor de la distribución. En este caso son 3 y 48.
Segundo, se restan y se busca un número entero un poco mayor que la diferencia y que sea divisible por el número de intervalos de queramos poner.
Es conveniente que el número de intervalos oscile entre 6 y 15.
En este caso, 48 - 3 = 45, incrementamos el número hasta 50: 5 = 10 intervalos.
Se forman los intervalos teniendo presente que el límite inferior de una clase pertenece al intervalo, pero el límite superior no pertenece al intervalo, se cuenta en el siguiente intervalo.


HISTOGRAMA

Es una herramienta útil para resumir y analizar datos. Por su naturaleza gráfica, puede ayudar a identificar e interpretar pautas que son difíciles de ver en simples tablas de números. También es una representación gráfica utilizada para visualizar y analizar la frecuencia con que una variable toma diferentes valores dentro de un conjunto de datos.

La representación gráfica contiene:

a) Su base sobre el eje horizontal (eje X) con centro en la marca de clase y longitud de igual tamaño de los intervalos de clase


b) Superficies proporcionales a las frecuencias.


Ej.:

POLÍGONO DE FRECUENCIA

Se forma uniendo los extremos de las barras de un diagrama de barras mediante segmentos. También se puede realizar trazando los puntos que representan las frecuencias y uniéndolos mediante segmentos.

Ej.: Las temperaturas en un día de otoño de una ciudad han sufrido las siguientes variaciones: Hora Temperatura 6 7º 9 12° 12 14° 15 11° 18 12° 21 10° 24 8°


DIFERENCIA ENTRE LAS ESPECIFICACIONES TÉCNICAS DE UNA TABULACIÓN Y GRAFICACIÓN ESTADÍSTICA

La presentación de datos estadísticos constituye en sus diferentes modalidades uno de los aspectos de más uso en la estadística descriptiva. A partir de ellos podemos visualizar, a través de los diferentes medios, gráficos o tabulares, la presentación de los datos estadísticos.

Presentación Gráfica: esta forma de presentación de información crea pautas que son difíciles de ver en simples tablas de números, y es utilizada para visualizar y analizar la frecuencia con que una variable toma diferentes valores dentro de un conjunto de datos.

Tipos de gráficos Estadísticos:

  ü  Barras
  ü   Líneas
  ü  Circulares
  ü  Áreas
  ü  Cartogramas
  ü  Mixtos
  ü  Histogramas
  ü  Dispersión
  ü  Pictogramas
  ü  Ojivas.


Gráficos de Barras

Se utiliza para representar valores utilizando trazos verticales, u horizontales. Se pueden representar dos o más series para comparar entre sí.


Gráficos de Líneas

Este tipo de gráfico se utiliza para mostrar tendencias en el tiempo. Se representan los valores en dos ejes cartesianos.




Gráficos de Áreas


Este nos permite establecer diferencia de valores en diferentes periodos de tiempo.



Gráficos Circulares

Este tipo de gráfico nos dejar ver claramente la cantidad que representa cada valor en un hecho.


Gráficos de Cartogramas

Este tipo de gráficas nos permite evidenciar datos sobre una superficie geográfica.



Gráficos Mixtos

En esta clase de gráficos se utilizan varios tipos de gráficos, para distinguir las diferencias entre las series.



Gráficos de Dispersión

Estos gráficos nos dejan evidenciar, la relación entre los valores numéricos de varios datos.




Gráficos de Pictogramas
Es un gráfico que utiliza una figura alusiva al tema para representar la frecuencia.



Gráficos de Ojivas

Es un gráfico que se vincula a los histogramas, ya que usa la información de la tabla de frecuencia (frecuencia acumulada) para hacer estimaciones y generar respuestas. Asimismo permite comparar varios conjuntos de datos. Y por sus características, se construye ubicando las frecuencias relativas acumuladas sobre los límites superiores de cada clase, en lugar de la marca de clase.



Presentación Tabular: es cuando los datos estadísticos se presentan a través de un conjunto de filas y de columnas que responden a un ordenamiento lógico; es de gran importancia ya que constituye la forma más exacta de presentar las informaciones. Una tabla consta de varias partes, las principales son las siguientes:

ü  Título: Es la parte más importante del cuadro y sirve para describir todo el contenido de este.

ü  Encabezados: Son los diferentes subtítulos que se colocan en la parte superior de cada columna.

ü  Columna matriz: Es la columna principal del cuadro.

ü  Cuerpo: El cuerpo contiene todas las informaciones numéricas que aparecen en la tabla.

ü  Fuente: La fuente de los datos contenidos en la tabla indica la procedencia de estos.

ü Notas al pie: Son usadas para hacer algunas aclaraciones sobre aspectos que aparecen en la tabla o cuadro y que no han sido explicados en otras partes.

Ej.:


SELECCIÓN DEL MÉTODO ESTADÍSTICO MÁS IDÓNEO PARA EL TRATAMIENTO DE LOS DATOS

Los estudios estadísticos permiten a los analistas estimar parámetros clave, como por ejemplo los modelos de costos o producción. Por tanto, los análisis estadísticos requieren de un importante grupo de datos para asegurar la obtención de resultados confiables. A menudo, la obtención de la cantidad de observaciones necesarias para derivar en una estimación eficiente y objetiva de las estructuras de costos (o producción) puede resultar ser una tarea difícil. Los resultados de las estimaciones son sensibles a la especificación del modelo (por ejemplo, una forma funcional lineal vs. una forma funcional no lineal). Asimismo, para algunos modelos, la interpretación del término de error se vuelve importante.

Entonces, para establecer una ley física, biológica o social, el estadístico debe comenzar con un conjunto de datos y modificarlo basándose en la experiencia. Por ejemplo, en los primeros estudios sobre crecimiento de la población, los cambios en el número de habitantes se predecían calculando la diferencia entre el número de nacimientos y el de fallecimientos en un determinado lapso. Los expertos en estudios de población comprobaron que la tasa de crecimiento depende sólo del número de nacimientos, sin que el número de defunciones tenga importancia. Por tanto, el futuro crecimiento de la población se empezó a calcular basándose en el número anual de nacimientos por cada 1.000 habitantes. Sin embargo, pronto se dieron cuenta que las predicciones obtenidas utilizando este método no daban resultados correctos. Los estadísticos comprobaron que hay otros factores que limitan el crecimiento de la población. Dado que el número de posibles nacimientos depende del número de mujeres, y no del total de la población, y dado que las mujeres sólo tienen hijos durante parte de su vida, el dato más importante que se ha de utilizar para predecir la población es el número de niños nacidos vivos por cada 1.000 mujeres en edad de procrear. El valor obtenido utilizando este dato mejora al combinarlo con el dato del porcentaje de mujeres sin descendencia. Por tanto, la diferencia entre nacimientos y fallecimientos sólo es útil para indicar el crecimiento de población en un determinado periodo de tiempo del pasado, el número de nacimientos por cada 1.000 habitantes sólo expresa la tasa de crecimiento en el mismo periodo, y sólo el número de nacimientos por cada 1.000 mujeres en edad de procrear sirve para predecir el número de habitantes en el futuro.

3 comentarios:

  1. esta gono*hp*triple*doble*hijueputa esta MAL el profesor dijo esa pagina esta mal.....................................................................................

    ResponderEliminar