presentación pública

Histogramas en su Proceso de Construcción e Interpretación

por | 27-02-2022 | Desarrollo de Métodos y Herramientas, Herramientas de la Calidad

Tiempo estimado de lectura:
9 minutos

Los histogramas son representaciones gráficas de datos en las que estos se agrupan en rangos de números continuos y cada rango corresponde a una barra vertical. Su construcción ayuda a comprender la tendencia central, dispersión y frecuencias relativas de los distintos valores.

En el contexto de la gestión de la calidad y la mejora de procesos, el histograma se revela como una herramienta aparentemente sencilla, pero sorprendentemente valiosa. La elaboración y análisis de estos gráficos estadísticos, descubre información crucial para entender y perfeccionar los procesos de trabajo. Este artículo se introduce en la importancia de la creación de histogramas, mostrando cómo esta técnica no solo simplifica datos complejos, sino que se convierte en un aliado esencial para impulsar la calidad en diversos ámbitos.

Los histogramas son especialmente útiles cuando se dispone de una amplia cantidad de datos que deben organizarse, para analizar más detalladamente o tomar decisiones. También son un medio eficaz para transmitir a otras personas información sobre un proceso de forma precisa e inteligible.

Por otra parte, una aplicación de sumo interés en el control de calidad es la comparación de los resultados de un proceso con sus especificaciones.

Así, mediante un histograma, se puede determinar en qué grado el proceso está produciendo buenos resultados y hasta qué punto existen desviaciones respecto a los límites fijados en las especificaciones. En este sentido, el estudio de la distribución de los datos puede ser un excelente inicio para establecer hipótesis acerca de un funcionamiento insatisfactorio.

Desarrollo de Histogramas

Naturalmente, asumimos que en la actualidad son muchas las aplicaciones informáticas que permiten construir histogramas con facilidad. No obstante, e conveniente repasar los fundamentos de la elaboración de esta herramienta gráfica capaz de mostrar distribuciones de frecuencias. De este modo, se pretende una comprensión de los fundamentos del histograma que facilite su análisis.

Se entiende, no obstante, que actualmente son numerosas las aplicaciones informáticas que permiten construir histogramas con facilidad. Si quieres consultar una introducción a los histogramas, puedes acceder a este artículo.

Los pasos para la elaboración de un histograma son los que se muestran en la figura siguiente:

histogramas: fases de elaboración
Pasos para la construcción de histogramas

1. Recopilar Datos

Una vez seleccionada la variable del proceso que se pretende estudiar, se recopilan los datos correspondientes, siendo aconsejable disponer de un número superior a 50 observaciones.

En el ejemplo que utilizaremos para mejorar la comprensión de esta herramienta, la variable a estudiar es: “tiempo (en días) en responder la solicitud de un ciudadano para participar en programas de Servicios Sociales Comunitarios”. En la siguiente tabla se han tomado 84 observaciones, pertenecientes a un periodo de 6 meses.

435650465084252730
53513567395019404519
41724143466351483739
30157844413247458248
80617031733546544730
21523931364167295355
22373044424762355757
44384558587355383260
58614746      
Tabla de datos. Unidad de medida: días hábiles

2. Determinar el Rango de Datos

En segundo lugar, se determina el rango de datos, lo que implica identificar los valores máximo y mínimo del conjunto de datos. También calcular la diferencia entre ambos valores.  Será este rango el que establecerá los límites del eje horizontal, o de abscisas, del histograma.

Ejemplo:

Valor máximo: L = 84

Valor mínimo: S = 15                   (L – S) = 69

3. Precisar el número de intervalos

Ahora, se define el número de intervalos que agruparán los datos en el eje de abscisas.

La tabla siguiente ayudará a determinar el número de intervalos (k) en función del número de datos disponibles. Al respecto, hay que precisar es muy común utilizar 10.

Número de Datos (N)Número de Intervalos de Clase (k)
50 – 996 –10
100 – 2507 – 12
> 25010 – 20

Para calcular la amplitud de los intervalos (h) basta con dividir el rango (L-S) entre el número de intervalos seleccionados, redondeando el resultado al entero superior.

 Ejemplo:

Seleccionado un número de intervalos k = 10

fórmula para calcular la amplitud de intervalos en histogramas

4. Definir los límites de los intervalos

Con el fin de evitar que los valores extremos de cada intervalo de clase creen confusión sobre a qué intervalo pertenecen se definen sus límites reales, que se especifican con una precisión de la unidad de medida más pequeña.

En primer lugar, se calcula el punto de inicio del primer intervalo, aplicando la expresión:

                                                               Punto de Inicio = Valor mínimo –  Unidad/2                                                


Ejemplo:        

15 – (1/2) = 14’5   Teniendo en cuenta que la unidad de medida utilizada es 1 (día).

Y a partir de aquí, se suma el valor de la amplitud de intervalo (h) para obtener los límites de los intervalos siguientes.

El ejemplo que sirve de guía utiliza una variable discreta que solo puede tomar valores enteros, por lo que no es necesario calcular los límites reales de los intervalos. Al respecto, se establece el criterio para fijar los intervalos del siguiente modo: “pertenecen a un intervalo determinado aquellos datos con un valor igual o mayor que el límite inferior del intervalo, o menor que el límite superior.

Recordemos que una variable discreta es aquella que solo puede tomar valores aislados dentro de un conjunto finito o infinito numerable. Por ejemplo, el número de hijos que tienen las familias en una ciudad determinada es una variable discreta, ya que solo puede tomar valores enteros no negativos.

A su vez, una variable continua es aquella que puede tomar cualquier valor dentro de un intervalo. Por ejemplo, la altura, el peso o la temperatura son variables continuas. Si lo expresamos en términos más técnicos: una variable continua es aquella que puede tomar un número infinito de valores posibles, con cualquier precisión.

5. Obtener las marcas de clase

La marca de clase es el punto medio de un intervalo en una distribución de datos agrupados, y se calcula sumando los límites inferior y superior de cada intervalo y dividiendo el resultado por 2, mediante la expresión:

Límite inferior + Límite superior/2

En nuestro ejemplo, y para el primer intervalo: (15+22) / 2 = 18,5

cálculo maca de clase
Marca de clase del primer intervalo

Los valores resultantes podrán entonces utilizarse para calcular medidas tanto de dispersión como de tendencia central de la tabla de frecuencias.

6. Construir la tabla de frecuencias

La tabla de frecuencias de un histograma es un resumen tabular que muestra la cantidad de veces que ocurren diferentes intervalos de valores en un conjunto de datos.

Para construirla, se registran los valores límite de los intervalos y sus marcas de clase. Igualmente, se computan los elementos pertenecientes a cada clase  anotándolos en la columna “chequeo”, y se contabiliza el total de observaciones para cada intervalo en la columna de frecuencias.

tabla de frecuencias - histograma
Tabla de Frecuencias

7. Dibujar el Histograma

Ya estamos en condiciones de graficar el histograma, que concentrará toda la información acumulada hasta ahora.

  • El eje de abscisas contiene los intervalos previamente calculados.
  • La escala vertical representa las frecuencias.
  • Se trazan barras verticales, partiendo de cada intervalo, con una altura equivalente a la de sus frecuencias.
Histograma

8. Interpretación

Un histograma facilita una representación visual en la que puede apreciarse si las medidas tienden a estar centradas o, por el contrario, tienden hacia la dispersión. También da respuesta a la cuestión de si el proceso produce buenos resultados y si éstos se encuentran dentro de los límites de las especificaciones.

Para el ejemplo de referencia, puede observarse que se ha trazado una línea adicional: límite de las especificaciones. De esta manera, la especificación[1] planteada fue que la respuesta se le diera al ciudadano en un plazo no superior a 60 días. Si observamos el histograma, apreciaremos que cierto número de observaciones, a la derecha de la línea y sombreadas, no han cumplido este objetivo.

Histograma con límite en las especificaciones

Un análisis más detenido nos llevaría a concluir que el proceso no posee la estabilidad deseable, ya que los histogramas que reflejan procesos estables son más elevados en el centro, declinando simétricamente hacia ambos lados, según una distribución normal.

Histograma y Curva Normal
Histograma y Curva Normal

Aquí no parece darse esta condición, existiendo una cierta asimetría provocada por los datos fuera de límite. Pero, aunque los datos fueran más estables, podemos colegir que parte de ellos rebasan la especificación.

Así, parece que en nuestro caso los esfuerzos deberían dirigirse hacia un doble objetivo:

  • Reducir la dispersión.
  • Conseguir desplazar el histograma hacia la izquierda, de manera que aún los datos extremos estuvieran dentro del límite especificado (el objetivo, en este caso).

Siguiendo con el ejemplo anterior, en el que el objetivo está referido al tiempo de ciclo del proceso[2], observemos lo siguientes histogramas.

Orientaciones para Interpretar Histogramas

Cuando combinamos el concepto de distribución normal, con los datos que provienen de un proceso de trabajo, los histogramas llegan a ser una herramienta efectiva y práctica para el análisis de los datos. Los histograma puede ser interpretado respondiendo a cuestiones como:

  • ¿El proceso se está desenvolviendo dentro de los límites de las especificaciones?
  • ¿Posee el proceso una alta variación?

Veamos ahora algunos ejemplos de histogramas y su interpretación.

Ejemplos con una especificación

Histograma con datos agrupados y excediendo el límite

En este histograma más de la mitad de los datos no cumplen el objetivo, superando el límite especificado.

Podemos apreciar cómo están agrupados, situándose en torno a un valor central, en una distribución normal.

Hay que actuar entonces reduciendo el tiempo de ciclo del proceso para disminuir el número de valores que exceden el objetivo.

Aquí, observamos datos agrupados y un proceso capaz.

La capacidad del proceso se refiere a la aptitud del proceso, cuando está estabilizado, para alcanzar un nivel dado de calidad.

 En este caso hay suficiente amplitud para la dispersión de los valores antes de llegar al límite especificado. A medida que el conjunto de valores esté más alejado del límite, el proceso será más capaz al cumplir mejor el objetivo de calidad.

Histogramas ejemplo 2
Histogramas ejemplo 3

Un buen número de datos alcanzan el objetivo, pero la dispersión es elevada.

Por tanto, además de reducir el tiempo de ciclo del proceso, hay que centrarse en reducir su variabilidad.

La figura A muestra el histograma de un proceso capaz ya que sus valores no rebasan el límite de la especificación.

Además, existe un amplio espacio para la dispersión de los datos. Por el contrario, el histograma de la figura B representa un proceso no capaz.

histogramas ejemplo 4

Casos para histogramas con dos especificaciones

En los histogramas siguientes podemos ver ejemplos para el caso de dos especificaciones (superior e inferior), entre las que han de situarse los datos.

Histogramas ejemplo 5

Histograma centrado y con los valores entre los límites de las especificaciones. 

El estado del proceso ha de mantenerse, reduciendo la dispersión.

En este otro proceso encontramos una alta variación, que abarca todo el espacio entre los límites.

Cualquier valor a la izquierda o a la derecha estaría fuera de los límites de las especificaciones.

Es necesario reducir la variación del proceso.

histograma ejemplo 6
histograma, ejemplo 7

En este otro proceso encontramos una alta variación, que abarca todo el espacio entre los límites.

Cualquier valor a la izquierda o a la derecha estaría fuera de los límites de las especificaciones.

Es necesario reducir la variación del proceso, reduciendo los casos que exceden las especificaciones.

Proceso con alta variación y descentrado.

Alguna causa asignable (no aleatoria) está afectando al proceso.

Así que es preciso situar el proceso en torno a un valor central, reduciendo al mismo tiempo la variación y los valores fuera de límites.

histograma, ejemplo 8
histograma: ejemplo 9

Finalmente, tenemos este proceso que si bien está centrado, se muestra poco capaz.  

Las acciones de mejora han de encaminarse a desplazar los resultados, de forma que se encuentren entre los valores de las especificaciones.


Notas

[1] En los hitogramas, las especificaciones pueden tener unos límites superior e inferior simultáneamente, si bien aquí nos referimos al caso en que existe sólo un límite. En la prestación de servicios es frecuente que haya una única especificación, respecto a una variable (tiempo de espera, plazo, número de errores, …).

[2] Tiempo de ciclo es el tiempo real transcurrido desde que se inicia una actividad, hasta que se comienza la siguiente. El tiempo de ciclo de un proceso sería, por tanto, el tiempo real que transcurre desde que el proceso se inicia hasta que llega a su fin.

Otros artículos que te pueden interesar: