miércoles, 4 de junio de 2008

DIAGRAMA DE CAJAS

Presentación visual que describe al mismo tiempo varias características importantes de un conjunto de datos, tales como el centro, la dispersión, el alejamiento de la simetría, y la identificación de valores extremos (puntos atípicos), es decir, de valores que se alejan de una manera poco usual del resto de los datos.


Presenta los tres cuartiles, (y los valores mínimos y máximos) alineados sobre una caja vertical u horizontalmente...
Procedimiento
Para el diagrama de cajas y bigotes se requiere


1.Calcular la mediana y los otros dos cuartiles, con los cuales se formará la caja, que tiene la mediana como eje central, y como lados los dos cuartiles. Estos cuartiles reciben también los nombres de " bisagras". La altura (anchura) de la caja no interesa.
2. La distancia H definida como la distancia entre el cuartil superior y el cuartil inferior, es decir, corresponde al rango intecuartílico Þ H = Q3 - Q1 = RIC.

3. El paso correspondiente a 1.5 veces la distancia Þ Paso = 1.5 H
4. Cercas Internas, ubicadas a un paso de las bisagras o de los respectivos cuartiles. Así, las Cercas Internas Inferior (CIi) y Superior (CIs) estarán dadas por:CIi = Q1 - PasoCIs = Q3 +Paso

Si la cerca interna inferior da menor que el valor mínimo de la muestra, ésta se hace igual al valor mínimo; igualmente, si la cerca interna superior da mayor que el valor máximo, ésta se hace igual a dicho valor.
5. Cercas Externas, ubicadas a un paso de las cercas internas. Así, las Cercas Externas Inferior (CEi) y Superior (CEs) estarán dadas por:CEi = CIi - PasoCEs = CIs + Paso.

6. Se denominan "valores adyacentes" los ubicados entre las cercas internas y los bordes de las cajas. Por simplicidad no se grafican.

7. "Valores extremos" son los ubicados entre las dos cercas, y merecen especial atención, ya que pueden ser valores atípicos, que, en algunos casos, no pertenecen realmente a la distribución general de donde provienen los datos.


8. "Valores lejanos" o , ubicados por fuera de las cercas externas, correspondientes a valores extremos, que requieren un mayor análisis que los valores atípicos.


Considere los siguientes datos, correspondientes a




De este conjunto de datos tenemos que:
Me = 90.45
Q1 = 88.25
Q3 = 92.2
Rango intercuartílico = RIC = 92.2-88.25 = 3.95 Þ Paso = 5.925
Cercas interna inferior = 88.25 - 5.925 = 82.325
Cerca interna superior = 92.20 + 5.925 = 98.125
Cerca externa inferior = 82.325 - 5.925 = 76.40Cerca externa superior = 98.125 + 5.925 =
104.05



Como se observa hay dos valores que merecen especial atención: 98.8 y 100.3 que están entre las cercas interna y externa superior.
COMENTARIOS
El diagrama de cajas en una de las formas de como podemos vizualizar un grupo de datos a resolver, el cual lo que nosotros realizamos una serie de pasos para poder obtener el resultado que nosostros queremos...
Cuando realizamos las operaiones nos damos cuenta de como los datos estas dispersos...

AREA BAJO LA CURVA

Es en forma de campana, es una curva que tiene un solo pico la curva se divide por la media en dos partes iguales y cuando la curva se esta graficando las dos colas extremas de la curva no tiene que tocar la linea horizontal, la distribucion normal esta determinado completamente con la media y la desviacion estandar.


VALORES ESTANDARIZADOS
A este valor z se le resta la media por lo que despues se divide con la desviacion estandar, el valor estandarizado tiene dos lados un negativo y uno positivo, el negativo es cuando esta por ebajo de la media y el positivo es el que se encuentra por ensima de la media, la variable x se tiene que comvertir en la variable z la cual es la variqable que se usa para desviacion normal estandar.
f(x)= x2 + 1

la distribucion de porcentajes se se representa con una curva se distribuye en 2.15%, 13.59%, 34.13%, que se encuentran en los ambos lados de la curva o sea en el lado derecho e izquierdo, el lado derecho es el lado positivo y el lado izquierdo el negativo y a esos ambos lados los separa la media.

en el intervalo cerrado [1,5]



COMENTARIO- area bajo la curva es una de las forma de poder ver de como estan dispersos los datos de una distribucion siendo de esta manera, podemos verificar cuales son los datos que se encuentran a la par de la media...