jueves, 19 de junio de 2008

SERIES DE TIEMPO

Una serie temporal o cronologica es un conjunto e observaciones de una variable, ordenadas segu transcurre el tiempo.
En una serie de tiempo las observaciones no se deben ordenar de mayor a menor debidoa que se perderia el grueso de la informacion debido a que nos intersea detectar como se mueve la variable en el tiempo es muy importante respetar la secuencia temporal de las observaciones.
Para realizar la reprsenyacion de una serie ytemporal se debe realizae mediante una gráfica de disprsión x-y como se muestra en la fig.1






CLASES DE VARIACIONES
La tendencia es un movimiento que puede ser estacionario o ascendente o descendete como se indica en la fig.





Tendencias ascendente, estacionaria y descendentE...
Variaciones estacionales.
Se habla de este tipo de variaciones usualmente cuando el comportamiento de la variable en el tiempo ennun periodo esta relacionado con la época o un periodo particular, por lo general en el espacio cronologico presente...











Variaciones ciclicas
Se llama asi a las ocilaciones a lo largo de una tendencia con uneriodo superiro al año. El ciclo sugiere la idea de que este tipo de movimiento se repite cada cirto periosodo con caracterisitica parecidas. Los ejemplos mas frecuentes se encuentran en le campo de las variables economicas, en esto ca casos se deben principalmente a la alternancia de las etapas de prosperidad y depresioin en la actividad economica.








Variaciones residuales
Cuando a parecen hechos imprevistos, repentinos que afecten las variables en estudio acotamndo que no podemos preveer nos hallamos frenta a variaciones residuales provocadas poe r factore extermis a leatorios.
Por ejemplo un dia lluvioso y frio durante el veranos es dificil de predecir y aunque perturbaria cuertas acrividades diarias como la venta de helasod no afectaria en este caso significativamente la serie.
TENDENCIA SECULAR
Las tendencias a largo plazo (sin alteraciones de una serie de tiempo) de las ventas, el empleo, los precios de las acciones, y otras series económicas y comerciales .
Muchas variables macroeconómicas, como el Producto Nacional Bruto (PNB), el empleo y la producción industrial están dominadas por una fuerte tendencia.
La tendencia de una serie de tiempo es el componente de largo plazo que representa el crecimiento o disminución en la serie sobre un periodo amplio. Las fuerzas básicas que ayudan a explicar la tendencia de una serie son el crecimiento de la población, la inflación de precios, el cambio tecnológico y los incrementos en la productividad.


VARIACIÓN IRREGULAR
El componente aleatorio mide la variabilidad de las series de tiempo después de que se retiran los otros componentes. Contabiliza la variabilidad aleatoria en una serie de tiempo ocasionada por factores imprevistos y no ocurrentes. La mayoría de los componentes irregulares se conforman de variabilidad aleatoria. Sin embargo ciertos sucesos a veces impredecibles como huelgas, cambios de clima (sequías, inundaciones o terremotos), elecciones, conflictos armados o la aprobación de asuntos legislativos, pueden causar irregularidad en una variable.



COMENTARIO:
Una serie de tiempo es una gama de informacion que podemos estudiar mediante un determinado tiempo... uno de las formas par determinar que clases de cgrafica hay que construir se necesita de datos... endotses decimos que las sereis de tiempo es un medio para poder ver graficamente un fenomeno de como esta evolucionando deurante en el tiempo... un ejemplo clasro para esto podriamos decir que la gasolina porque nos podemos dar cuenta de como va ascendiendo encuanto al tiempo....
Para poder graficar un problema tenemos que saber que es lo que queremos alcanzar y as por medio de ella podemos visualizar que tando un problema esta evolucionando, esto depende de que clase de investigacion o que clases de informaciion queres obtener.

miércoles, 11 de junio de 2008

CORRELACION

En probabilidad y estadística, la correlación indica la fuerza y la dirección de una relación lineal entre dos variables aleatorias. Se considera que dos variables cuantitativas están correlacionadas cuando los valores de una de ellas varían sistemáticamente con respecto a los valores homónimos de la otra: si tenemos dos variables (A y B) existe correlación si al aumentar los valores de A lo hacen también los de B y viceversa. La correlación entre dos variables no implica, por sí misma, ninguna relación de causalidad. Se define la covarianza como la variación que existe entre los datos de dos variables.
Fuerza, sentido y forma de la correlación.
La relación entre dos variables cuantitativas queda representada mediante la línea de mejor ajuste, trazada a partir de la nube de puntos. Los principales componentes elementales de una línea de ajuste y, por lo tanto, de una correlación, son la fuerza, el sentido y la forma:
.La fuerza mide el grado en que la línea representa a la nube de puntos: si la nube es estrecha y alargada, se representa por una línea recta, lo que indica que la relación es fuerte; si la nube de puntos tiene una tendencia elíptica o circular, la relación es débil.
.El sentido mide la variación de los valores de B con respecto a A: si al crecer los valores de A lo hacen los de B, la relación es positiva; si al crecer los valores de A disminuyen los de B, la relación es negativa.
.La forma establece el tipo de línea que define el mejor ajuste: la línea recta, la curva monotónica o la curva no monotónica.
Análisis de Correlación .- Es el conjunto de técnicas estadísticas empleado para medir la intensidad de la asociación entre dos variables.El principal objetivo del análisis de correlación consiste en determinar que tan intensa es la relación entre dos variables. Normalmente, el primer paso es mostrar los datos en un diagrama de dispersión.
Diagrama de Dispersión.- es aquel grafico que representa la relación entre dos variables.
Variable Dependiente.- es la variable que se predice o calcula. Cuya representación es "Y"
Variable Independiente.- es la variable que proporciona las bases para el calculo. Cuya representación es: X1,X2,X3.......
Coeficiente de Correlación.- Describe la intensidad de la relación entre dos conjuntos de variables de nivel de intervalo. Es la medida de la intensidad de la relación lineal entre dos variables.El valor del coeficiente de correlación puede tomar valores desde menos uno hasta uno, indicando que mientras más cercano a uno sea el valor del coeficiente de correlación, en cualquier dirección, más fuerte será la asociación lineal entre las dos variables. Mientras más cercano a cero sea el coeficiente de correlación indicará que más débil es la asociación entre ambas variables. Si es igual a cero se concluirá que no existe relación lineal alguna entre ambas variables.
Análisis de regresión.- Es la técnica empleada para desarrollar la ecuación y dar las estimaciones.Ecuación de Regresión.- es una ecuación que define la relación lineal entre dos variables.
Ecuación de regresión Lineal: Y’ = a + BxEcuación de regresión Lineal Múltiple: Y’ = a + b1X1 + b2X2 + b3X3...
Principio de Mínimos Cuadrados.- Es la técnica empleada para obtener la ecuación de regresión, minimizando la suma de los cuadrados de las distancias verticales entre los valores verdaderos de "Y" y los valores pronosticados "Y".
Análisis de regresión y Correlación Múltiple.- consiste en estimar una variable dependiente, utilizando dos o más variables independientes.
Ecuación de regresión Múltiple.- La forma general de la ecuación de regresión múltiple con dos variables independientes es: Y' = a + b1X1 + b2X2
X1,X2 : Variables Independientes
a : es la ordenada del punto de intersección con el eje Y.b1 : Coeficiente de Regresión (es la variación neta en Y por cada unidad de
variación en X1.).b2 : Coeficiente de Regresión (es el cambio neto en Y para cada cambio
unitario en X2).
COMENTARIO.
esta relación utiliza una representación gráfica llamada diagrama de dispersión, para estimar el valor de una variable basándonos en el valor de otra, en lo que llamaremos análisis de regresión. y, finalmente Desarrollando ejercicio aplicando lo aprendido, donde se utiliza datos verdaderos de una empresa de servicios turisticos.

jueves, 5 de junio de 2008

REGRESION LINEAL

En estadística la regresión lineal o ajuste lineal es un método matemático que modeliza la relación entre una variable dependiente Y, las variables independientes Xi y un término aleatorio ε. Este modelo puede ser expresado como:



Donde β0 es la intersección o término "constante", las βi son los parámetros respectivos a cada variable independiente, y p es el número de parámetros independientes a tener en cuenta en la regresión. La regresión lineal puede ser contrastada con la regresión no lineal.

El modelo de regresión lineal
1. El modelo lineal relaciona la variable dependiente Y con K variables explicativas Xk (k = 1,...K), o cualquier transformación de éstas, que generan un hiperplano de parámetros βk desconocidos:


2. donde es la perturbación aleatoria que recoge todos aquellos factores de la realidad no controlables u observables y que por tanto se asocian con el azar, y es la que confiere al modelo su carácter estocástico. En el caso más sencillo de dos variables explicativas, el hiperplano es una recta:


3. El problema de la regresión consiste en elegir unos valores determinados para los parámetros desconocidos βk, de modo que la ecuación quede completamente especificada. Para ello se necesita un conjunto de observaciones. En una observación cualquiera i-ésima (i= 1,... I) se registra el comportamiento simultáneo de la variable dependiente y las variables explicativas (las perturbaciones aleatorias se suponen no observables).

4. Los valores escogidos como estimadores de los parámetros, , son los coeficientes de regresión, sin que se pueda garantizar que coinciden con parámetros reales del proceso generador. Por tanto, en:




Ejemplo de una regresión lineal con una variable dependiente y una variable independiente.
COMENTARIO.
Es la relacion que hay entre dos pendientes: X,Y, el cual se tedermina cual es la relacion trazando una linea recta, atravezando los puntos que relaciiona las dos pendientes... visualizando cual es la diferencia o que tanto seguro podamos estar y determinamos la relacion travez de una grafica...

miércoles, 4 de junio de 2008

DIAGRAMA DE CAJAS

Presentación visual que describe al mismo tiempo varias características importantes de un conjunto de datos, tales como el centro, la dispersión, el alejamiento de la simetría, y la identificación de valores extremos (puntos atípicos), es decir, de valores que se alejan de una manera poco usual del resto de los datos.


Presenta los tres cuartiles, (y los valores mínimos y máximos) alineados sobre una caja vertical u horizontalmente...
Procedimiento
Para el diagrama de cajas y bigotes se requiere


1.Calcular la mediana y los otros dos cuartiles, con los cuales se formará la caja, que tiene la mediana como eje central, y como lados los dos cuartiles. Estos cuartiles reciben también los nombres de " bisagras". La altura (anchura) de la caja no interesa.
2. La distancia H definida como la distancia entre el cuartil superior y el cuartil inferior, es decir, corresponde al rango intecuartílico Þ H = Q3 - Q1 = RIC.

3. El paso correspondiente a 1.5 veces la distancia Þ Paso = 1.5 H
4. Cercas Internas, ubicadas a un paso de las bisagras o de los respectivos cuartiles. Así, las Cercas Internas Inferior (CIi) y Superior (CIs) estarán dadas por:CIi = Q1 - PasoCIs = Q3 +Paso

Si la cerca interna inferior da menor que el valor mínimo de la muestra, ésta se hace igual al valor mínimo; igualmente, si la cerca interna superior da mayor que el valor máximo, ésta se hace igual a dicho valor.
5. Cercas Externas, ubicadas a un paso de las cercas internas. Así, las Cercas Externas Inferior (CEi) y Superior (CEs) estarán dadas por:CEi = CIi - PasoCEs = CIs + Paso.

6. Se denominan "valores adyacentes" los ubicados entre las cercas internas y los bordes de las cajas. Por simplicidad no se grafican.

7. "Valores extremos" son los ubicados entre las dos cercas, y merecen especial atención, ya que pueden ser valores atípicos, que, en algunos casos, no pertenecen realmente a la distribución general de donde provienen los datos.


8. "Valores lejanos" o , ubicados por fuera de las cercas externas, correspondientes a valores extremos, que requieren un mayor análisis que los valores atípicos.


Considere los siguientes datos, correspondientes a




De este conjunto de datos tenemos que:
Me = 90.45
Q1 = 88.25
Q3 = 92.2
Rango intercuartílico = RIC = 92.2-88.25 = 3.95 Þ Paso = 5.925
Cercas interna inferior = 88.25 - 5.925 = 82.325
Cerca interna superior = 92.20 + 5.925 = 98.125
Cerca externa inferior = 82.325 - 5.925 = 76.40Cerca externa superior = 98.125 + 5.925 =
104.05



Como se observa hay dos valores que merecen especial atención: 98.8 y 100.3 que están entre las cercas interna y externa superior.
COMENTARIOS
El diagrama de cajas en una de las formas de como podemos vizualizar un grupo de datos a resolver, el cual lo que nosotros realizamos una serie de pasos para poder obtener el resultado que nosostros queremos...
Cuando realizamos las operaiones nos damos cuenta de como los datos estas dispersos...

AREA BAJO LA CURVA

Es en forma de campana, es una curva que tiene un solo pico la curva se divide por la media en dos partes iguales y cuando la curva se esta graficando las dos colas extremas de la curva no tiene que tocar la linea horizontal, la distribucion normal esta determinado completamente con la media y la desviacion estandar.


VALORES ESTANDARIZADOS
A este valor z se le resta la media por lo que despues se divide con la desviacion estandar, el valor estandarizado tiene dos lados un negativo y uno positivo, el negativo es cuando esta por ebajo de la media y el positivo es el que se encuentra por ensima de la media, la variable x se tiene que comvertir en la variable z la cual es la variqable que se usa para desviacion normal estandar.
f(x)= x2 + 1

la distribucion de porcentajes se se representa con una curva se distribuye en 2.15%, 13.59%, 34.13%, que se encuentran en los ambos lados de la curva o sea en el lado derecho e izquierdo, el lado derecho es el lado positivo y el lado izquierdo el negativo y a esos ambos lados los separa la media.

en el intervalo cerrado [1,5]



COMENTARIO- area bajo la curva es una de las forma de poder ver de como estan dispersos los datos de una distribucion siendo de esta manera, podemos verificar cuales son los datos que se encuentran a la par de la media...