viernes, 22 de mayo de 2009

REGRASION

La regresión cuadrática es el proceso por el cuál encontramos los parámetros de una parábola que mejor se ajusten a una serie de datos que poseemos, ya sean mediciones hechas o de otro tipo. Bueno, pero por que habríamos de querer ajustar nuestros datos precisamente a una parábola y no a otra funciLa regresión cuadrática es el proceso por el cuál encontramos los parámetros de una parábola que mejor se ajusten a una serie de datos que poseemos, ya sean mediciones hechas o de otro tipo. Bueno, pero por que habríamos de querer ajustar nuestros datos precisamente a una parábola y no a otra función? (ver escogiendo la función de ajuste).

REGRESION LINEAL:
En estadística, la regresión no lineal es un problema de inferencia para un modelo tipo:
Basado en datos multidimensionales x,y, donde f es alguna función
no lineal respecto a algunos parámetros desconocidos θ. Como mínimo, se pretende obtener los valores de los parámetros asociados con la mejor curva de ajuste (habitualmente, con el método de los mínimos cuadrados). Con el fin de determinar si el modelo es adecuado, puede ser necesario utilizar conceptos de inferencia estadística tales como intervalos de confianza para los parámetros así como pruebas de bondad de ajuste.
El objetivo de la regresión no lineal se puede clarificar al considerar el caso de la
regresión polinomial, la cual es mejor no tratar como un caso de regresión no lineal. Cuando la función f toma la forma:
f(x) = ax2 + bx + c
la función f es no lineal en función de x pero lineal en función de los parámetros desconocidos a, b, yc. Este es el sentido del término "lineal" en el contexto de la regresión estadística. Los procedimientos computacionales para la regresión polinomial son procedimientos de
regresión lineal (múltiple), en este caso con dos variables predictoras x y x2. Sin embargo, en ocasiones se sugiere que la regresión no lineal es necesaria para ajustar polinomios. Las consecuencias practicas de esta mala interpretación conducen a que un procedimiento de optimización no lineal sea usado cuando en realidad hay una solución disponible en términos de regresión lineal. Paquetes (software) estadísticos consideran, por lo general, más alternativas de regresión lineal que de regresión no lineal en sus procedimientos




ANALISIS
La regresion cuadratica nos sirve para saber que tanto es tan dispersos los datos de una variable del centro... la dispersion de los datos puesden ser cuadraticos y lineales se dice que es cuadratico cuando los datos son atipicos porque forman un fenomeno en la ecuacion.

REGRESION LINEAL:
Es la regresion donde los puntos estan demasiado serca en forma de un linea y por lo tanto sino estan muy dispersos se dicen que es regresiopn lineal....

domingo, 3 de mayo de 2009

SEGUNDO BIMESTRE

LA CURTOSIS

LA CURTOSIS:
Esta es la definición de curtosis que se suele emplear en libros antiguos, pero no es la que se expondrá aquí.
Indica que tan apuntada o achatada se encuentra una distribución respecto a un comportamiento normal (distribución normal). Si los datos están muy concentrado hacia la media, la distribución es leptocúrtica (curtosis mayor a 0). Si los datos están muy dispersos, la distribución es platicúrtica (curtosis menor a 0).
El comportamiento normal exige que la curtosis sea igual a 0 (distribución mesocúrtica).
La fórmula empleada para calcular la Curtosis se muestra a continuación (reemplace el valor de n por N en caso de tratar con datos poblacionales):


ANALISIS:
MIDE CUANTO TIENE DE AGUDEZA UN FENOMENO...
Y SE DIVIDE EN:
LEPTOCURTICA
MESOCURTICA
PLATOCURTICA

EL SESGO

EL SESGO
En estadística y epidemiología, un sesgo es un error que aparece en los resultados de un estudio debido a factores que dependen de la recolección, análisis, interpretación, publicación o revisión de los datos que pueden conducir a conclusiones que son sistemáticamente diferentes de la verdad o incorrectas acerca de los objetivos de una investigación. Este error puede ser sistemático o no, y es diferente al error aleatorio.
En el diseño y elaboración de un estudio de investigación en clínica, puede haber distintos tipos de sesgos
Sesgo de selección: Grupos no comparables debido a cómo se eligieron los pacientes o sujetos.
Sesgo de Información: Grupos no comparables debido a cómo se obtuvieron los datos.
Sesgo de confusión: Existe una mezcla de efectos debido a una tercera variable (
variable de confusión).
Sesgo retrospectivo.

ANALISIS
El sesgo es la parte que mide la desviacion de las medidas de tendencia central
La varianza

Es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística.
La varianza se representa por .
Varianza para datos agrupados
Para simplificar el cálculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.
Varianza para datos agrupados
Ejercicios de varianza
Calcular la varianza de la distribución:
9, 3, 8, 8, 9, 8, 9, 18
Propiedades de la varianza
1 La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.
2 Si a todos los valores de la variable se les suma un número la varianza no varía.
3 Si todos los valores de la variable se multiplican por un número la varianza queda multiplicada por el cuadrado de dicho número.
4 Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se puede calcular la varianza total.
Si todas las muestras tienen el mismo tamaño:
Si las muestras tienen distinto tamaño:
Observaciones sobre la varianza
1 La varianza, al igual que la media, es un índice muy sensible a las puntuaciones extremas.
2 En los casos que
no se pueda hallar la media tampoco será posible hallar la varianza.
3 La varianza no viene expresada en las mismas unidades que los datos, ya que las desviaciones están elevadas al cuadrado.

PERCENTILES

Los percentiles
Representan los valores de la variable que están por debajo de un porcentaje, el cual puede ser u
na valor de 1% a 100% (en otras palabras, el total de los datos es divido en 100 partes iguales).
La notación empleada será:
Donde k es equivalente al porcentaje de datos acumulados, y Pk es el valor de la variable que representa dicho porcentaje. Por ejemplo, P5 es el valor de la variable que deja por debajo el 5% de los datos. P78 será entonces el valor que agrupa el 78% de los datos.
Podemos concluir que P50 sería el valor que divide en dos parte iguales la cantidad de datos de la muestra o población siendo equivalente a la mediana.

NEDIA ARMONICA

LA MEDIA ARMONICA:

La media armónica , representada H, de una cantidad finita de números es igual al recíproco, o inverso, de la media aritmética de los recíprocos de dichos números
Así, dados los números a1,a2, ... , an, la media armónica será igual a:

La media armónica resulta poco influida por la existencia de determinados valores mucho más grandes que el conjunto de los otros, siendo en cambio sensible a valores mucho más pequeños que el conjunto.
La media armónica no está definida en el caso de la existencia en el conjunto de valores nulos.

MEDIA GEOMETRICA

Media geométrica

Sea una distribución de frecuencias (x, n). La media geométrica, que denotaremos por G. se define como la raíz N-ésima del producto de los N valores de la distribución.
G =
Si los datos están agrupados en intervalos, la expresión de la media geométrica, es la misma, pero utilizando la marca de clase (Xi).
El empleo más frecuente de la media geométrica es el de promediar variables tales como porcentajes, tasas, números índices. etc., es decir, en los casos en los que se supone que la variable presenta variaciones acumulativas.
Ventajas e inconvenientes:
- En su cálculo intervienen todos los valores de la distribución.
- Los valores extremos tienen menor influencia que en la media aritmética.
- Es única.
- Su cálculo es más complicado que el de la media aritmética.
Además, cuando la variable toma al menos un x = 0 entonces G se anula, y si la variable toma valores negativos se pueden presentar una gama de casos particulares en los que tampoco queda determinada debido al problema de las raíces de índice par de números negativos.
Media cuadrática

En
matemáticas, la media cuadrática, valor cuadrático medio o RMS (del inglés root mean square) es una medida estadística de la magnitud de una cantidad variable. Puede calcularse para una serie de valores discretos o para una función de variable continua. El nombre deriva del hecho de que es la raíz cuadrada de la media aritmética de los cuadrados de los valores.
Esta
media como medida de asociación tiene aplicaciones tanto en ciencias biológicas como en medicina.
A veces la variable toma valores positivos y negativos, como ocurre, por ejemplo, en los
errores de medida. En tal caso se puede estar interesado en obtener un promedio que no recoja los efectos del signo. Este problema se resuelve, mediante la denominada media cuadrática. Consiste en elevar al cuadrado todas las observaciones (así los signos negativos desaparecen), en obtener después su media aritmética y en extraer, finalmente, la raíz cuadrada de dicha media para volver a la unidad de medida original.

TALLO DE HOJAS

Tallo de Hojas
Diagramas de Tallo y Hojas
Una técnica de recuento y ordenación de datos la constituye los diagramas de Tallos y Hojas.
Supongamos la siguiente distribución de frecuencias


EJEMPLO:
36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40
que representan la edad de un colectivo de N = 20 personas y que vamos a representar mediante un diagrama de Tallos y Hojas.
Comenzamos seleccionando los tallos que en nuestro caso son las cifras de decenas, es decir 3, 2, 4, que reordenadas son 2, 3 y 4.
A continuación efectuamos un recuento y vamos «añadiendo» cada hoja a su tallo
Por último reordenamos las hojas y hemos terminado el diagrama





ANALISIS:
Es una técnica estadística para representar un conjunto de datos. Cada valor numérico se divide en dos partes. El o los dígitos principales forman el tallo y los dígitos secundarios las hojas. Los tallos están colocados a lo largo del eje vertical, y las hojas de cada observación a lo largo del eje horizontal. Las hojas son los dígitos secundarios. EL tallo se coloca a la izquierda de una línea vertical y los valores de las hojas a la derecha.