miércoles, 4 de diciembre de 2013

Distribución normal

Distribución normal
La línea verde corresponde a la distribución normal estándar Función de densidad de probabilidad
Función de distribución de probabilidad
Parámetros	$\mu \in\mathbb{R} \,\!$ $\sigma > 0 \,\!$
Dominio	$x \in\mathbb{R} \,\!$
Función de densidad (pdf)	$\frac1{\sigma\sqrt{2\pi}}\; e^{ - \frac{1}{2} \left(\frac{x-\mu}{\sigma}\right)^2} \,\!$
Función de distribución (cdf)	$\int\limits_{-\infty}^{x} \frac1{\sigma\sqrt{2\pi}}\; e^{ - \frac{1}{2} \left(\frac{t-\mu}{\sigma}\right)^2} \, dt \,\!$
Media	$\mu \,\!$
Mediana	$\mu \,\!$
Moda	$\mu \,\!$
Varianza	$\sigma^2 \,\!$
Coeficiente de simetría	0
Curtosis	0
Entropía	$\ln\left(\sigma\sqrt{2\,\pi\,e}\right) \,\!$
Función generadora de momentos (mgf)	$M_X(t)= e^{\mu\,t+\frac{\sigma^2 t^2}{2}} \,\!$
Función característica	$\chi_X(t)=e^{\mu\,i\,t-\frac{\sigma^2 t^2}{2}} \,\!$

En estadística y probabilidad se llama distribución normal,distribución de Gauss o distribución gaussiana, a una de las distribuciones de probabilidad de variable continua que con más frecuencia aparece aproximada en fenómenos reales.

La gráfica de su función de densidad tiene una forma acampanada y es simétrica respecto de un determinadoparámetro estadístico. Esta curva se conoce como campana de Gauss y es el gráfico de una función gaussiana.

La importancia de esta distribución radica en que permitemodelar numerosos fenómenos naturales, sociales y psicológicos. Mientras que los mecanismos que subyacen a gran parte de este tipo de fenómenos son desconocidos, por la enorme cantidad de variables incontrolables que en ellos intervienen, el uso del modelo normal puede justificarse asumiendo que cada observación se obtiene como la suma de unas pocas causas independientes.

De hecho, la estadística es un modelo matemático que sólo permite describir un fenómeno, sin explicación alguna. Para la explicación causal es preciso el diseño experimental, de ahí que al uso de la estadística en psicología y sociología sea conocido como método correlacional.

La distribución normal también es importante por su relación con la estimación por mínimos cuadrados, uno de los métodos de estimación más simples y antiguos.

Algunos ejemplos de variables asociadas a fenómenos naturales que siguen el modelo de la normal son:

caracteres morfológicos de individuos como la estatura;
caracteres fisiológicos como el efecto de un fármaco;
caracteres sociológicos como el consumo de cierto producto por un mismo grupo de individuos;
caracteres psicológicos como el cociente intelectual;
nivel de ruido en telecomunicaciones;
errores cometidos al medir ciertas magnitudes;
etc.

La distribución normal también aparece en muchas áreas de la propia estadística. Por ejemplo, la distribución muestralde las medias muestrales es aproximadamente normal, cuando la distribución de la población de la cual se extrae la muestra no es normal.¹ Además, la distribución normal maximiza la entropía entre todas las distribuciones con media y varianza conocidas, lo cual la convierte en la elección natural de la distribución subyacente a una lista de datos resumidos en términos de media muestral y varianza. La distribución normal es la más extendida en estadística y muchos tests estadísticos están basados en una supuesta "normalidad".

En probabilidad, la distribución normal aparece como el límite de varias distribuciones de probabilidadcontinuas y discretas.

Índice

[ocultar]

Historia[editar · editar código]

Abraham de Moivre, descubridor de la distribución normal

La distribución normal fue presentada por primera vez por Abraham de Moivre en un artículo del año 1733,² que fue reimpreso en la segunda edición de su The Doctrine of Chances, de 1738, en el contexto de cierta aproximación de la distribución binomial para grandes valores de n. Su resultado fue ampliado por Laplace en su libro Teoría analítica de las probabilidades (1812), y en la actualidad se llama Teorema de De Moivre-Laplace.

Laplace usó la distribución normal en el análisis de errores de experimentos. El importante método de mínimos cuadrados fue introducido por Legendre en 1805. Gauss, que afirmaba haber usado el método desde1794, lo justificó rigurosamente en 1809 asumiendo una distribución normal de los errores. El nombre de Gauss se ha asociado a esta distribución porque la usó con profusión cuando analizaba datos astronómicos³ y algunos autores le atribuyen un descubrimiento independiente del de De Moivre.⁴ Esta atribución del nombre de la distribución a una persona distinta de su primer descubridor es un claro ejemplo de la Ley de Stigler.

El nombre de "campana" viene de Esprit Jouffret que usó el término "bell surface" (superficie campana) por primera vez en 1872 para una distribución normal bivariante de componentes independientes. El nombre de "distribución normal" fue otorgado independientemente por Charles S. Peirce, Francis Galton y Wilhelm Lexis hacia 1875.^{[cita requerida]} A pesar de esta terminología, otras distribuciones de probabilidad podrían ser más apropiadas en determinados contextos; véase la discusión sobre ocurrencia, más abajo.

lunes, 4 de noviembre de 2013

Distribución Binomial

Notación:

Definición

Es una de las distribuciones de probabilidad más útiles ( control de calidad, producción, investigación). Tiene que ver con el experimento aleatorio que produce en cada ensayo o prueba uno de dos resultados posibles mutuamente excluyentes: ocurrencia de un criterio o característica específico (llamado éxito) y no ocurrencia de éste (llamado fracaso). Los términos o calificativos de "éxito y fracaso" son solo etiquétas y su interpretación puede no corresponder con el resultado positivo o negativo de un experimento en la realidad.

Ejemplo

Éxito podría ser hallar en un ensayo específico que la unidad es defectuosa al examinarla. Cada experimento aleatorio consiste en una serie de ensayos o pruebas repetidas realizadas en idénticas condiciones ( $\QTR{bf}{\eta }$ veces), o sea que cada uno de ellos es independiente de los demás.

Sea $\QTR{bf}{\rho }$ la probabilidad de éxito cada vez que el experimento se realiza y

$\QTR{bf}{q}$ la probabilidad de fracaso. Sea X la variable aleatoria que representa el número de éxitos en los $\QTR{bf}{\eta }$ ensayos o pruebas. El interés se centra en conocer la probabilidad de obtener exactamente

éxitos en esos $\QTR{bf}{\eta }$ ensayos.

Criterios o propiedades para definir la Distribución Binomial

Resumiendo, podemos definir estos criterios:

1- El experimento aleatorio consiste en $\QTR{bf}{\eta }$ ensayos o pruebas repetidas, e idénticas y fijadas antes del experimento (pruebas de Bernoulli). Son pruebas con reemplazamiento o con reposición.

2- Cada uno de los $\QTR{bf}{\eta }$ ensayos o pruebas arroja solo uno de dos resultados posibles resultados: éxito ó fracaso.

3- La probabilidad del llamado éxito (

, pemanece costante para cada ensayo o prueba.

4- Cada prueba o ensayo se repite en idénticas condiciones y es independiente de las demás.

Cuando estas propiedades se cumplen en el experimento aleatorio se dice que el constituye un proceso de Bernoulli y cada uno de los ensayos que lo conforman se llama experimento de Bernoulli.

5. El interés recae en hallar la probabilidad de obtener

número de éxitos al realizar $\QTR{bf}{\eta }$ ensayos del mismo E.A.

La función de probabilidad de X en esas condiciones será:

Para $\QTR{bf}{\eta }$ entero $\$ y

Planteamiento Básico

Supongamos un proceso productivo en serie de una misma unidad metalmecánica y en él que: Probabilidad de una unidad defectuosa :

y probabilidad de unidad no defectuosa:

Supongamos que el interés está en evaluar el proceso mediante una muestra aleatoria de 4 unidades y por tanto se define la v.a X como el número de unidades defectuosas en la muestra. Para garantizar que los ensayos resulten independientes hacemos la selección con reemplazamiento o sustitución.

Supongamos que centramos nuestro interes en

unidad defectuosa en las cuatro pruebas o ensayos. Sea B=bueno y D= defectuoso. Por lo tanto el $\ \Omega$ esta conformado por 16 resultados posibles

$S=\{BBBB,$

.....

$DDDD\}.$

Se puede entonces notar que los eventos favorables a

constiuyen el subconjunto

. Como no importa el orden de aparición de la unidad defectuosa sino que aparezca exactamente una unidad con esa característica tenemos:

o sea:

para cada posible resultado de una unidad defectuosa

Como son cuatro resultados los que satisfacen el interés específico de una unidad defectuosa entonces

Si generalizamos:

donde: $\binom{n}{x}$ son las distintas maneras como

éxitos se producen dentro de los $\eta$ ensayos;

es la probabilidad de

éxitos en cada una de las maneras distintas de producirse los

éxitos .

Para el caso del ejemplo:

Consideremos el caso ya no de

defectuoso; sino todos los valores que puede asumir X en las cuatro pruebas.

Como son 4 ensayos y consideramos todos los posibles valores de

entonces la

Los valores de

se pueden calcular por medios electrónicos ó utilizando las tablas de la distribución binomial que proporcionan la solución de estas operaciones, a veces largas o laboriosas.

Con los resultados de esos cálculos podemos construir la tabla de distribución de probabilidades, hacer su gráfica y definir sus principales características.

Tomemos como ejemplo la distribución binomial de parámetros

Características de la distribución binomial.

Tendencia central:

= $E(X)=\sum xf(x)$ aplicando la definición de valor esperado se obtiene que para esta distribución : $\ \mu =\eta \rho$

Dispersión ó variación:

: $\sigma ^{2}$ =

lo que conduce a que una v.a. binomial X tiene como varianza

Por lo tanto su desviación estandar:

Asimetria ó deformacíon (Forma): con base en la razón entre los momentos centrales de orden dos y tres como quedo definido antes:

sobre la base de que si: MATH

Generalmente la distribución binomial es sesgada ó asimetrica hacia la derecha, sesgo que se va perdiendo cuanto más grande sea el valor de $\eta$ (# de pruebas) y en la medida en que $\rho$ se acerque a

(por lo tanto $(1-\rho )$ tienda a

), limite en el cual se torna simétrica

Para el caso considerado y utilizando tanto la metodología tradicional de la definición de conceptos como usando las fórmulas simplificadas, tenemos:

	$(x-\mu)$	$(x-\mu)^{2}$	$(x-\mu)^{2}f(x)$




Total	0

; tambien

;

Su función de distribución acumulada sera:

Ejemplo

Una empresa adoptó un proceso de control ded calidad consistente en diariamente seleccionar al azar 20 unidadeds del total producido y conocer el número de unidades defectuosas. El plan establece que si al examinar diariamente las veinte unidades, tres ó mas salen defectuosas, algo esta pasando y se ordena detener el proceso productivo para buscar la falla. Cúal es la probabilidad de que se ordene parar el proceso productivo si se sabe por experiencia que la probabilidad de una unidad defectuosa es 10%?

Se pide:

La solución más corta para este planteamiento sería entonces:

o sea $40\%;$ que sera la probabilidad de que cualquier dia se ordene parar el proceso de producción según el planteamiento de control del mismo.

Si consideramos las características, tenemos:

Valor esperado $E(X)=\mu$

unidades defectuosas.

Varianza

Valores que como es lógico tambien pueden ser hallados por el método tradicional.

Si se hace la grafica para determinar la forma (aunque se deduce que como $\rho <\frac{1}{2},$ será sesgada a la derecha). Veremos sin embargo que dado $\eta =20$ , no es tan sesgada como en el caso del otro ejemplo tratado aqui.

Si se hace crecer

, por ejemplo, hasta $\eta =30$ , todavía se torna más simétrica, tendiendo hacia una normal a pesar de que $\rho$ no sea tan cercano a

pero si alejado de cero (

) ó de uno (

). En la práctica, si $\eta >30$ irá tornandose simétrica para valores de ( $0.1<\rho <0.5$ )

Se puede obtener la función de distribución acumulada y obtener asi los cuantiles ó fractiles de la distribución.

La siguiente figura muestra tres funciones de distribución binomial con $\eta =50$ y valores $\rho$ de

La A con $\rho =0.25$ es ligeramente sesgada a la derecha ó con sesgo positivo. La B con $\rho =0.50$ es simetrica y la C con $\rho =0.75$ tendra sesgo negativo, interpretaciones que resultan consecuentes con el indice de sesgo $\alpha _{3}$ ya planteado.

Ejercicios

1. Una empresa fabricante de neumáticos para tractomulas realiza pruebas de ponchaduras en un terreno difícil. Se encuentra que el $25\%$ de los neumáticos probados presentaron pinchazo en el recorrido total. Se prueban 15 neumáticos más tomados al azar: Halle la probabilidad de las siguientes cantidades de neumáticos con pinchaduras :