Universidad De Oriente - Nucleo Bolívar - Escuela de Cs. de la Tierra - Departamento de Ing. Industrial - Estadistica II

lunes, 19 de septiembre de 2011

Clasificacion:


La aplicación  de cálculos probabilísticos permito determinar a partir de que valor debemos rechazar la hipótesis garantizando la probabilidad de cometer un error es n valor conocido a priori. Las hipótesis pueden clasificarse en dos grupos, según:
·         Especifiquen un valor concreto o un intervalo para los parámetros del modelo.
·         Determinen el tipo de distribución de probabilidad que ha generado los datos.
Aunque la metodología para realizar el contraste de hipótesis es análoga en ambos casos, distinguir ambos tipos de hipótesis es importante puesto que muchos problemas de contraste de hipótesis respecto a un parámetro son, en realidad, problemas de estimación, que tienen una respuesta complementaria dando un intervalo de confianza ( o conjunto de intervalos de confianza) para dicho parámetro. Sin embargo, las hipótesis respecto a la forma de distribución se suelen utilizar para validar un modelo estadístico para un fenómeno aleatorio que se esta estudiando.

Un ejemplo del primer grupo es la hipótesis de que la media de que una variable es  y del segundo que la distribución de probabilidad es la distribución normal, aunque la metodología para realizar el contraste de hipótesis es análogo en ambos casos, distinguir ambos tipos de hipótesis respecto a un parámetro son en realidad problemas de estimación que tienen que tienen una respuesta complementaria dando un intervalo de confianza para dicho parámetro, sin embargo las hipótesis respecto a la forma de la distribución se suele utilizar para validar un modelo estadístico. Para un fenómeno aleatorio que se está estudiando.
Planteamiento del Contraste de hipótesis:
El nombre de nula proviene de que H0 representa la hipótesis que mantendremos a no ser que los datos indiquen su falsedad. “Nula” debe entenderse en el sentido de “neutra “. La hipótesis H0 nunca se considera probada, aunque puede ser rechazada por los datos. Por ejemplo, la hipótesis de que todos los elementos de una población tienen el mismo valor de una variable puede ser rechazada encontrando un elemento que no lo contenga, pero no puede ser “demostrada” más que estudiando todos los elementos de la población, tarea que puede ser imposible.
De igual manera, la hipótesis de que la media de una población es diez puede ser rechazada fácilmente si la media verdadera está muy lejos de diez analizando una muestra suficientemente grande. Sin embargo, no puede ser “demostrada” mediante muestreo, ya que es posible que la media difiera de diez en un valor pequeño imperceptible en el muestreo). Por esta razón no afirmamos que aceptamos H0, sino que no podemos rechazarla.
La hipótesis H0 se elige normalmente de acuerdo con el principio de simplicidad científica. Este principio establece que solamente debemos abandonar un modelo simple a favor de otro más complejo cuando la evidencia a favor de este último sea fuerte.
Si rechazamos H0, estamos implícitamente aceptando la hipótesis alternativa, Ha, que puede ser simplemente la negación de Ha. En algunos casos queremos decidir entre dos hipótesis simples y Ha está perfectamente determinada. Sin embargo, el caso más frecuente es que H0 sea simple, del tipo y Ha se tome de una de las siguientes formas:
Desconocemos antes de realizar el contraste en que dirección puede ser falsa H0. Entonces Ha es simplemente la negación de. Decimos entonces que el contraste es bilateral.
Conocemos la dirección en que H0 puede ser falsa. Es decir, si H0 es falsa, en ese caso forzosamente (o bien). Por ejemplo, se introduce una medida en una población que, si tiene efectos, puede mejorar una variable pero es imposible que pueda empeorarla. Tenemos entonces un contraste unilateral.

Se denomina hipótesis nula Ho, a la hipótesis que se desea contrastar. El hombre de “nula” indica que Ho representa la hipótesis que mantendremos a no ser que los datos indiquen su falsedad y puede entenderse, por tanto, en el sentido de “neutra”. La hipótesis Ho nunca se considera probada, aunque puede ser rechazado por los datos. Por ejemplo, la hipótesis de que dos poblaciones tienen la misma media puede ser rechazada fácilmente cuando ambas difieren mucho, analizando muestras suficientemente grandes de ambas poblaciones, pero no puede ser “demostrada” mediante muestreo, puesto que siempre cabe la posibilidad de que las medias difieran en una cantidad d lo suficientemente pequeña para que no pueda ser detectada, aunque la muestra sea muy grande.
A partir de una muestra de la población en estudio, se extrae un estadístico ( esto es, un valor que es función de la muestra) cuya distribución de probabilidad esté relacionada con la hipótesis en estudio y sea conocida. Se toma entonces el conjunto de valores que es más improbable bajo la hipótesis como región de rechazo, esto es, el conjunto de valores para el que consideramos que, si el valor del estadístico obtenido entra dentro del, rechazaremos la hipótesis.
La probabilidad de que se obtenga un valor del estadístico que entre en la región de rechazo aun siendo cierta la hipótesis puede calcularse. De esta manera, se puede escoger de dicha región de tal forma que la probabilidad de cometer este error sea suficientemente pequeña.
El enfoque actual considera siempre una hipótesis alternativa a la hipótesis nula. De manera explicita o implícita, la hipótesis nula, a la que se denota habitualmente por Ho, se enfrenta a otra hipótesis que denominaremos hipótesis alternativa y que se denota H1. En los casos en los que no se especifica H1 de manera explicita podemos considerar que ha quedado definida implícitamente como “Ho es falsa”.
Si por ejemplo deseamos comprobar la hipótesis de que dos distribuciones tiene n la misma media, estamos implícitamente considerando como hipótesis alternativa “ambas poblaciones tienen distinta media”. Podemos, sin embargo considerar casos en los que H1 no es la simple negación de Ho. Cabria realizar otras hipótesis, pero a los efectos del estudio que se pretende realizar, no se consideran relevantes.
Un test de hipótesis se entiende, en el enfoque moderno, como una función de la muestra, corrientemente basada en un estadístico. Supongamos que se tiene la muestra X=(X1,X2,….Xn) de una población en estudio y que se han formulado hipótesis sobre un parámetro q relacionado con la distribución estadística de la población. Supongamos que se dispone de un estadístico t(X) cuya distribución con respecto a q, Fq(t) se conoce. Supongamos, también que las hipótesis nula y alternativa tienen la siguiente formulación:
Un contraste, prueba o test para dichas hipótesis seria una función de la muestra de la siguiente forma:
Donde f(X) = 1 significa que debemos rechazar la hipótesis nula, Ho (aceptarH1) y f(X) = 0, que debemos aceptar Ho (o que no hay evidencia estadística contra Ho). A a se le denomina región de rechazo. En esencia, para construir el test deseado, hasta con escoger el estadístico del contraste t(X) y la región de rechazo  a.
Se escoge a de tal manera que la probabilidad de que t(X) caiga en su interior sea baja cuando se da Ho.
Estadístico de la prueba
Los datos se deben sintetiza en un estadística de la prueba. Dicho estadístico se calcula para ver si es razonablemente compatible con la hipótesis nula. Cuando se prueba una proporción el estadístico de la prueba es muy simple: se cuenta el número de éxitos en la muestra para encontrar el estadístico.
En las pruebas de hipótesis es necesario trazar una línea entre los valores del estadístico de la prueba que son relativamente probables dada la hipótesis nula y los valores que no lo son. ¿En qué valor del estadístico de la prueba comenzamos a decir que los datos apoyan a la hipótesis alternativa? Para contestar a esta pregunta se requiere conocer la distribución muestral del estadístico de la prueba. Los valores del estadístico de la prueba que son sumamente improbables bajo la hipótesis nula (tal como los determina la distribución muestral) forman una región de rechazo para la prueba estadística.
Región de rechazo
Llamaremos región de rechazo C asociada al contraste de hipótesis, al conjunto de valores muestrales bajo los cuales se rechaza la hipótesis nula.
Fijada la región de rechazo automáticamente se tiene la regla de decisión. Si nuestra muestra pertenece a la región de rechazo rechazamos H0 y si no, la aceptamos.
Precisamente el objetivo de la teoría de los contrastes o test de hipótesis es determinar para cada contraste cúal es la región de rechazo óptima en base a criterios que se especificarán.

Contraste de hipótesis:
En contraste de hipótesis mediante distribución normal se supone que bajo cierta hipótesis la distribución de muestreo de un estadístico X es una distribución normal con media µX y desviación típica sX. Así la distribución de la variable tipificada z, es la distribución normal canoníca, y está dada por:
Por ejemplo, si se tiene un 95% de confianza de que la hipótesis es verdadera, el valor de z para un estadístico muestral X estará entre 1,96 y -1,96. El area restante equivalente al 5% del área bajo la curva normal, representa la posibilidad de equivocarse al rechazar la hipótesis (de cometer un error Tipo I), entonces se platean las siguientes reglas de decisión:
Rechazar la hipótesis al nivel de significación de 0,05, si el valor de z para el estadístico X esta fuera del rango -1,96 a 1,96. Eso equivale a decir que el estadístico muestral observado es significativo al nivel 0,05.
Aceptar la hipótesis en caso contrario.
Dado que Z juega un papel, tan importante en el contraste de hipótesis, se le llama: un estadístico de contraste.
Supongamos que estamos en un contexto paramétrico. Es decir, x1 , x2 ...... xn es un muestreo aleatorio simple de f siendo un parámetro desconocido. Llamaremos al espacio paramétrico, es decir, el conjunto de los valores posibles para. En los contrastes de hipótesis, lo que interesa es determinar si podemos admitir que no debemos admitir que donde y constituyen una partición de. Ambas hipótesis se tratan de forma diferente. A la primera se le conoce como hipótesis nula. A la segunda como hipótesis alternativa. Se suele simbolizar:
La hipótesis nula no se considera probada pero es la que mantendremos a menos que los datos evidencien lo contrario. Luego el problema en general es si admitimos o no H0

Los contrastes de hipótesis mediante distribución normal pueden ser:
a)    Contrastes de dos colas: si en la prueba se está interesado en los valores extremos del estadístico X, o en su correspondiente valor de Z a ambos lados de la media; también llamado contraste bilateral.
b)    Contrastes de una cola: si se esta interesado tan solo en valores extremos a un lado de la media, es decir, en una de las dos colas de la distribución, también llamado contraste unilateral. En este caso, la región crítica o de significación esta situada a un lado de la distribución, con área igual al nivel de significación.
Para grandes muestras, las distribuciones de muestreo de muchos estadísticos son distribuciones normales y los contrastes anteriores pueden aplicarse a los Z correspondientes; y los resultados son validos para poblaciones infinitas o para muestreos con reposición. Pero para muestreos sin reposición en poblaciones finitas, esos resultados requieren modificación:
Pueden realizarse también Pruebas de Hipótesis de dos muestras, es decir, contrastes de hipótesis mediante diferencias muestrales para:
   a) Diferencias de medias: si se tienen las medias muestrales l y 2 de grandes muestras de tamaños N1 y N2, tomadas de poblaciones con respectivas medias µ1 y µ2, Y desviaciones típicas s1 y s2. Puede considerarse como hipótesis nula que No hay diferencia entre las medias de las poblaciones (µ1=µ2), que sería lo mismo que afirmar que las muestras se han tomado de dos poblaciones que tienen la misma media.

b)Diferencias de proporciones: si se tienen las proporciones rnuestrales P1 y P2 obtenidas en grandes muestras de tamaños N1 Y N2 tomadas de respectívas poblaciones que tienen proporciones p1 Y p2. Puede considerarse la hipotesis nula de que no hay diferencia entre los parámetros de las poblaciones {p1=p2}, y por tanto, que las muestras se han tornado de una misma población.

No hay comentarios:

Publicar un comentario