Idioma: Español
Fecha: Subida: 2020-04-03T00:00:00+02:00
Duración: 20m 23s
Lugar: Curso
Visitas: 1.987 visitas

Tema 5 - Parte VII

Inferencia estadística para una variable con distribución Gumbel

Descripción

Análisis de valores extremos mediante la distribución Gumbel

Transcripción

Recordar que estamos en la última sección del tema 5, que esta primera las últimas elecciones, la dividir en cuatro secciones más pequeña cómoda de trabajar tanto desde el punto de vista teórico como práctico. Lo digo en un solo documento, la lo que pretendía molesta, tienden a aplicaciones, analizar tanto una distribución normal como una norma, como una gran ve como un suceso y en estado medio, lo que es el análisis de una variable con distribución. Como siempre. Voy a recordar un breve resumen de lo que hicimos en el vídeo anterior estuvimos analizando el caso, una institución normal y, como resumen, pues lo de siempre, identificar la variable y allí una contenido importante dato en el caso de distribución, se analizan utilizando las herramientas de la distribución, no normal, pero aplicamos esas teóricas a los datos transformador, logaritmo, neperiano, pasa el caso de la institución, entonces, en general, cuando trabajemos con datos de valores, como es el caso, por ejemplo, de valor máximo en un intervalo de tiempo del nivel del mar o del caudal de un río o de velocidad del viento, etcétera. La distribución que intentaremos ajustarse a la distribución. Fijaros que aquí lo que hacemos es trabajar con valor máximo en algunas situaciones. También se pueden trabajar con valore mínimo y, bueno. El análisis similar, aunque usualmente en el contexto de ciencia medioambientales la mayor parte de las situaciones, son de análisis de valor máximo, pero también habrá situaciones me lo menos frecuente de analizar valor el mínimo, como el la precipitación en mínima a lo largo de un año denominada zona, etcétera. Bueno, siempre vamos a coger un ejemplo y en este caso los datos que acogerse corresponden con valor máximo anual de un río de unido a su paso por la localidad de México. Durante una serie de años se han ido aumentando los caudales máximum, que son el valor que aparecen ahí y como curiosidad, el documento, pues tenéis un enlace a un video como fueron las inundaciones en la localidad de el año pasado, durante junio. Bueno, pues como siempre, ha identificado la variable, en este caso, la variable es el caudal máximo anual del río mullin. Yo a esa variable llamado c, lo expuesto en el documento no voy a repetir en la transparencia y, bueno, pues nosotros, como hacer, va a ser, como siempre utilizar r para estudiar si resulta de la institución, cambie el paraíso datum y además, encima, los parámetros que caracterizan esa distribución cambian, que si volvéis a los documento de varios, sitúa con la distribución, la distribución depende para su cálculo de dos valores, que son los valores landa y del. Para determinar, como hemos hecho en el caso de la normalidad, lo normal. Si la distribución adecuada haremos un gráfico, un gráfico cutu, cumplo, que se interpreta la manera de la misma manera, aunque en este caso tiene una variación en que yo en la que nos vamos a entrar porque es un detalle técnico, y para contactar como hipótesis, los datos y una distribución, vamos a utilizar un contacto muy muy conocido en el contrate chico hará de acuerdo encontrarte un contacto muy potentes que se utiliza para muchos problemas. De hecho, si no me equivoco, en la asignatura de genérica habéis utilizado ese contraste si cuadran entonces entre las distintas aplicaciones que tienen ese contraste cuadrado, que al final de la asignatura veremos más una de las aplicaciones que tiene es detectar si uno trato procedo o no de un determinado modelo en particular. Lo podemos utilizar para el modelo de la distribución; en cambio, se podría también utilizar para el modelo de la distribución normal para el modelo, electrocución, lo normal, pero como es un modelo ya tienen una técnica específica con. No es necesario utilizar la técnica de contractes la chico, de acuerdo, bien lo que te contractes son complicado de acuerdo, y lo único que vamos a ver es cómo se obtienen el estadístico y el valor con el si alguien estuviera interesado en detalle por alguna cuestión o en un futuro de TFG o lo que hiciera falta por me lo cedí llega y yo facilito más detalles técnicos sobre este contraste y la estimación de los parámetro, en este caso la vamos a hacer mediante el método de máxima verosimilitud. En general no hay estimaciones insesgada del anda y de, del, y mucho menos, ni siquiera te mínima varianza, con lo cual nos vemos abocados a utilizar el método de máxima similitud dicte en la sección de estimación puntual del tema fílmico bien el caso de distribución. Caben los pasos a seguir, darle su totalmente distinto a lo que hemos hecho en el caso de las distribuciones, lo normal y lo normal, y lo normal, y la razón es una razón técnica. Ocurre lo siguiente, tanto el contracte de la chico de radio para ver si la variante es una institución normal perdón como la estimación de máxima verosimilitud de parámetros, la delta se realizan como un paquete, que es el paquete de ese paquete realizar tanto el contracte como la estimación a la vez; solamente vamos a ejecutar un comando, y de ese comando vamos a hacer toda la información que necesitamos del contrate de la estimación de máxima verosimilitud, ahora bien que la estimación de máxima similitud. Si recordáis, un poco lo he entendido de, de ese método de estimación, requerían buscar un máximo, pero la búsqueda del máximo una función a veces diera una solución analítica. En términos de derivadas, etc, etc. Sino que hay que hacer una búsqueda numérica merino. El caso de la institución Campbell es el ejemplo típico donde no hay solución analítica, y equivocan digámoslo a mano, dado numérico donde se alcanzan más de la función de verosimilitud, del guardo, y resulta que para poder aplicar ese método el r tiene la búsqueda de su máximo más simplicidad. Si nosotros damos una aproximación en primer ante los valores de los parámetros aunque no son bueno pero con que son una unos valores que en cierta forma se a nos alejen mucho de los verdaderos valores, entonces con esa aproximaciones iniciales aunque no son muy buena, les simplifica el camino de reparar, buscar quiénes son los séptima de máxima verosimilitud. Ahora bien, esa esa primera aproximación pues tendremos que plantearnos cómo buscarla, de acuerdo, porque esa primera aproximación la vamos a necesitar introducir en r tanto, no sólo para la estimación de masiva de los similitud, sino para resolver contrate hipótesis. El arché cuadro puesto que resuelve el contrato y la estimación a la vez. Nosotros debemos entender que van a ver en Santo en primera aproximación, el del anda y, bueno, cómo podemos resolver eso? Pues hay un neto relativamente sencillo. Si volvemos a la distribución grande, la inducción, realmente entendía dos parámetros directa, y hay una relación entre esos dos parámetros y la media y la varianza de una distribución. La media es la más eta constante por delta, y la varianza es igual a pie cuadrado por del partido. Por si bien puede tanto fórmula, nosotros podemos dejar los valores del landa -en particular de esta fórmula de acuerdo. Podemos despejar el valor de delta mediante la expresión. Bueno, simplemente el siglo pasado aquí manejaba que alguien cuadrado; tomemos la presión de eta y ahora reemplazando sin detecta. Aquí podemos entender moción línea, despejar el balón del anda como la esperanza de que constante por presión de aquí para qué nos sirve esta fórmula? Pues esta fórmula no sirven para hacer algo similar a lo que hemos hecho en el caso de la distribución. Lo normal, puesto que yo aquí puedo estima en la medida la variable, a partir de la medida envoltura y estimar la varianza a partir de la muestra, puedo reemplazar en estratos fórmula, entre otros valores del conocido por la aproximaciones, que más los estibadores insertado y obtener una primera aproximación de Holanda y con esa aproximaciones de Holanda jugar para hacer el contraste del archivo cuadrado, y la estimación de máxima similitud bien, vamos a ir, no vamos a ver, en primer lugar inducimos nuestro dato aquí una cuestión técnica muy importante, muy técnica en el documento, y es que tenemos que tener instalado este primer paquete, así que lo tengáis boca en la lista y marcarlo de acuerdo entonces de algo que tener evitar la hubiese paquete y después de otro paquete. Que es el paquete de los incardinarlo también con unas vale Una vez que están cargando paquete, podemos realizar nuestro análisis de acuerdo? Entonces, si no lo tiene y la lista de paquete y darlo, recordarán que deje un video cortito y tararí en algún paquete y ya podemos pasar a un análisis de acuerdo. Bueno, pues entonce utilizando la fórmula que hemos visto anteriormente. Perdón, aquí demasiado lejos; segundo, mejor dicho, hacia adelante. Bueno, pues entonces recuerda lo que habíamos dicho? Utilizando las estimaciones de la audiencia de la media, parte de la media muestra equivalencia, muestra más a surtir de tener las primeras resignaciones del anda, y eso lo podemos hacer utilizando lo mismo que hicimos en el caso de la distribución normal. Lo que tengo que hacer es meter la fórmula anterior, fijaron que en la fórmula anterior aparece la media muestral, aparece esta copta; está multiplicada por la raíz cuadrada, fijado; aparece continuidad por la red cuadrada, desee y de por lo tengo muy querido. Implicar por la raíz cuadrada de la cuasi; varianza, mostrar la cuadra; la cohesiva alianza, encuentra el el, la cuasi típica y la podemos pedir directamente en el reconectar función del acuerdo; y después tenemos que dividir por la constante y 7, bien r, pues lo reconoce como la constante. Lo que hago es que toda esta expresión que aparece aquí toda deprisa, que aparece aquí le voy a poner una vez, y le voy a llamar landa. Eso significa que ya no tengo que acordarme del valor numérico, y cuando lo tenga que utilizar en un determinado punto olvido el privo, Holanda, y lo que valga, me sirve para hacer el análisis, esto también o va a valer para los siguientes, y vosotros generaría una inscrita r para hacer análisis de la distribución. Garden después simplemente cambia el nombre del vector de datos en esta impresión, y o sigue valiendo. Eta fue esto; comando para calcular blande del entonces. Calculamos blanda, con esa fórmula y el valor de igual cante, calculamos, con la fórmula correspondiente, entonces simplemente volcar aquí las dos fórmulas que consideraban del anda y del. Así que si no hay ningún problema pues los valores están aquí; almacena de acuerdo, y no me interesa tanto cuánto vale, sino tenerlo como primera aproximación entrenando para hacer una estimación por máxima verosimilitud. Entonces el análisis con y con el paquete de luz que hemos comentado se hace de una forma casi directa, en un solo con prácticamente entonces este como algo que parece que comenzaré con detalle. Los argumentos que aparecen ahí lo que me va a generar es un único objeto. Esto es bastante común. El lenguaje de programación es un lenguaje programación orientada objeto. Entonces lo que hace es generar un objeto que de primera yo no voy a ver, o sea, es un objeto que tiene internamente almacenado y de ese objeto, que llevan muchos componentes. Voy a poder ir oyendo a posterior información para que sea una. Fue divina sencillo identificar el objeto a la hora de trabajar con él, lo que a la vez que lo género le pongo un nombre y le voy a poner el del hombre. Ajuste le puede poner el nombre que queráis de acuerdo, yo lo he puesto. Ha sido bastante común utilizar este nombre para objetos donde lo que hacemos es hacer un ajuste de un modelo de distribución, y si lo ejecuta el comando hay que no devuelve nada. Volverán a este sociedad blanco, pero internamente ha generado y lo tiene dentro un objeto que se llama. Jo. Donde da toda la información que me ha generado esta funciona. Aquí en el objeto fijaron que lo primero que aparece es el nombre del vector de dato; alguien te aparentes y aparece la letra, la letra g o para hacer referencia a que el estudio que vamos hace con esta función de aquí es relativa a la distribución Campbell, aunque no lo hubiéramos hecho, el contexto de la chico de al lado y ha hecho una estimación demasiado de verosimilitud, que lo que tenemos que ver es cómo recuperarlo, y aquí tiene que indicar mediante este argumento cuáles son los dos valores iniciales que habéis considerado. Adelanta y lo tenemos que poner tal cual está aquí; si mete landa le llamáis, pues aquí donde pone la andan, le pone aquí en vez de del tal le pone; de para simplificar. Pues aquí tenéis que poner. De aquí está el nombre, cabe fijaba aquí y aquí está el nombre que ha fijado en la primera aproximación del. Anda eso muy importante. No confundan entonces recordando. Necesitamos cabreado paquete. Están indicado en el documento, si no, no podría hacerlo, y del primer paso, generamos un objeto de pueblo que vamos a viviendas, como recuperado es información bien al documento de de r, y aquí he vuelto a hacer el miedo a páginas. Bien claro. Bueno, entonces podemos realizar un gráfico del tiempo, como es el caso, la indemnización normal, no se calcule igual que el caso de la distribución normal. De acuerdo. Técnicamente lo que hace es comprar percentiles de la muestra, como la inversa, la función de distribución del modelo, no dedicar recordaré todo ni nada por el estilo de acuerdo, simplemente porque en el información, entonces, como tenemos ese gráfico, ese cumplo. Bueno, pues resulta que una vez que hoy general, objeto, juste conecte. Con lo que pone de ajuste, la ejecuta ahí y aquí tenemos la quienes superior derecha. El gráfico del cúmulo allí la mayor parte de los datos están alrededor de la línea que aparece. En este caso, solamente unos cuantos de aquí abajo no es tan bien representada. Me acuerdo. Entonces, nosotros lo que tendríamos que hacer sería verificar la, o sea, hay una indicación de que parece ser que los datos de una institución, pero entendemos que hacer nuestro constante como siempre, entonces, lo que vamos a hacer es lo que se conoce como un contracte chip. Podrá contar ajuste aplicado al caso particular, donde la hipótesis nula es que la variable, estamos considerando la lomce, caudal máximo sin una intención grande y como hipótesis alternativa que no ha sido una distribución. Este contraste chico de al lado, permite cambiar, poner aquí un montón de hipótesis, nula podemos hacerlo para la distribución normal, la normal, cualquier modelo que se pueda ocurrir lo podemos utilizar en genética y vamos a ver cómo se puede utilizar este concepto para ver si dos variables que son cualitativas son independiente o no, o para el problema, que se conoce como de homogeneidad, encontrarte muy potente, es una técnica muy general que la adaptaba a problemas particulares técnicos. No lo vamos a ver porque lo vamos a hacer con r y requeriría bastante tiempo y, como ya he comentado antes, en algún momento quien necesita un más información. Sobre ese contraste chico me decir yo lo facilita me acuerdo. Bueno aquí en particular vamos a utilizar para concertar en tanto la hipótesis de aquí cómo puedo recuperar con el estadio ético de este constante chico de radio y su valor muy sencilla, lo tenía instrucciones, conecte con el comando, recuperando el valor del 56 conecte valor de aquí conecta en función de que te comando recuperaba el valor que en este caso 0. Así que volvieran a dar ejemplo, lo que tenemos es que el cuadrado toma este valor y el valor toma esta expresión. De acuerdo, fijaros que tengo hablar muy alto mayor que como cinco con 1, por lo tanto en la evidencia empírica, en contra de la hipótesis, nula la aceptamos cuando cierta y podemos considerar que los datos siguen una distribución alguna encontraría escrito sin cuadrado tan cuán o a veces también lo encontraría escrito en forma de matemáticas como el símbolo, si elevado cuadrado en el documento creo que utilizado en las notaciones para que o acostumbre de acuerdo y ahora las estimaciones de máxima verosimilitud del parámetro también están aquí lo veo que tenéis que hacer. Escribir el nombre del objeto que hemos genera y esto que aparecen aquí ese primer valor sería la estimación del anda, y este aquí sería la estimación, así que tendríamos en nuestro caso qué. Porque no sé si me equivoco aquí. Y luego sí. La cosa entendimiento. Si el primer valor de aquí es delta, no la estimación del sino la estimación del anda y en la estimación del pueblo en corregir el documento. Pero si acaso tuviéramos un eso termino. La lección de hoy

Intervienen

Felix Luis Belzunce Torregrosa

Propietarios

Felix Luis Belzunce Torregrosa

Comentarios

Nuevo comentario

Serie: Estadística (Grado CC. Ambientales) (+información)

Asignatura (1797)

Canal

Tema 7 - Parte II

Verificación de las suposiciones iniciales del ANOVA y comparaciones múltiples de medias