Idioma: Espa帽ol
Fecha: Subida: 2020-05-04T00:00:00+02:00
Duraci贸n: 26m 28s
Lugar: OnLine - Online
Lugar: Curso
Visitas: 1.599 visitas

Tema 8 - Parte I

Introducci贸n al an谩lisis de regresi贸n lineal simple

Descripci贸n

En este video se hace una introducción, través de ejemplos, del modelo estadístico que se utiliza en el análisis de regresión lineal simple.

Transcripci贸n (generada autom谩ticamente)

Hola, alumnas y alumnos de la asignatura de Estad铆stica del grado de Ciencias Ambientales. Empezamos con este v铆deo la serie de v铆deos correspondientes al 煤ltimo tema de la asignatura, en el que abordaremos el estudio de relaciones entre variantes en este estudio. Distinguir dos casos principalmente. Vamos a distinguir, primero el caso de relaciones entre variables cuantitativas y despu茅s veremos el caso de relaciones entre variables cualitativa cada d铆a; por tanto, la mezcla entre las relaciones entre variables cualitativas y cuantitativas. Esto 煤ltimo, se puede hacer en dos direcciones. Por un lado, podremos ver c贸mo afecta a una variable cualitativa, a una cuantitativa, o al rev茅s, podr铆amos ver c贸mo afect贸 una variable cuantitativa a una variable cualitativa. El primer caso en realidad ya lo hemos estudiado y se tratar铆a de la de la nota. Del an谩lisis de la danza que vimos en el tema anterior esto lo revisaremos m谩s tarde. Veremos que efectivamente se trata de ver c贸mo afecta una variable cualitativa y cuantitativa y en el segundo caso el estudio de una de una relaci贸n entre una variable cuantitativa y una variable; cualitativa en lo que se conoce como regresi贸n, log铆stica por cuestiones de tiempo. Este tema este estudio de la redes log铆stica no lo podemos abordar en este tema, pero ese d铆a digamos el t贸pico correspondiente a ese tipo de relaci贸n, bien. Por tanto los apartados que vamos a ver dem谩s lo siguiente. Haremos una breve introducci贸n al tema que se corresponde con la secci贸n uno de los apuntes y despu茅s en una segunda secci贸n veremos lo que se llama an谩lisis como an谩lisis de regresi贸n lineal que se corresponde con la lectura de relaciones entre variables cuantitativa. Esta secci贸n la divide en tres secciones. Por un lado tendremos en la secci贸n dos uno el estudio del modelo estad铆stico que moviliza esa relaci贸n entre variables cuantitativa y c贸mo se puede hacer inferencias sobre ese modelo, la secci贸n de su posici贸n de linealidad, normalidad independencia, inferencia y por otro lado tendremos a dos secciones adicionales, que son la verificaci贸n de las suposiciones iniciales del modelo de regresi贸n lineal, que lo haremos a trav茅s de lo que se conoce como an谩lisis de los residuos, y lo abordaremos en la secci贸n y por 煤ltimo veremos c贸mo se utiliza este modelo para la estimaci贸n en prevenci贸n por un nuevo valor de que se corresponde con la secci贸n El tema se cierra con la secci贸n tercera, donde veremos con el contacto de independencia, c贸mo se analiza la relaci贸n entre dos variables cualitativas. Bien, en este v铆deo lo que vamos a hacer va a ser presentada esa introducci贸n breve a estudiar relaciones entre variable y comenzaremos con el estudio de relaciones entre variables cuantitativas a trav茅s de lo que se conoce como an谩lisis de regresi贸n lineal. En concreto lo que veremos es el modelo estad铆stico que se utiliza para describir la relaci贸n entre variable y cuantitativas bajo lo que se conoce. Como suposici贸n de linealidad, normalidad e independencia en un segundo v铆deo. Veremos c贸mo se hace inferencia para este modelo y en un tercer v铆deo veremos c贸mo se verifican las posiciones iniciales y c贸mo se utiliza el modelo para predecir nuevos valores de modelo a partir de un nuevo valor de la variable. Bien, pues vamos a pasar a la introducci贸n como he dicho en este tema iniciamos uno de los t贸picos considerado uno de los m谩s interesantes de la estad铆stica, que es el estudio de relaciones entre variable y como he dicho anteriormente distingue la relaci贸n entre variables cuantitativa que comenzaremos a abordar con el an谩lisis de reducci贸n lineal simple, y la relaci贸n entre cualitativa, que abordaremos con lo que se conoce como le contrate; si cuadrado de independencia bien pues vamos a pasar al an谩lisis de Regresi贸n bien. Un problema usual en la estad铆stica es el estudio de relaciones funcionales entre varias variables. El ajuste de esas relaciones funcionales. Con el prop贸sito de predecir una variable, a partir de otras es lo que se conoce con el nombre de an谩lisis de regresi贸n, qu茅 quiere decir esto? Del estudio de relaciones funcionales entre varias variables, bien fundamentalmente lo que se trata de intentar ajustar una funci贸n de tal forma que yo pueda obtener una variable vamos a llamarle y a partir de otra variable equis a trav茅s de esa funci贸n Efe, que me permite estudiar esa relaci贸n. Daros cuenta que si yo puedo establecer esta relaci贸n funcional entre y yo conociendo el valor de que puedo predecir el valor de ley, esto no es un problema nuevo, puesto que la asignatura de F铆sica hab茅is visto mucho modelo matem谩tico que describen relaciones entre variable. Lo que ocurre es que este es tu. Este planteamiento general donde yo quiero estudiar una relaci贸n entre una variable y que en nuestro caso ser谩 continua frente a una variable que ser谩 una variable num茅rica, puede ser discreta, puede ser continuo en esta forma, o sea intentar encontrar qui茅nes. Esa funciones es un problema muy complicado en general, por lo cual. Por lo cual, en este tema lo que vamos a hacer va a ser abordar un caso m谩s sencillo, que es el caso en que la variable y se relaciona con la variable que a trav茅s de una relaci贸n lineal es decir, a trav茅s de una recta y ese estudio de relaciones lineales entre dos variable en lo que se conoce como an谩lisis de regresi贸n, l铆nea simple bien, entonces, siendo m谩s concreto la idea ser铆a estudiar una relaci贸n entre la variable y la variable que tenga esta expresi贸n, con lo cual lo 煤nico que nos queda por determinar son los valores de A y b. Una vez que yo tenga los valores de ah铆 deben puede obtener el valor de conociendo el valor de la equis. B谩sicamente lo que puedo hacer es predecir el valor de ah铆 conociendo el valor de la crisis. Este modelo es relativamente sencillo y en un principio podr铆a parecer que no ten铆a mucho sentido estudiar este modelo, tan simple simple, la raz贸n por la cual se intuye que hemos sido tan simples porque en muchas situaciones hay relaciones lineales entre variable, con lo cual tiene una gran organizaci贸n y la segunda raz贸n es que aunque hay modelos que no son lineales, se pueden hacer cambios de variable y convertirse esas relaciones a trav茅s del cambio variable en relaci贸n a la l铆nea, con lo cual podemos aplicar todo lo que veamos en este tema y estudiar esas relaciones no lineales. Nosotros no vamos a abordar el tema de relaciones no lineales, pero simplemente saber que con cambio de variable el problema en algunos casos no lineales, se produce, se reduce a un problema de modelo lineales. Bien, pues entonces por para ir fijando anotaci贸n, se va a entender por an谩lisis de regresi贸n lineal simple. El estudio de una relaci贸n lineal que nos da el valor de una variable que llamaremos variable, dependiente en t茅rminos de una variable equis, que es lo que llamaremos variable independiente y claro, haremos estudio de esa relaci贸n. En el caso de que exista esa relaci贸n. En general para proceder al estudio de las relaciones entre dos variables, lo que se hace usualmente es obtener una serie de observaciones que no notaremos, porque sub铆 y sub铆 de esa variable bidimensional. La forma sencilla de abordar ese problema es muy, muy f谩cil. S铆 existiese de verdad una relaci贸n lineal exacta entre ambas variable, 茅sta quedar铆a de manifiesto simplemente dibujando en el plano lo sub铆 y sui, puesto que eso parece estar铆a ali帽ado sobre esa recta y, como sabe, para conocer el valor de una recta lo 煤nico que necesit贸 de dos puntos de esa recta recuerdo, con lo cual, si existiese esa relaci贸n en un principio exacta entre la y la equis, yo cojo los pares de puntos del plan y puedo sacar cual la red, como ya he visto en el tema; segundo de Estad铆stica, descriptiva de mi variante con tres pares de puntos; el la gr谩fica que se construye pintando esos puntos en el plano, en lo que se conoce como diagrama de dispersi贸n o nube de puntos. As铆 que dado una serie de puntos, si yo tengo una relaci贸n lineal exacta, entrando variable simplemente con el diagrama de expresi贸n o nube de puntos, podr铆a obtener cu谩l es la recta que hay y que describe la relaci贸n entre la variable y la variable, pues para ilustrar esto vamos a utilizar el siguiente. En este ejemplo se trata de un problema de tipo medioambiental en el cual hay una zona que recibe el vertido de aguas residuales de una empresa como saber las empresas como parte de su proceso. Utilizan agua para enfriar el parte del proceso industrial, que al final ese agua se suele verter en alg煤n sitio, ocurre que en estos vertidos hay un alto contenido en lo que se quiere estudiar, qu茅 relaci贸n hay entre la cantidad de plomo que lleva el agua residual que se vierte y la cantidad de plomo residual que queda despu茅s de un tiempo. En ese terreno, y para ello, pues lleva a cabo un experimento. Se cogen distintas 谩reas, se cogen en total 25 谩reas y en las cuales se vierte agua con distintas concentraciones de plomo concentraciones de plomo que est谩n fijadas de antemano y posteriormente se analiza la cantidad de plomo residual que cada una de ellas pasaba un cierto tiempo bien, los resultados que se obtuvieron en este experimento son los que aparecen aqu铆 tenemos por pareja la cantidad de plomo residual que llevaba el agua y despu茅s, la cantidad de plomo residual que quedan en el terreno de un cierto tiempo. Aqu铆 en estos cinco primeros pared de puntos. La cantidad de plomo en el agua, cero en estos cinco siguientes es 1, 25 en los siguientes cinco dos con cinco as铆 con valores de cinco 10 d铆as bien. Sin necesidad de hacer el diagrama de impresiona nueve puntos, en este ejemplo ya se va viendo que esa relaci贸n lineal exacta no puede existir. Por qu茅? Porque nos encontramos con que para m铆 los mismos valores de equis o tenemos distintos valores de ah铆. Y, sin embargo, si la relaci贸n lineal fuera exacta para el mismo valor de o tendr铆amos siempre el mismo valor entonces aqu铆 donde empieza a entrar en funci贸n la aleatoriedad, porque estamos viendo que, aunque yo fije el valor de que el valor de ah铆 se comporta de manera aleatoria y donde tenemos que hacer uso de la inferencia estad铆stica para poder analizar este tipo de situaciones, bien si hacemos el diagrama de punto o le impresiona nueve puntos en este caso fijado, que la gr谩fica que tenemos en la que aparece aqu铆 para un mismo valor de la ceoe, distintos colores de valor de igual a uno o creo que era una 25 cosa es distinto, y as铆 sucesivamente para cada una de las situaciones. Luego ejemplo poner en evidencia que el estudio relaciones lineales exacta es complicado, en general no se suele dar, hay que hacer una variaci贸n en ese modelo que relaciona la y con la equipara para que pueda abarcar situaciones que son las que se dan en la pr谩ctica. La forma de obtener esta gr谩fica ya lo hab茅is visto ante quemado yo lo voy a recuperar aqu铆 para hacer el an谩lisis. Entonces vamos a tener nuestro lector de que nuestro vector de ah铆 fijar谩 que es muy importante, que identifiquen qui茅n es la variable. Por lo tanto, no independiente y quienes la variable y por qu茅 la variable dependiente. Puesto que la idea al final el objetivo 煤ltimo que nosotros vamos a pretender con el an谩lisis de regresi贸n lineal simple es intentar saber cu谩nto vale la a partir de un valor de Laiki. Es cierto que ya sabemos de ejemplo que a煤n con la misma valor de que puedo obtener distintos, balones de todo, al final lo que pretendemos era dar un intervalo de posible palo desde cada vez que fije un valor. Pero esto es una cuesti贸n que abordaremos m谩s adelante al final de esta tanda. De momento simplemente tenemos dos vectores y con esta instrucci贸n podemos generar el diagrama de inversi贸n a nueve puntos que hemos considerado anteriormente, donde efectivamente se ve que no hay una relaci贸n lineal. Entonces, qu茅 modelo podemos utilizar para intentar predecir los valores de la y, en funci贸n de qu茅? Bueno, pues para eso voy a hacer uso de un ejemplo ficticio, al que ve la idea que hay dentro del modelo alternativo que se propone. La idea que hay detr谩s de todo esto es que cuando yo fij贸 un valor de por ejemplo equis igual a cinco en realidad al valor que se obtiene a trav茅s de la recta en ese punto cinco es decir al valor a b por cinco se les sum贸 una cantidad que es aleatoria, que puede ser tanto positiva como negativa y que estropea la linealidad. Cuando yo tengo el valor a m谩s de cinco a ese panorama de cinco se le suma una cantidad de la historia, y esa cantidad aleatoria que yo no puedo controlar puede ser positiva o negativa, con lo cual el punto se desplaza o por encima de la recta o por debajo de la red y por tanto se estropea la relaci贸n y vamos a ver esa idea con el ejemplo de ficticio que dicho vamos a considerar. Esta situaci贸n, en la cual yo tengo una serie de punto de acuerdo y va a considerar que yo tuviera una relaci贸n lineal exacta entre una variable que y una variable es decir, para cada valor de la equis a trav茅s de la recta y obtendr铆a los correspondientes punto, la idea en la siguiente. La idea es que en vez de obtener en la pr谩ctica ese valor exacto sobre la recta lo que va ocurriendo en lo siguiente, y es que cada punto se eleva sumando o restando una cantidad que a veces es positiva y a veces negativa que les place el punto o por debajo compone encima de la recta, con lo cual la situaci贸n que yo observo excepto aqu铆 y por lo tanto no se ve una relaci贸n lineal exacta entre la pareja. Volviendo a nuestro transparencia, resumiendo lo que hemos dicho hasta ahora, el primer punto es observar que los puntos no se hallan perfectamente alineadas con una recta aunque s铆 que presentan una tendencia aproximadamente lineal. Guardo como ejemplo no hay una relaci贸n lineal, exacta pero no puntos al estar alrededor de la recta presentar una cierta tendencia l铆nea. La siguiente cuesti贸n es que esa falta de linealidad se produce por la presencia de errores de medici贸n, factores experimentales, etc, etc. Que son aleatorio y que producen, que la relaci贸n lineal no sea exacta, luego aqu铆 entra la aleatoriedad y por lo tanto hemos de proponer otro modelo que no sea la relaci贸n lineal exacta que describa mejor esta situaci贸n. Entonces la idea es proponer un modelo para esa variable, esos valores observados de ley, de acuerdo que describa mejor que lo que estamos viendo en la pr谩ctica, y una vez que tengamos ese modelo propuesto lo que haremos ser谩 hacer inferencias sobre ese modelo, porque el modelo estar谩 caracterizado por unos par谩metros que en un principio son desconocidos y eso lo cuales nosotros pretendemos obtener informaci贸n a partir de las parejas de padres de puntos equis, uvi y su entonces volviendo al ejemplo. La idea es que cuando yo tengo un valor de equis a ese valor de equis se le asocie un bal贸n en la recta por ejemplo en igual a la sociedad muestra el valor por tres ya se valoraba Deportes, se les sum贸 una cantidad que por ejemplo en este caso es positiva. De car谩cter aleatorio que desplaza el punto o por encima o por debajo de la red. En concreto, y procediendo a formalizar esa idea, el modelo que se propone es el siguiente, y este modelo que se propone constituyen la suposici贸n de linealidad normalidad e independencia de un problema de an谩lisis de reversi贸n lineal, si entonces las suposiciones que se hacen son la siguiente. Los valores son aleatorio, de acuerdo son observaciones de una variable velatorio que verifica la siguiente relaci贸n. Con los valores equis sub铆 la variable y sub铆 de la forma ham谩s ve, es decir una relaci贸n l铆nea con la variable m谩s un t茅rmino que es el t茅rmino aleatorio, que se suma y se recta seg煤n sea positivo o negativo. Entonces en esta relaci贸n entre la variable y la variable equis tienen primero que los valores de Ipswich son valores fijo. Recordar que el experimento fijamos valores de igual a 0, igual a un 25, dos con cinco creo que era cinco 10 de acuerdo. Entonces aqu铆 hay unos valores que fija el experimentado Bale a esa relaci贸n lineal, se suma un t茅rmino Epsilon. Sub铆 y ese t茅rmino Epsilon Subi que estropea la l铆nea. La linealidad, lo que hacemos considerar, que es una maniobra dilatoria que tiene para empezar distribuci贸n normal. Adem谩s esos t茅rminos que se van sumando se generan de manera independiente, no hay ninguna relaci贸n entre los Epsilon su pie para un equipo y para otro distinto y adem谩s esa distribuci贸n normal que la media y danza constante sin m谩s cuadra. Este conjunto de hip贸tesis es lo que se llama la hip贸tesis de normalidad, independencia emocional, actividad. Este domingo le he obviado el inicio del de la transparencia para no hacerlo mucho m谩s largo, pero esta hip贸tesis de voces que hiciera, es decir que todos los valores de Epsilon tiene la misma es algo que ya apareci贸 en el tema de Anova y por otro lado que la relaci贸n entre la isla y que esta relaci贸n lineal lo que se llama la hip贸tesis de lo que tenemos una relaci贸n lineal m谩s un t茅rmino Epsilon Subi, que es un t茅rmino aleatorio, con distribuci贸n normal de medio hacer y constante. Sin en realidad esta hip贸tesis se puede reescribir de manera mucho m谩s sencilla, de acuerdo antes de proceder a la reescritura m谩s sencilla y resumiendo lo que hemos dicho anteriormente. Lo que entendemos que es la variable y se compone como una relaci贸n lineal a trav茅s de los episodios y un factor que hace que la relaci贸n lineal no sea exacta, y eso termin贸 que hacen y que estropean esa relaci贸n lineal exacta en lo que se conoce como residuo o error. Posteriormente recuperaremos el residuo en una secci贸n posterior. Entonces, como dec铆a, toda estas suposiciones que aparecen aqu铆 se puede reescribir de manera m谩s sencilla, como parece, y es que en realidad lo anterior es equivalente a decir que la variable, y sui son su emocionante variable y su mayor cola, que tienen distribuci贸n normal, que son independientes y que verifican que la esperanza de la variable, de la forma de subir y la danza de Sui que cuadrado. Vamos a ver gr谩ficamente esta idea. Entonces, para ver gr谩ficamente esa idea, la cuesti贸n m谩s en la siguiente, y es que para cada valor de equis yo observo una poblaci贸n de valores y que sigue una distribuci贸n norma, es decir, que es igual a 1. Por ejemplo, yo tengo asociada una distribuci贸n norma como variable y ahora lo que hago es observar uno o varios valores. Como ejemplo de esa variable, con distribuci贸n anual, por ejemplo, en este caso este es el bal贸n que observ贸 para igualados observ贸 ahora la ley, y lo que ocurre es que la variable y tiene una distribuci贸n normal observ贸 un valor de esa variable normal. Lo mismo ocurre para que es igual a tres equis, igual a cuando yo quise a 5. Ya la caracter铆stica que tienen estas variables normales es que la media de la variable se corresponde con el valor; por ejemplo, se corresponder铆a con ama de por all铆; se corresponder铆a con Ham谩s de por dos a m谩s de 3, cuatro 5. La apariencia, como observan en estos 5, caso, son iguales y, por otro lado, tenemos que las observaciones que aparecen aqu铆 son independientes. No tiene ninguna relaci贸n. La observaci贸n en este caso con la observaci贸n en este caso y para cualquier posible pareja y conjunto de observaciones que quer茅is. Considera entonces la idea fundamental que tiene que quedar gravemente esta relaci贸n de la variable y respecto de la variable ha fijado que la variable que est谩 fijada por el experimentado y lo que es aleatorio es el valor y que yo observo a partir de esa variable y lo que decimos en este modelo de linealidad y independencia y linealidad, es que la variable y tiene esta forma tiene distribuci贸n normal. La media va variando de una recta en relaci贸n con la equis y la apariencia son costa. Qu茅 es lo que ocurre ahora? En nuestro caso lo que ocurre ahora es que nosotros no sabemos c贸mo se comportan esas variables normales ni tampoco sabemos qui茅nes la recta y lo que pretendemos es recuperar toda la informaci贸n de esta estructura que describe el conjunto de datos a partir de este conjunto de observaci贸n y eso es lo que pretendemos desarrollar en la parte diferencia. Por lo tanto y volviendo a la transparencia. Fijamos que en este modelo no se hace ninguna suposici贸n sobre la naturaleza aleatoria de los datos que soy y se consideran valores que est谩n fijados previamente por el investigador. Es cierto que en algunos estudios el valor de la variable se genera de manera aleatoria, pero lo importante es que ese valor se genere previamente a la observaci贸n del valor de la variable, por ejemplo, y recuperando el primer estudio de an谩lisis de regresi贸n realizado en la historia por el cient铆fico, hizo un estudio donde analiz贸 la relaci贸n entre la altura de los hijos con la altura de los padres. Consider贸 como variable aleatoria dependiente, altura del hijo y como variable independiente. La altura del padre lo que pretend铆a era predecir la altura de un hijo, a partir de la altura del padre, cogi贸 una serie de familia de acuerdo donde anot贸 la altura del padre, y despu茅s pudo apuntar cu谩les eran las alturas de los hijos. Evidentemente, en esa lecci贸n de familia aleatoria 茅l no pod铆a fijar cu谩l era la altura del padre, pero desde el punto de vista del experimento el valor de la altura del padre estaba prefijado, antes de observarse la altura de los hijos. En el tiempo, el valor de la Ekhi precede al valor de ley. Luego en esa situaci贸n es donde podamos considerar una un estudio de ese tipo donde la variable que precede al valor de ley podremos aplicar este modelo; consideraremos que el valor de aqu铆 est谩 fijado antes del de la variable, y y la idea es simplemente c贸mo podemos obtener informaci贸n del par谩metro del par谩metro b e impl铆citamente tambi茅n de Sigma Cuadra, fijaron que esos son los cuatro elementos que determinan los cuatro elementos que determinan el los tres elementos que determinan el en nuestro. Nuestro estudio vale. Lo que ocurre es que eso par谩metros no nos conocemos, lo que queremos hacer es recuperarlo. Bien. Eso es lo que abordaremos en el siguiente v铆deo, que sea el v铆deo correspondiente a la influencia en el modelo de regresi贸n lineal. Si un saludo cerramos aqu铆 y continuamos en el siguiente v铆deo.

Intervienen

Felix Luis Belzunce Torregrosa

Propietarios

Felix Luis Belzunce Torregrosa

Comentarios

Nuevo comentario

Serie: Estad铆stica (Grado CC. Ambientales) (+informaci贸n)

Asignatura (1797)

Canal

Tema 5 - Parte VIII

Inferencia estad铆stica para analizar la probabilidad o proporci贸n de un suceso

Canal

Tema 7 - Parte II

Verificaci贸n de las suposiciones iniciales del ANOVA y comparaciones m煤ltiples de medias