Hola, alumnas y alumnos de la
asignatura de Estad铆stica
del grado de Ciencias Ambientales.
Empezamos con este v铆deo la serie
de v铆deos correspondientes
al 煤ltimo tema de la asignatura,
en el que abordaremos el
estudio de relaciones
entre variantes en este estudio.
Distinguir dos casos principalmente.
Vamos a distinguir,
primero el caso de relaciones entre
variables cuantitativas
y despu茅s veremos el
caso de relaciones
entre variables cualitativa
cada d铆a; por tanto,
la mezcla entre las relaciones
entre variables cualitativas
y cuantitativas.
Esto 煤ltimo, se puede hacer
en dos direcciones.
Por un lado, podremos ver c贸mo
afecta a una variable cualitativa,
a una cuantitativa, o al rev茅s,
podr铆amos ver c贸mo afect贸 una
variable cuantitativa
a una variable cualitativa.
El primer caso en realidad
ya lo hemos estudiado
y se tratar铆a de la de la nota.
Del an谩lisis de la danza que
vimos en el tema anterior
esto lo revisaremos m谩s tarde.
Veremos que efectivamente
se trata de ver
c贸mo afecta una variable cualitativa
y cuantitativa
y en el segundo caso el estudio
de una de una relaci贸n
entre una variable cuantitativa
y una variable;
cualitativa en lo que se
conoce como regresi贸n,
log铆stica por cuestiones de tiempo.
Este tema este estudio
de la redes log铆stica no lo podemos
abordar en este tema,
pero ese d铆a digamos el t贸pico
correspondiente
a ese tipo de relaci贸n, bien.
Por tanto los apartados que vamos
a ver dem谩s lo siguiente.
Haremos una breve introducci贸n
al tema que se corresponde
con la secci贸n uno de los apuntes y
despu茅s en una segunda secci贸n
veremos lo que se llama an谩lisis
como an谩lisis de regresi贸n lineal
que se corresponde con la
lectura de relaciones
entre variables cuantitativa.
Esta secci贸n la divide
en tres secciones.
Por un lado tendremos
en la secci贸n dos
uno el estudio del modelo estad铆stico
que moviliza esa relaci贸n entre
variables cuantitativa
y c贸mo se puede hacer inferencias
sobre ese modelo,
la secci贸n de su posici贸n
de linealidad, normalidad
independencia, inferencia
y por otro lado tendremos a dos
secciones adicionales,
que son la verificaci贸n de las
suposiciones iniciales
del modelo de regresi贸n lineal,
que lo haremos a trav茅s
de lo que se conoce
como an谩lisis de los residuos, y
lo abordaremos en la secci贸n
y por 煤ltimo veremos c贸mo
se utiliza este modelo
para la estimaci贸n en prevenci贸n
por un nuevo valor
de que se corresponde con la secci贸n
El tema se cierra con
la secci贸n tercera,
donde veremos con el contacto
de independencia,
c贸mo se analiza la relaci贸n entre
dos variables cualitativas.
Bien, en este v铆deo lo que vamos
a hacer va a ser presentada
esa introducci贸n breve a estudiar
relaciones entre variable
y comenzaremos con el estudio
de relaciones
entre variables cuantitativas
a trav茅s de lo que se conoce como
an谩lisis de regresi贸n lineal.
En concreto lo que veremos es el
modelo estad铆stico que se utiliza
para describir la relaci贸n entre
variable y cuantitativas
bajo lo que se conoce.
Como suposici贸n de linealidad,
normalidad e independencia
en un segundo v铆deo.
Veremos c贸mo se hace inferencia
para este modelo
y en un tercer v铆deo veremos c贸mo se
verifican las posiciones iniciales
y c贸mo se utiliza el modelo para
predecir nuevos valores
de modelo a partir de un nuevo
valor de la variable.
Bien, pues vamos a pasar
a la introducci贸n
como he dicho en este tema iniciamos
uno de los t贸picos considerado
uno de los m谩s interesantes
de la estad铆stica, que es el estudio
de relaciones entre variable
y como he dicho anteriormente
distingue la relaci贸n
entre variables cuantitativa
que comenzaremos a abordar
con el an谩lisis de reducci贸n
lineal simple,
y la relaci贸n entre cualitativa,
que abordaremos con lo que se
conoce como le contrate;
si cuadrado de independencia bien
pues vamos a pasar al an谩lisis
de Regresi贸n bien.
Un problema usual en la estad铆stica
es el estudio de relaciones
funcionales
entre varias variables.
El ajuste de esas relaciones
funcionales.
Con el prop贸sito de predecir
una variable,
a partir de otras es lo que se
conoce con el nombre de an谩lisis
de regresi贸n, qu茅 quiere decir esto?
Del estudio de relaciones
funcionales entre varias variables,
bien fundamentalmente lo que se
trata de intentar ajustar una funci贸n
de tal forma que yo pueda obtener
una variable vamos a llamarle
y a partir de otra variable equis
a trav茅s de esa funci贸n Efe,
que me permite estudiar esa relaci贸n.
Daros cuenta que si yo puedo
establecer esta relaci贸n funcional
entre y yo conociendo el valor de
que puedo predecir el valor de ley,
esto no es un problema nuevo,
puesto que la asignatura de F铆sica
hab茅is visto mucho modelo matem谩tico
que describen relaciones
entre variable.
Lo que ocurre es que este es tu.
Este planteamiento general
donde yo quiero estudiar una
relaci贸n entre una variable
y que en nuestro caso ser谩 continua
frente a una variable que ser谩
una variable num茅rica,
puede ser discreta, puede ser
continuo en esta forma,
o sea intentar encontrar qui茅nes.
Esa funciones es un problema
muy complicado en general,
por lo cual.
Por lo cual, en este tema
lo que vamos a hacer va a ser
abordar un caso m谩s sencillo, que es el caso
en que la variable y se relaciona
con la variable
que a trav茅s de una relaci贸n
lineal es decir,
a trav茅s de una recta y ese estudio
de relaciones lineales
entre dos variable en
lo que se conoce
como an谩lisis de regresi贸n, l铆nea
simple bien, entonces,
siendo m谩s concreto la idea ser铆a
estudiar una relaci贸n
entre la variable y la variable
que tenga esta expresi贸n,
con lo cual lo 煤nico que nos queda
por determinar son los valores de A
y b.
Una vez que yo tenga los valores de
ah铆 deben puede obtener el valor
de conociendo el valor de la equis.
B谩sicamente lo que puedo hacer
es predecir el valor
de ah铆 conociendo el valor
de la crisis.
Este modelo es relativamente
sencillo y en un principio podr铆a parecer
que no ten铆a mucho sentido estudiar
este modelo, tan simple simple,
la raz贸n por la cual se intuye
que hemos sido tan simples
porque en muchas situaciones hay
relaciones lineales entre variable,
con lo cual tiene una
gran organizaci贸n
y la segunda raz贸n es que aunque hay
modelos que no son lineales,
se pueden hacer cambios de variable
y convertirse esas relaciones
a trav茅s del cambio variable
en relaci贸n a la l铆nea,
con lo cual podemos aplicar todo
lo que veamos en este tema
y estudiar esas relaciones
no lineales.
Nosotros no vamos a abordar el tema
de relaciones no lineales,
pero simplemente saber que con
cambio de variable el problema
en algunos casos no lineales,
se produce,
se reduce a un problema
de modelo lineales.
Bien, pues entonces por para
ir fijando anotaci贸n,
se va a entender por an谩lisis
de regresi贸n lineal simple.
El estudio de una relaci贸n lineal
que nos da el valor
de una variable que llamaremos
variable, dependiente en t茅rminos
de una variable equis,
que es lo que llamaremos variable
independiente y claro,
haremos estudio de esa relaci贸n.
En el caso de que exista
esa relaci贸n.
En general para proceder al
estudio de las relaciones
entre dos variables, lo que se hace
usualmente es obtener una serie
de observaciones que no notaremos,
porque sub铆 y sub铆
de esa variable bidimensional.
La forma sencilla de abordar ese
problema es muy, muy f谩cil.
S铆 existiese de verdad una
relaci贸n lineal exacta
entre ambas variable,
茅sta quedar铆a de manifiesto
simplemente dibujando
en el plano lo sub铆 y sui,
puesto que eso parece estar铆a
ali帽ado sobre esa recta
y, como sabe, para conocer el valor
de una recta lo 煤nico que necesit贸
de dos puntos de esa recta recuerdo,
con lo cual, si existiese esa
relaci贸n en un principio exacta
entre la y la equis, yo cojo los
pares de puntos del plan
y puedo sacar cual la red, como
ya he visto en el tema;
segundo de Estad铆stica,
descriptiva de mi variante con
tres pares de puntos;
el la gr谩fica que se construye
pintando esos puntos en el plano,
en lo que se conoce como diagrama
de dispersi贸n o nube de puntos.
As铆 que dado una serie de puntos,
si yo tengo una relaci贸n
lineal exacta,
entrando variable simplemente con
el diagrama de expresi贸n o nube
de puntos, podr铆a obtener cu谩l
es la recta que hay
y que describe la relaci贸n entre
la variable y la variable,
pues para ilustrar esto vamos
a utilizar el siguiente.
En este ejemplo se trata de un
problema de tipo medioambiental
en el cual hay una zona que recibe
el vertido de aguas residuales
de una empresa como saber
las empresas
como parte de su proceso.
Utilizan agua para enfriar el parte
del proceso industrial,
que al final ese agua se suele
verter en alg煤n sitio,
ocurre que en estos vertidos
hay un alto contenido
en lo que se quiere estudiar,
qu茅 relaci贸n hay
entre la cantidad de plomo que lleva
el agua residual que se vierte
y la cantidad de plomo residual que
queda despu茅s de un tiempo.
En ese terreno, y para ello,
pues lleva a cabo un experimento.
Se cogen distintas 谩reas,
se cogen en total 25 谩reas y en
las cuales se vierte agua
con distintas concentraciones
de plomo concentraciones
de plomo que est谩n fijadas de
antemano y posteriormente
se analiza la cantidad
de plomo residual
que cada una de ellas pasaba
un cierto tiempo bien,
los resultados que se obtuvieron
en este experimento
son los que aparecen aqu铆
tenemos por pareja
la cantidad de plomo residual
que llevaba el agua
y despu茅s, la cantidad
de plomo residual
que quedan en el terreno
de un cierto tiempo.
Aqu铆 en estos cinco primeros
pared de puntos.
La cantidad de plomo en el agua,
cero en estos cinco siguientes es 1,
25 en los siguientes cinco dos
con cinco as铆 con valores
de cinco 10 d铆as bien.
Sin necesidad de hacer el diagrama
de impresiona nueve puntos,
en este ejemplo ya se va viendo
que esa relaci贸n lineal exacta
no puede existir.
Por qu茅?
Porque nos encontramos con que para
m铆 los mismos valores de equis
o tenemos distintos valores de ah铆.
Y, sin embargo,
si la relaci贸n lineal fuera exacta
para el mismo valor
de o tendr铆amos siempre
el mismo valor
entonces aqu铆 donde empieza a entrar
en funci贸n la aleatoriedad,
porque estamos viendo que,
aunque yo fije el valor
de que el valor de ah铆 se comporta
de manera aleatoria
y donde tenemos que hacer uso de
la inferencia estad铆stica
para poder analizar este
tipo de situaciones,
bien si hacemos el diagrama de punto
o le impresiona nueve puntos
en este caso fijado,
que la gr谩fica que tenemos
en la que aparece aqu铆
para un mismo valor de la ceoe,
distintos colores de valor
de igual a uno
o creo que era una 25
cosa es distinto,
y as铆 sucesivamente para cada
una de las situaciones.
Luego ejemplo poner en evidencia
que el estudio relaciones
lineales exacta
es complicado, en general
no se suele dar,
hay que hacer una variaci贸n
en ese modelo
que relaciona la y con la equipara
para que pueda abarcar
situaciones que son las que
se dan en la pr谩ctica.
La forma de obtener esta gr谩fica
ya lo hab茅is visto ante quemado
yo lo voy a recuperar aqu铆
para hacer el an谩lisis.
Entonces vamos a tener nuestro lector
de que nuestro vector de ah铆 fijar谩
que es muy importante,
que identifiquen qui茅n
es la variable.
Por lo tanto, no independiente
y quienes la variable y por qu茅
la variable dependiente.
Puesto que la idea al final
el objetivo 煤ltimo que nosotros
vamos a pretender
con el an谩lisis de regresi贸n
lineal simple es
intentar saber cu谩nto vale la a
partir de un valor de Laiki.
Es cierto que ya sabemos de ejemplo
que a煤n con la misma valor
de que puedo obtener distintos,
balones de todo,
al final lo que pretendemos era dar
un intervalo de posible palo
desde cada vez que fije un valor.
Pero esto es una cuesti贸n que
abordaremos m谩s adelante al final
de esta tanda.
De momento simplemente
tenemos dos vectores
y con esta instrucci贸n podemos
generar el diagrama de inversi贸n
a nueve puntos que hemos considerado
anteriormente,
donde efectivamente se ve que
no hay una relaci贸n lineal.
Entonces, qu茅 modelo podemos
utilizar para intentar predecir los valores
de la y, en funci贸n de qu茅?
Bueno, pues para eso voy a hacer
uso de un ejemplo ficticio,
al que ve la idea que hay dentro
del modelo alternativo
que se propone.
La idea que hay detr谩s de todo esto
es que cuando yo fij贸 un valor de
por ejemplo equis igual a cinco
en realidad al valor que se obtiene
a trav茅s de la recta
en ese punto cinco es decir
al valor a b por cinco
se les sum贸 una cantidad
que es aleatoria,
que puede ser tanto positiva
como negativa
y que estropea la linealidad.
Cuando yo tengo el valor a m谩s
de cinco a ese panorama
de cinco se le suma una cantidad
de la historia,
y esa cantidad aleatoria que yo
no puedo controlar puede
ser positiva o negativa,
con lo cual el punto se desplaza
o por encima de la recta
o por debajo de la red y por tanto
se estropea la relaci贸n
y vamos a ver esa idea con
el ejemplo de ficticio
que dicho vamos a considerar.
Esta situaci贸n, en la cual yo tengo
una serie de punto de acuerdo
y va a considerar que yo tuviera
una relaci贸n lineal exacta
entre una variable que y una
variable es decir, para cada valor de la equis
a trav茅s de la recta y obtendr铆a
los correspondientes punto,
la idea en la siguiente.
La idea es que en vez de obtener en
la pr谩ctica ese valor exacto
sobre la recta lo que va ocurriendo
en lo siguiente,
y es que cada punto se eleva sumando
o restando una cantidad que a veces
es positiva y a veces negativa
que les place
el punto o por debajo compone
encima de la recta,
con lo cual la situaci贸n que yo
observo excepto aqu铆 y por lo tanto
no se ve una relaci贸n lineal
exacta entre la pareja.
Volviendo a nuestro transparencia,
resumiendo lo que hemos dicho hasta
ahora, el primer punto es
observar que los puntos no se hallan
perfectamente alineadas con una recta
aunque s铆 que presentan una
tendencia aproximadamente lineal.
Guardo como ejemplo no hay
una relaci贸n lineal,
exacta pero no puntos al estar
alrededor de la recta
presentar una cierta tendencia l铆nea.
La siguiente cuesti贸n es que
esa falta de linealidad
se produce por la presencia
de errores de medici贸n,
factores experimentales,
etc, etc. Que son aleatorio
y que producen,
que la relaci贸n lineal no sea exacta,
luego aqu铆 entra la aleatoriedad y
por lo tanto hemos de proponer
otro modelo que no sea la
relaci贸n lineal exacta
que describa mejor esta situaci贸n.
Entonces la idea es proponer un
modelo para esa variable,
esos valores observados de ley,
de acuerdo que describa mejor
que lo que estamos viendo
en la pr谩ctica, y una vez
que tengamos ese modelo
propuesto lo que haremos ser谩 hacer
inferencias sobre ese modelo,
porque el modelo estar谩
caracterizado por unos par谩metros
que en un principio son desconocidos
y eso lo cuales nosotros pretendemos
obtener informaci贸n a partir
de las parejas de padres
de puntos equis,
uvi y su entonces volviendo
al ejemplo.
La idea es que cuando yo tengo
un valor de equis
a ese valor de equis se le asocie
un bal贸n en la recta
por ejemplo en igual a la sociedad
muestra el valor por tres
ya se valoraba Deportes,
se les sum贸 una cantidad
que por ejemplo
en este caso es positiva.
De car谩cter aleatorio que
desplaza el punto
o por encima o por debajo de la red.
En concreto, y procediendo
a formalizar esa idea,
el modelo que se propone
es el siguiente,
y este modelo que se propone
constituyen
la suposici贸n de linealidad
normalidad e independencia
de un problema de an谩lisis
de reversi贸n lineal,
si entonces las suposiciones
que se hacen
son la siguiente.
Los valores son aleatorio,
de acuerdo son observaciones
de una variable velatorio
que verifica la siguiente relaci贸n.
Con los valores equis
sub铆 la variable
y sub铆 de la forma ham谩s ve, es
decir una relaci贸n l铆nea
con la variable m谩s un t茅rmino
que es el t茅rmino aleatorio,
que se suma y se recta seg煤n
sea positivo o negativo.
Entonces en esta relaci贸n entre la
variable y la variable equis
tienen primero que los
valores de Ipswich
son valores fijo.
Recordar que el experimento fijamos
valores de igual a 0,
igual a un 25, dos con cinco creo
que era cinco 10 de acuerdo.
Entonces aqu铆 hay unos
valores que fija
el experimentado Bale a
esa relaci贸n lineal,
se suma un t茅rmino Epsilon.
Sub铆 y ese t茅rmino Epsilon Subi
que estropea la l铆nea.
La linealidad,
lo que hacemos considerar, que
es una maniobra dilatoria
que tiene para empezar
distribuci贸n normal.
Adem谩s esos t茅rminos
que se van sumando se generan
de manera independiente,
no hay ninguna relaci贸n entre
los Epsilon su pie
para un equipo y para otro distinto
y adem谩s esa distribuci贸n normal
que la media y danza constante
sin m谩s cuadra.
Este conjunto de hip贸tesis
es lo que se llama
la hip贸tesis de normalidad,
independencia emocional,
actividad.
Este domingo le he obviado el inicio
del de la transparencia para no
hacerlo mucho m谩s largo,
pero esta hip贸tesis de
voces que hiciera,
es decir que todos los
valores de Epsilon
tiene la misma es algo que ya
apareci贸 en el tema de Anova
y por otro lado que la relaci贸n
entre la isla
y que esta relaci贸n lineal lo
que se llama la hip贸tesis
de lo que tenemos una relaci贸n
lineal m谩s un t茅rmino Epsilon Subi,
que es un t茅rmino aleatorio,
con distribuci贸n normal
de medio hacer y constante.
Sin en realidad esta hip贸tesis
se puede reescribir de manera
mucho m谩s sencilla,
de acuerdo antes de proceder a
la reescritura m谩s sencilla
y resumiendo lo que hemos
dicho anteriormente.
Lo que entendemos que es la variable
y se compone como una relaci贸n lineal
a trav茅s de los episodios
y un factor que hace
que la relaci贸n lineal no sea exacta,
y eso termin贸 que hacen y que
estropean esa relaci贸n lineal
exacta en lo que se conoce
como residuo o error.
Posteriormente recuperaremos el
residuo en una secci贸n posterior.
Entonces, como dec铆a, toda
estas suposiciones
que aparecen aqu铆 se puede
reescribir de manera m谩s sencilla,
como parece, y es que en realidad lo
anterior es equivalente a decir
que la variable, y sui son
su emocionante variable
y su mayor cola, que tienen
distribuci贸n normal,
que son independientes y que
verifican que la esperanza
de la variable, de la forma de
subir y la danza de Sui
que cuadrado.
Vamos a ver gr谩ficamente esta idea.
Entonces, para ver gr谩ficamente
esa idea,
la cuesti贸n m谩s en la siguiente, y
es que para cada valor de equis
yo observo una poblaci贸n de valores
y que sigue una distribuci贸n norma,
es decir, que es igual a 1.
Por ejemplo, yo tengo asociada una
distribuci贸n norma como variable
y ahora lo que hago es observar
uno o varios valores.
Como ejemplo de esa variable,
con distribuci贸n anual,
por ejemplo, en este caso este
es el bal贸n que observ贸
para igualados observ贸 ahora la ley,
y lo que ocurre es que la variable
y tiene una distribuci贸n normal
observ贸 un valor de esa
variable normal.
Lo mismo ocurre para que
es igual a tres equis,
igual a cuando yo quise a 5.
Ya la caracter铆stica que tienen
estas variables normales
es que la media de la variable
se corresponde con el valor;
por ejemplo, se corresponder铆a
con ama de por all铆;
se corresponder铆a con Ham谩s de por
dos a m谩s de 3, cuatro 5.
La apariencia,
como observan en estos 5, caso,
son iguales y, por otro lado,
tenemos que las observaciones
que aparecen aqu铆
son independientes.
No tiene ninguna relaci贸n.
La observaci贸n en este caso con
la observaci贸n en este caso
y para cualquier posible pareja
y conjunto de observaciones
que quer茅is.
Considera entonces la
idea fundamental
que tiene que quedar gravemente
esta relaci贸n de la variable
y respecto de la variable ha fijado
que la variable que est谩 fijada
por el experimentado
y lo que es aleatorio es el
valor y que yo observo
a partir de esa variable y lo
que decimos en este modelo
de linealidad y independencia
y linealidad,
es que la variable y tiene esta
forma tiene distribuci贸n normal.
La media va variando de una recta
en relaci贸n con la equis
y la apariencia son costa.
Qu茅 es lo que ocurre ahora?
En nuestro caso lo que ocurre ahora
es que nosotros no sabemos c贸mo se
comportan esas variables normales
ni tampoco sabemos qui茅nes la
recta y lo que pretendemos
es recuperar toda la informaci贸n
de esta estructura
que describe el conjunto de datos
a partir de este conjunto
de observaci贸n y eso
es lo que pretendemos desarrollar
en la parte diferencia.
Por lo tanto y volviendo
a la transparencia.
Fijamos que en este modelo no
se hace ninguna suposici贸n
sobre la naturaleza aleatoria
de los datos que soy
y se consideran valores que
est谩n fijados previamente
por el investigador.
Es cierto que en algunos estudios
el valor de la variable se genera
de manera aleatoria,
pero lo importante es que ese
valor se genere previamente
a la observaci贸n del valor de
la variable, por ejemplo,
y recuperando el primer estudio
de an谩lisis de regresi贸n
realizado en la historia
por el cient铆fico,
hizo un estudio donde analiz贸
la relaci贸n entre la altura
de los hijos con la altura
de los padres.
Consider贸 como variable aleatoria
dependiente,
altura del hijo y como variable
independiente.
La altura del padre lo que pretend铆a
era predecir la altura de un hijo,
a partir de la altura del padre,
cogi贸 una serie de familia de
acuerdo donde anot贸 la altura del padre,
y despu茅s pudo apuntar cu谩les eran
las alturas de los hijos.
Evidentemente, en esa lecci贸n
de familia aleatoria
茅l no pod铆a fijar cu谩l era
la altura del padre,
pero desde el punto de vista
del experimento
el valor de la altura del
padre estaba prefijado,
antes de observarse la
altura de los hijos.
En el tiempo, el valor de la Ekhi
precede al valor de ley.
Luego en esa situaci贸n
es donde podamos considerar una
un estudio de ese tipo
donde la variable que precede
al valor de ley
podremos aplicar este modelo;
consideraremos que el valor de aqu铆
est谩 fijado antes del de la
variable, y y la idea es simplemente
c贸mo podemos obtener informaci贸n
del par谩metro del par谩metro b
e impl铆citamente tambi茅n
de Sigma Cuadra,
fijaron que esos son los cuatro
elementos que determinan
los cuatro elementos que determinan
el los tres elementos
que determinan el en nuestro.
Nuestro estudio vale.
Lo que ocurre es que eso par谩metros
no nos conocemos,
lo que queremos hacer es recuperarlo.
Bien.
Eso es lo que abordaremos
en el siguiente v铆deo,
que sea el v铆deo correspondiente
a la influencia
en el modelo de regresi贸n lineal.
Si un saludo cerramos aqu铆 y
continuamos en el siguiente v铆deo.