Exercícios
- Refaça as demonstrações apresentadas na Parte 1 do material de aula;
- Demonstre as propriedades dos estimadores de mínimos quadrados para \(\beta_0\) e \(\beta_1\);
- Selecione, aleatoriamente, 10 observações do conjunto de dados
Galton
, disponibilizado pelo pacote UsingR
. Para a seleção das observações, utilize o comando set.seed(<RA>)
(onde <RA>
deve ser substituído pelo seu RA em modo numérico).
- Com estas 10 observações, calcule manualmente (usando uma calculadora simples) os estimadores de \(\beta_0\) e \(\beta_1\) e suas variâncias;
- Utilize o software R para calcular estas informações utilizando o comando
lm()
com o mesmo subconjunto de dados (com 10 observações).
- Centralize cada uma das variáveis em suas respectivas médias, realize uma regressão simples sem o intercepto. Compare o resultado com aquele obtido em b);
- Que transformação você precisa realizar nos dados de forma que o coeficiente angular estimado seja exatamente o coeficiente de correlação? Escreva código em R para isso.
- Se a altura (combinada) dos pais for 71 polegadas, qual é a estimativa da altura do filho?
- Utilize o software R para ajustar o modelo de regressão linear simples para o conjunto de dados completo. Produza um documento no formato
Rmd
que:
- Carregue os pacotes de interesse;
- Apresente funções (criada pelo aluno) para a determinação dos estimadores de \(\beta_0\) e \(\beta_1\) a partir das observações disponibilizadas em
UsingR::Galton
;
- Ajuste o modelo de regressão linear simples utilizando a função
lm()
;
- Compare os resultados da função
lm()
com aqueles obtidos pelas funções criadas pelo aluno;
- Apresente um gráfico de dispersão (utilizando o pacote
ggplot2
) dos dados em questão juntamente com a reta de regressão ajustada (sem utilizar a função geom_smooth
);
- Se a altura (combinada) dos pais for 71 polegadas, qual é a estimativa da altura do filho? Este resultado difere do da questão anterior? Por quê?
- Descreva, para o público leigo, os resultados obtidos.