Informações

As atividades devem ser realizadas pelos alunos como efetivação de aprendizado e preparação para as avaliações. Ao passo que o docente assume que as tarefas foram realizadas, os alunos não serão bonificados pela realização das mesmas. Este docente entende que a realização de atividades fora de sala de aula é essencial para a consolidação do aprendizado e que este é um pressuposto dos deveres dos alunos.

Exercícios

  1. Refaça as demonstrações apresentadas na Parte 1 do material de aula;
  2. Demonstre as propriedades dos estimadores de mínimos quadrados para \(\beta_0\) e \(\beta_1\);
  3. Selecione, aleatoriamente, 10 observações do conjunto de dados Galton, disponibilizado pelo pacote UsingR. Para a seleção das observações, utilize o comando set.seed(<RA>) (onde <RA> deve ser substituído pelo seu RA em modo numérico).
    1. Com estas 10 observações, calcule manualmente (usando uma calculadora simples) os estimadores de \(\beta_0\) e \(\beta_1\) e suas variâncias;
    2. Utilize o software R para calcular estas informações utilizando o comando lm() com o mesmo subconjunto de dados (com 10 observações).
    3. Centralize cada uma das variáveis em suas respectivas médias, realize uma regressão simples sem o intercepto. Compare o resultado com aquele obtido em b);
    4. Que transformação você precisa realizar nos dados de forma que o coeficiente angular estimado seja exatamente o coeficiente de correlação? Escreva código em R para isso.
    5. Se a altura (combinada) dos pais for 71 polegadas, qual é a estimativa da altura do filho?
  4. Utilize o software R para ajustar o modelo de regressão linear simples para o conjunto de dados completo. Produza um documento no formato Rmd que:
    1. Carregue os pacotes de interesse;
    2. Apresente funções (criada pelo aluno) para a determinação dos estimadores de \(\beta_0\) e \(\beta_1\) a partir das observações disponibilizadas em UsingR::Galton;
    3. Ajuste o modelo de regressão linear simples utilizando a função lm();
    4. Compare os resultados da função lm() com aqueles obtidos pelas funções criadas pelo aluno;
    5. Apresente um gráfico de dispersão (utilizando o pacote ggplot2) dos dados em questão juntamente com a reta de regressão ajustada (sem utilizar a função geom_smooth);
    6. Se a altura (combinada) dos pais for 71 polegadas, qual é a estimativa da altura do filho? Este resultado difere do da questão anterior? Por quê?
    7. Descreva, para o público leigo, os resultados obtidos.