Linearizar uma relação linear, em casos que a suposição de normalidade dos erros com variância constante é adequada .
Tentar encontrar transformação em \(X\).
Avaliar os gráficos de resÃduo para decidir qual a melhor transformação.
\(X\): número de dias de treinamento recebido.
\(Y\): performance nas vendas.
## Days Performance ## 1 0.5 42.5 ## 2 0.5 50.6 ## 3 1.0 68.5 ## 4 1.0 80.7 ## 5 1.5 89.0 ## 6 1.5 99.6 ## 7 2.0 105.3 ## 8 2.0 111.8 ## 9 2.5 112.3 ## 10 2.5 125.7
\[\hat{Y}=34.945 + 35.77X\]
Gráfico de resÃduos: \(e_i\) versus \(\hat{Y}_i\).
\(X'=\sqrt{X}\)
\[\hat{Y}=-10.33 + 83.45\sqrt{X}\]
Gráfico de resÃduos: \(e_i\) versus \(\hat{Y}_i\) usando \(X'\) no modelo.
Tentar encontrar transformação em \(Y\).
Pode ser combinada com uma transformação também em \(X\).
\(X\): Idade
\(Y\): nÃvel de poliamina no plasma
## Idade Poliamina ## 1 0 13.44 ## 2 0 12.84 ## 3 0 11.91 ## 4 0 20.09 ## 5 0 15.60 ## 6 1 10.11 ## 7 1 11.38 ## 8 1 10.28 ## 9 1 8.96 ## 10 1 8.59 ## 11 2 9.83 ## 12 2 9.00 ## 13 2 8.65 ## 14 2 7.85 ## 15 2 8.88 ## 16 3 7.94 ## 17 3 6.01 ## 18 3 5.14 ## 19 3 6.90 ## 20 3 6.77 ## 21 4 4.86 ## 22 4 5.10 ## 23 4 5.67 ## 24 4 5.75 ## 25 4 6.23
\[\hat{Y}=13.4752 + -2.182X\]
Gráfico de resÃduos: \(e_i\) versus \(\hat{Y}_i\).
Gráfico de resÃduos: \(e_i\) versus \(X_i\).
\(Y'=\log_{10}Y\)
\[\hat{Y'}=1.13 + -0.1X\]
Gráfico de resÃduos: \(e_i\) versus \(\hat{Y'}_i\) usando \(Y'\) no modelo.
Gráfico de resÃduos: \(e_i\) versus \(X_i\).
\(\log_e(Y)\): para estabilizar a variância quando esta tende a crescer à medida que \(Y\) cresce.
\(\sqrt{Y}\): estabilizar a variância quando esta é proporcional à média dos \(Y\)'s.
\(\frac{1}{Y}\): estabilizar a variância, minimizando o efeito de valores muito altos de \(Y\).
\(Y^2\): estabilizar a variância quando esta tende a decrescer com a média de \(Y\)'s.
\(\arcsin{\sqrt{Y}}\): estabilizar a variância quando os dados são proporções.
etc…
Muitas vezes é difÃcil determinar, através de gráficos, qual a melhor transformação a ser feita.
O procedimento de Box-Cox identifica automaticamente uma transformação:
\[Y'=Y^{\lambda}\]
em que \(\lambda\) é um parâmetro a ser determinado a partir dos dados.
\[Y_i^{\lambda}=\beta_0+\beta_1X_i+\varepsilon_i\]
Applied Linear Statistical Models: 3.8-3.11.
Weisberg - Applied Linear Regression: CapÃtulo 8.
Faraway - Linear Models with R: CapÃtulo 9.