Análise de Correlação e Regressão
1. Objetivo:
O objetivo será explorar, analisar, descrever, interpretar e fazer previsões
com regressão linear, referente a um problema pessoal ou profissional que seja relevante,
apresentando algum interesse prático. É fundamental que esta relevância prática
seja mostrada com clareza, no trabalho. Deverá ser apresentada a descrição da
situação referente às séries em análise, assim como o contexto em
que elas foram observados. As técnicas estatística apropriadas, desenvolvidas no curso
deverão ser plenamente aplicadas.
2. Banco de Dados:
O arquivo de dados deverá conter pelo menos cinco variáveis, com no mínimo 50 observações. Espera-se a existência de associações relevantes entre as variáveis, para permitir análises de causa e efeito. As variáveis deverão estar resumidas, conforme modelo da tabela abaixo.
Variável |
Descrição da Variável |
Valores da Variável |
Id |
Identificação
da observação no arquivo |
|
|
|
|
|
|
|
Arquivo de dados: Fornecer arquivo magnético com o banco de dados, com extensão .xls ou . txt.
3. Fonte: Citar a origem dos dados.
4. Relatório: Além das recomendações gerais para execução do presente Trabalho de Aplicação, o relatório deverá conter:
Identifique a variável dependente e as variáveis independentes;
Construa diagramas de dispersão para ilustrar as possíveis relações entre a variável dependente e as variáveis independentes. Determine os coeficientes de correlação de Pearson dos pares de variáveis colocados nos gráficos anteriores;
Faça breves comentários sobre as relações dos pares de variáveis, consultando seus diagramas de dispersão e seus coeficientes de correlação. Identifique o(s) par(es) de variável(is) que exibe(m) a(s) relação(ões) mais forte(s);
Utilizando esse(s) par(es) de variável(is) encontre os valores de intercepto e coeficiente angular que poderiam ser utilizados para formar uma equação de regressão linear para prever a variável dependente. Escreva o modelo de regressão linear e interprete os valores encontrados para cada equação;
Calcule os valores estimados da variável dependente para cada uma das equações e plote a reta de regressão no diagrama de dispersão de seu modelo para formar uma linha de pontos
Com a finalidade de verificar a adequação do(s) modelo(s) adotado(s), construa a Tabela Anova e determine o coeficiente de determinação para cada equação de regressão, interpretando seu significado no problema. Analise a saída do pacote utilizado para fazer a regressão.
Ajuste uma regressão múltipla e analise sua saída e coeficiente de determinação ajustado, comparando seu resultado com os resultados obtidos anteriormente.
Fazer um gráfico dos resíduos padronizados em relação à variável dependente. Fazer um histograma dos resíduos padronizados;
5. Observações: A análise de regressão é utilizada principalmente com o objetivo de previsão, através do desenvolvimento de um modelo estatístico que possa ser utilizado para prever os valores de uma variável dependente, com base nos valores de pelo menos uma variável independente ou explicativa. Utilize intensamente os comandos e ferramentas disponibilizados pelo Excel ou outro pacote estatístico de seu interesse.