Análise Exploratória e Interpretação de Dados
1.
Objetivo: O objetivo deste trabalho é
explorar, analisar, descrever e interpretar um banco de dados. Como objetivo
colateral está o uso de pacote(s) computacional(is) em
aplicações de estatística descritiva. Será importante também a apresentação
adequada de relatório contendo a análise dos dados e suas conclusões. As normas
serão aquelas aplicáveis a relatórios técnicos.
2.
Grupo: O trabalho poderá ser efetuado por no máximo por dois alunos. Não serão
considerados, em nenhuma hipótese, trabalhos realizados por 3
ou mais estudantes. O professor reserva-se o direito de argüir qualquer aluno
sobre qualquer aspecto do trabalho entregue.
3.
Banco de Dados: O banco de dados do trabalho denomina-se ‘cancer’. Ele é um dos conjuntos de dados apresentados no livro Noções
de Probabilidade e Estatística,
de Marcos N. Magalhães e Antonio Carlos P. Lima. Os arquivos do banco de dados e da
descrição de suas variáveis são encontrados AQUI.
4. Roteiro: O grupo deve, em sua análise, analisar e responder pelo menos as questões levantadas no seguinte roteiro: AQUI. É altamente recomendável que o grupo avance em sua análise, buscando conhecer e analisar o banco de dados em outros aspectos e não apenas aqueles apontados no roteiro fornecido.
5.
Relatório: A análise deverá ser
apresentada na forma de relatório técnico, compreendendo o problema proposto,
sua modelagem e resolução, bem como os resultados e saídas da análise. Isto é,
o trabalho deverá ganhar um título. Um pequeno resumo vem em seguida, para que
o eventual leitor tenha uma idéia por alto do conteúdo do trabalho (pense no
gerente). O corpo do trabalho é o próximo, dividido em três partes clássicas:
introdução, desenvolvimento e conclusão. Por fim, deverão ser apresentadas as
referências bibliográficas (livros, revistas, relatórios, etc.) que foram
consultadas. Indique também o software utilizado.
Recomendamos que o relatório contenha:
a. Identificação dos tipos de variáveis encontradas no Banco de Dados;
b. Construção de tabelas e gráficos das variáveis de interesse;
c. Cálculo, onde aplicável, das medidas descritivas para cada variável (medidas de tendência central, de posição, de dispersão, etc.);
d. Breve comentário sobre os resultados obtidos;
e. Análise das relações relevantes entre as variáveis apresentadas;
f. Um resumo das principais conclusões a respeito dos dados apresentados, a partir da interpretação dos resultados obtidos;
g. Indicação do tipo de levantamento adicional que poderia ser efetuado no sentido de melhorar as condições de interpretação dos dados;
h. Apresentação das observações ou sugestões a respeito do presente trabalho.
Você encontrará na Internet muito material sobre estrutura e formato adequados a um relatório técnico. Como ponto de partida, sugiro o link Report Writing. Ele não é o primeiro, tampouco o único. É apenas uma das possibilidades de consulta.
6.
Cópia
e Plágio: ‘Não copie qualquer parte do trabalho de qualquer outro grupo e não
permita que partes de seu trabalho seja copiado’. O
professor salienta que cópias e suas fontes não merecerão avaliação.
7.
Pacote computacional: Este trabalho
poderá ser efetuado com qualquer pacote computacional (R, Excel, SPSS, Minitab, etc.), sugerindo-se a opção por aquele(s) de maior
utilização pelo aluno.
8.
Avaliação: O trabalho será avaliado
com base nos quesitos apresentados abaixo:
|
Quesitos |
|
|
Uso
adequado de estatística |
30% |
|
Análise
dos resultados |
30% |
|
Clareza e objetividade |
20% |
|
Relatório técnico |
20% |
9. Recomendações:
O foco deverá sempre ser a análise objetiva das características dos dados,
assim como o tratamento adequado dos valores relevantes do conjunto de dados
selecionado, de maneira a extrair informações, alicerçar conclusões e indicar
desdobramentos futuros. Recomendo a leitura do texto preparado pelo Prof.
Ronaldo Bastos, sobre Análise Exploratória de Dados (pode ser obtido AQUI).
As dúvidas no desenvolvimento do trabalho poderão ser esclarecidas através do
e-mail: lupercio@ice.ufjf.br.
10. Data
de entrega do relatório técnico: até 29/11/2010, impreterivelmente.
O relatório deve ser impresso e entregue em papel. Notar que este é o prazo
final, sendo que os trabalhos poderão ser entregues antes desta data. Não
deixem para última hora, pois, arriscam-se a não cumprir a data final.