Laboratórios - Inventariação e Bioestatística
Licenciatura Biologia - Semestre VI - 2006/2007
AVISOS:
-
(16 Julho) -- O exame de dia 23 de Julho realiza-se às 9h00, por
decisão do Conselho Pedagógico. Está afixada uma folha de
inscrições junto ao Departamento de Matemática.
-
(16 Julho) -- O Professor
estará disponível para tirar dúvidas nas seguintes datas e
horas antes da 3a. data de exame:
|
4ª Feira, 18 Julho
|
11:00 às 12:00
|
|
6ª Feira, 20 Julho
|
15:00 às 16:00
|
-
(3 Julho) -- O enunciado do segundo exame encontra-se
aqui.
-
(27 Junho) -- Uma proposta de resolução do segundo Teste encontra-se
aqui.
-
(12 Junho) -- As datas e horas de exame encontram-se mais abaixo
nesta página.
-
(12 Junho) -- o formulário está aqui.
- (12 Junho) -- O Professor
estará disponível para tirar dúvidas nas seguintes datas e
horas antes da 2a. data de exame:
|
6ª Feira, 22 Junho
|
10:00 às 11:00
|
|
4ª Feira, 27 Junho
|
15:00 às 16:00
|
|
6ª Feira, 29 Junho
|
15:00 às 16:00
|
- (5 Junho) -- O Professor
estará disponível para tirar dúvidas nas seguintes datas e
horas:
|
4ª Feira, 6 Junho
|
10:00 às 11:00
|
|
6ª Feira, 8 Junho
|
15:00 às 16:00
|
|
2ª Feira, 11 Junho
|
15:00 às 16:00
|
- (24 Abril) -- O formulário terá por base o que está aqui.
- (24 Abril) -- Como foi combinado na aula, o teste realiza-se na
quarta-feira, dia 2 de Maio, pelas 16h00.
- (24 Abril) -- Haverá um horário de dúvidas na
segunda-feira, dia 30 de Abril, das 14h30 às 16h00.
DESTINATÁRIOS: Estudantes da licenciatura em Biologia
pré-Bolonha.
OBJECTIVOS: Aprofundamento dos conhecimentos no campo das
metodologias estatísticas de recolha, análise e tratamento de
dados. Será utilizado intensivamente o programa informático R, de Software Livre e
disponível gratuitamente na Internet, aqui.
PRÉ-REQUISITOS: Disciplinas de Matemática
I, Matemática
II e Estatística, da Licenciatura em Biologia (pré-Bolonha) do ISA.
DURAÇÃO: 14 semanas efectivas, sendo a carga
semanal oficial de 0 aulas teóricas e 2 aulas práticas
de 3 horas.
Aprovação na disciplina:
Seguindo as Regras Gerais de Avaliação de Conhecimentos
do Guia de Licenciaturas do ISA (disponível em
http://www.isa.utl.pt/files/pub/da/licenciaturas/guia_lic_2005-06-2.pdf).
Por decisão do Conselho Pedagógico do ISA, os
exames realizam-se nas seguintes datas:
- Primeira chamada: 12 de Junho, 2007.
- Segunda chamada: 2 de Julho, 2007.
- Época extraordinária de transição para o regime de Bolonha: 23
de Julho, 2007.
Todos os exames têm início às 10h00.
Os testes realizaram-se nos dias 2 de Maio e 12 de Junho de 2007.
Calendario: 27 Fevereiro a 6 Junho 2007
Horario: 3as.-feiras, das 10h30 às 12h00 (Sala P11b) e
4as.-feiras das 13h30 às 15h00 (Sala P11a).
Enunciados das provas escritas -- e duas resoluções
Programa (2006-07)
- Introdução
- Revisão de conceitos.
- Revisão do programa estatístico R.
- A Regressão Linear.
- Revisão de regressão linear simples como técnica
descritiva.
- O Modelo da Regressão Linear Simples para fins
inferenciais.
- Inferência na Regressão Linear Simples.
- Transformações linearizantes.
- Validação dos pressupostos do Modelo e outros diagnósticos.
- A Regressão Linear Múltipla num contexto descritivo:
geometria subjacente.
- A Regressão Linear Múltipla: o contexto inferencial.
- A Regressão Polinomial como caso particular da Regressão
Múltipla. [Não foi dado]
- Modelos e Submodelos: comparações formais.
- Delineamento de experiências e Análise de Variâncias.
- Conceitos básicos no delineamento de experiências.
- Modelos básicos de Análise de Variância: 1 factor, 2
factores sem e com interacção.
- O Modelo Linear como generalização dos modelos ANOVA e de
Regressão.
- Análises de Covariância: a comparação de regressões
aparentadas. [Não foi dado]
- Conceitos de amostragem e métodos de estimação de abundância
populacional. [Não foi dado]
- Amostragem Aleatória Simples e Estratificada.
- Métodos de captura-recaptura.
- Métodos baseados em transectos lineares.
- Técnicas descritivas de Estatística Multivariada.
- Análise em Componentes Principais: conceitos geométricos; as
componentes principais; biplots; prevenções.
- Análise Discriminante Linear: conceitos geométricos;
critérios de discriminação; os eixos discriminantes;
relações com ANOVA. [Não foi dado]
- Análises Classificatórias: classificação hierárquica e
não-hierárquica; critérios de classificação; critérios de
agrupamento nas Análises Classificatórias hierárquicas; um
método não-hierárquico. [Não foi dado]
Bibliografia
- Chambers, J.M. & Hastie, T.J. (1992), Statistical Models
in S. Wadsworth & Brooks/Cole.
- Draper, N.R. & Smith, H. (1998), Applied Regression
Analysis (3a. ed.). John Wiley &
Sons.
- [EM] Krebs, C.J. (1999), Ecological Methodology (2a. ed.).
Addison Wesly Longman, Inc.
- [DAAG] Maindonald, J. & Braun,
J. (2003), Data Analysis and Graphs using R. Cambridge University Press. (Cota BISA: U10-722)
- [NKNW] Neter, J.; Kutner, M.; Nachtsheim,
C.; & Wasserman, W. (1996), Applied Linear
Regression Models . Irwin.
- [MASS] Venables, W.N. & Ripley, B.D. (2002), Modern Applied
Statistics with S (4a. ed.) Springer-Verlag.
Folhas de apoio da disciplina (Exercícios)
Sumários das aulas:
27/Fev/07 (1ª Aula)
28/Fev/07 (2a. Aula)
6/Mar/07 (3a. Aula)
7/Mar/07 (4a. Aula)
- A inferência na Regressão: os estimadores dos parâmetros
da recta de regressão e as suas distribuições de
probabilidades. O problema da variância dos erros
aleatórios. O QMRE como estimador dessa variância e a
distribuição associada. O efeito de substituir a variância dos
erros pelo seu estimador, na distribuição do estimador do declive.
Material de apoio: Capítulo 2, Referência NKNW.
TPC: Exercícios 1 alíneas a)-j) + p),
Exercícios 2, 3 e 4 .
13/Mar/07 (5a. Aula)
14/Mar/07 (6a. Aula)
- A inferência na Regressão: intervalos de confiança para o
declive (beta) e da ordenada na origem (alfa) da recta de
regressão. O comando confint do programa R. Intervalos
de confiança para o valor esperado de Y associado a um dado
valor de x, e intervalos de predição para uma observação
indivudal de Y associada a um dado valor de x. O comando
predict do R. Aplicação aos dados dos lírios (iris).
Material de apoio: Capítulo 2, Referência NKNW.
TPC: Exercícios 1 alíneas k)-n),
Exercício 5 (excepto alíneas h) e i)) .
20/Mar/07 (7a. Aula)
- A validação dos pressupostos do Modelo de Regressão
Linear: resíduos, resíduos estandardizados, resíduos
Studentizados e respectivas propriedades sob o Modelo. Os comandos
residuals, rstandard e rstudent do
R. Estudo gráfico dos resíduos na validação dos pressupostos
do modelo: o comando plot do R aplicado a um objecto da
classe lm. Estudo dos resíduos no exemplo dos lírios
(dados iris). Transformações estabilizadoras da variância
(família Box-Cox). Transformações linearizantes e o seu papel.
Alguns modelos não-lineares importantes em Biologia e
respectivas transformações linearizantes: o modelo de
crescimento exponencial; as relações alométricas (potência);
modelo hiperbólicos de rendimento per capita; modelo de
Michaelis-Menten (ou de rendimento do Shinozaki e Kira);
modelo de crescimento logístico.
21/Mar/07 (8a. Aula)
- Um exemplo de transformações linearizantes: a relação
alométrica. Motivação e interpretação da relação
alométrica. Isometria e alometria. A linearização da relação
alométrica. Aplicação ao conjunto de dados mammals do
pacote MASS: relação alométrica entre pesos do cérebro
e pesos do corpo para 62 espécies de mamíferos. Intervalos de
confiança para o declive e estudo dos resíduos.
- Ainda a inferência estatística: o teste de ajustamento
global (o "teste F"). A justificação do teste e da
respectiva estatística de teste. A justificação da Região
Crítica unilateral direita. O teste de ajustamento global
aplicado aos exemplos considerados anteriormente.
Material de apoio: Capítulo 2, Referência NKNW.
TPC: Exercícios 6, 7 e 8 .
27/Mar/07 (9a. Aula)
28/Mar/07 (10a. Aula)
- A Regressão Linear Múltipla. O problema no espaço em que
as variáveis definem os eixos, e no espaço em que os
indivíduos observados definem os eixos. Os estimadores de
mínimos quadrados:a sua fórmula e a interpretação do seu
significado. A caminho da inferência na Regressão Múltipla: a
distribuição dos estimadores dos parâmetros beta. Um exemplo:
os dados de mdeições sobre folhas de videira (objecto
clopes, dado nas aulas).
Material de apoio: Capítulo 6, Referência DAAG.
TPC: Exercícios 11 e 12. .
3/Abr/07 (11a. Aula)
- A inferência na Regressão Linear Múltipla. Distribuição
dos estimadores dos betas: testes e intervalos de
confiança. Os dados clopes. Coeficiente de Determinação
na Regressão Múltipla. O teste de ajustamento global na
Regressão Múltipla. Distribuição dos resíduos na Regressão
Múltipla. As transformações dos resíduos: resíduos
estandardizados e resíduos studentizados.
Material de apoio: Capítulo 6, Referência NKNW.
4/Abr/07 (12a. Aula)
- Estudo dos resíduos na Regressão Linear Múltipla: os dados
clopes. Prevenções relativas à transformação de
variáveis. Modelos e submodelos. O problema. O princípio da
parcimónia na modelação. Teste para determinar se um dado
submodelo difere significativamente de um modelo: o teste a
modelos encaixados (teste F parcial).
Material de apoio: Capítulo 6, Referência NKNW.
TPC: Exercício 16a)b)d). .
17/Abr/07 (13a. Aula)
- Modelos e submodelos. Revisão do teste a
modelos encaixados (teste F parcial). Aplicação (dados do
Exercício 13) no R. A
selecção de submodelos quando não existe um submodelo
candidato pré-definido. A pesquisa completa e suas
limitações. Algoritmos de selecção de submodelos: o algoritmo
de exclusão sequencial (backward elimination). Exemplo
no R (Exercício 13c)).
18/Abr/07 (14a. Aula)
- Critérios de desempenho de um modelo: o coeficiente de
determinação e o coeficiente de determinação ajustado. O
Critério de Informação de Akaike (AIC). Utilização do AIC como
critério de paragem no algoritmo de selecção de submodelos no
R. O algoritmo de inclusão sequencial (forward
selection). Algoritmos de exclusão e/ou inclusão
sequenciais. A função step no R. Exemplo
(Exercício 13c)).
Material de apoio: Capítulo 8, Referência NKNW.
24/Abr/07 (15a. Aula)
- Ainda a inferência na Regressão Linear Múltipla:
Intervalos de Confiança para combinações lineares dos
parâmetros beta (que inclui, como casos particulares, um beta
individual, a diferença ou soma de dois diferentes parâmetros
beta; o valor esperado da variável resposta para um dado
conjunto de valores das variáveis preditoras). Resolução do
Exercício 14a)b)c)d)e).
2/Mai/07 (16a. Aula) --
As aulas de 4a.-feira 25/4 e 3a.-feira 1/5 coincidiram com feriados.
- Revisão para o teste. Resolução do
Exercício 14f). A Análise de Variância: introdução, factores e
níveis do factor; o Modelo de ANOVA a 1 Factor; a relação do
Modelo com o Modelo de Regressão Linear Múltipla; o problema
da sobreparametrização do modelo e as formas de resolver o
problema.
Material de apoio: Capítulo 11, Referência NKNW.
8/Mai/07 (17a. Aula)
- A Análise de Variância a 1 Factor: exemplo (dados iris).
A natureza da matriz X do modelo nos modelos ANOVA a 1
factor. A natureza específica dos gráficos de resíduos no
modelo ANOVA a 1 Factor. A distribuição de Tukey para a
Amplitude Studentizada.
Material de apoio: Capítulo 11, Referência NKNW.
9/Mai/07 (18a. Aula)
- Comparação múltipla de médias (Tukey) no caso de ANOVAs a
um factor: derivação dos intervalos de confiança e sua
obtenção no R. Modelos ANOVA com dois factores: o modelo sem
interacção. Os testes aos efeitos de cada factor. A
decomposição da Soma de Quadrados do Modelo em parcelas
associadas a cada factor. Resolução do Exercício 4 (dos
Exercícios de ANOVA).
Material de apoio: Capítulo 11, Referência NKNW.
15/Mai/07 (19a. Aula)
- Revisão do Modelo ANOVA com dois factores sem
interacção. As comparações múltiplas de médias num
modelo a dois factores sem interacção. Resolução do Exercício 4 (dos
Exercícios de ANOVA) (incluíndo os comandos TukeyHSD e
respectivo plot). Modelo ANOVA a dois factores
com interacção: motivação, os efeitos de interacção, o
modelo. Os testes à existência de efeitos de cada um dos três
tipos previstos no modelo. A natureza das estatísticas dos testes.
Material de apoio: Capítulo 11, Referência NKNW.
16/Mai/07 (20a. Aula)
- Resolução do Exercício 6 (ANOVA) - modelo a dois
factores com interacção (incluíndo os comandos TukeyHSD e
respectivo plot).
Métodos de Estatística Multivariada. Conceitos
introdutórios: notação; as representações alternativas de uma
matriz de dados nxp: a representação tradicional
no espaço p-dimensional e a representação alternativa
no espaço n-dimensional; conceitos geométricos e
conceitos estatísticos na representação no espaço
n-dimensional; a matriz de variâncias-covariâncias;
valores e vectores próprios; propriedades dos valores e
vectores próprios de matrizes simétricas.
22/Mai/07 (21a. Aula)
Análise em Componentes Principais. Objectivo: redução
de dimensionalidade preservando o máximo de informação. A
centragem prévia dos dados e os seus efeitos na respectiva
representação gráfica. O critério a optimizar: combinações
lineares das variáveis originais de variância máxima. A
solução do problema e o papel dos vectores e valores próprios
da matriz de covariâncias. A ortogonalidade das Componentes
Principais. O papel das projecções ortogonais nos dois espaços
(p- e n-dimensional). Os dados lavagantes.
23/Mai/07 (22a. Aula)
Análise em Componentes Principais. O significado dos
valores próprios da matriz de covariância. A proporção de
variabilidade total explicada por um subconjunto de
Componentes Principais. A Análise em Componentes Principais
dos dados lavagantes: a análise do primeiro plano
principal e da qualidade da representação da nuvem de pontos
nesse plano. Correlações entre variáveis originais e
Componentes Principais: a fórmula geral e o caso particular
dos dados lavagantes, com a interpretação da natureza
das duas primeiras CPs.
A dependência da ACP em relação às unidades de medida das
variáveis. A Análise em Componentes Principais dos dados
normalizados: ACP sobre a matriz de Correlações.
29/Mai/07 (23a. Aula)
Análise em Componentes Principais. Prática de ACP:
Comparação de ACPs dos dados lavagantes, quer sobre a matriz
de Covariâncias, quer sobre a matriz de
Correlações. Características da nuvem de pontos subjacentes;
interpretação das CPs; características do feixe de vectores
representativos das variáveis centradas (ou centradas e
normalizadas) no espaço n-dimensional. O Biplot como síntese
da informação essencial relativa aos dados.
30/Mai/07
[ Pág.
Dep. | Disciplinas
| Topo | Atendimento a alunos |
Docentes
| Programa | Bibliografia | Sumários
Teóricas | Sumários Práticas]