Sumários das aulas Teóricas (Estatística e Delineamento, 2009/10)
(15 Set 09, 3a-f.)
[Slides 1 a 10]
Aula de apresentação. Apresentação da página
web da disciplina. Programa. Avaliação de conhecimentos (tendo ficado
decidido que o primeiro teste realiza-se na sexta-feira, dia 13 de
Novembro, das 11h30 às 14h00).
(18 Set 09, 6a-f.)
[Slides 11 a 29]
Conceitos básicos de modelação estatística. O Modelo
Linear: introdução. Revisão de conceitos de Regressão linear
simples, num contexto descritivo. Pressupostos adicionais para o
Modelo de Regressão Linear Simples. Primeiras consequências do
Modelo. O estimador do declive da recta populacional.
(23 Set 09, 3a-f.)
[Slides 30 a 36]
O estimador do declive da recta populacional e o estimador da
ordenada na origem. As suas distribuições. O problema do
desconhecimento da variância dos erros aleatórios. O Quadrado
Médio Residual como estimador centrado dessa variância dos erros
aleatórios.
(25 Set 09, 6a-f.)
[Slides 37 a 48]
O efeito de substituir a variância dos erros aleatórios pelo seu estimador,
nas distribuições associadas aos estimadores de beta e alfa. A construção de
intervalos de confiança para beta e alfa. Breve revisão do conceito de Teste
de Hipóteses: as hipóteses nula e alternativa; características duma
estatística de teste; nível de significância; a região crítica ou de
rejeição; as conclusões. Construção de um teste de hipóteses bilateral para
o declive beta da recta de regressão simples. Discussão do significado do
intervalo de confiança e sua relação com o Teste de Hipoteses.
(29 Set 09, 3a-f.)
[Slides 48 a 58]
Testes de Hipoteses sobre beta: testes bilaterais e unilaterais. Níveis de significância e p-values. Testes de Hipóteses sobre alfa. A informação para Intervalos de Confiança e Testes de Hipóteses no R. A inferêncioa sobre o valor esperado de Y, dado x. O estimador de E[Y|x] e sua distribuição.
(2 Out 09, 6a-f.)
[Slides 59 a 79]
A construção de intervalos de confiança para E[Y|x]. A
construção de intervalos de predição para
observações individuais de Y, dado X=x. Intervalos de
confiança e intervalos de predição no R.
O teste F de ajustamento de um modelo de regressão linear simples:
motivação e construção. Duas formas alternativas de
escrever as hipóteses e a estatística do teste.
Justificação da região crítica do teste.
Introdução ao problema de validar os pressupostos do Modelo: o papel
dos resíduos. A distribuição dos resíduos sob o
Modelo.
(6 Out 09, 3a-f.)
[Slides 80 a 91]
O estudo dos resíduos para avaliar a validade dos pressupostos do Modelo: alguns gráficos e respectiva leitura. Transformações estabilizadoras da variância. Algumas prevenções. Transformações linearizantes para algumas relações não-lineares particulares: exponencial (como surge e como se lineariza), logística (como surge e como se lineariza), potência ou alométrica (como surge e como se lineariza).
(9 Out 09, 6a-f.)
[Slides 92 a 119]
Ainda as transformações linearizantes: mais dois casos particulares. Algumas prevenções.
A Regressão Linear Múltipla: introdução;
notação; conceitos geométricos. Duas formas
alternativas de representar geometricamente os dados. A
estimação dos parâmetros do modelo. A fórmula
fundamental da Regressão Linear como aplicação do
Teorema de Pitágoras. O Coeficiente de Determinação como
conceito geométrico. A Regressão Linear Múltipla no R.
(13 Out 09, 3a-f.)
[Slides 120 a 129]
A Regressão Linear Múltipla: O contexto inferencial. O Modelo da Regressão Linear Múltipla. A notação matricial/vectorial. Vectores aleatórios: definição e propriedades do vector esperado e da matriz de variâncias-covariâncias. A distribuição Normal Multivariada: definição; representação gráfica da densidade duma normal bivariada; principais propriedades duma Normal multivariada. O modelo de Regressão Linear Múltipla em versão vectorial/matricial.
(16 Out 09, 6a-f.)
[Slides 130 a 141]
O modelo de Regressão Linear Múltipla em versão vectorial/matricial. A distribuição de probabilidades do estimador do vector dos parâmetros. QMRE e a estimação da variância dos erros aleatórios. A quantidade central para a inferência sobre parâmetros individuais. Intervalos de confiança e Testes de Hipóteses sobre beta_i's individuais. Comandos do R associados a esta inferência.
(20 Out 09, 3a-f.)
[Slides 142 a 157]
Combinações lineares dos parâmetros: conceito e casos particulares; a distribuição do respectivo estimador; intervalos de confiança e testes de hipóteses para essas combinações lineares. Os casos particulares da soma ou diferença de dois betas, e do valor esperado de Y para um dado conjunto de valores das variáveis preditoras. Intervalos de predição para uma observação individual de Y. O teste F de ajustamento global no contexto da Regressão Linear Múltipla. O princípio da parcimónia na Regressão Linear Múltipla.
(23 Out 09, 6a-f.)
[Slides 158 a 182]
Modelos e submodelos: o teste F parcial para a comparação de modelo e submodelo. Algoritmos de pesquisa baseados nas hipóteses Beta_i=0: o algoritmo de exclusão sequencial, o algoritmo de inclusão sequencial e algoritmos alternados de exclusão/inclusão. O Critério de Informação de Akaike (AIC). Algoritmos de escolha de submodelos no R. Prevenções sobre os algoritmos de escolha de submodelos.
(27 Out 09, 3a-f.)
[Slides 183 a 199]
A Análise dos Resíduos na Regressão Múltipla: distribuição dos resíduos, sendo válido o Modelo; gráficos aconselhados; os conceitos de observação atípica (outlier), observação influente e observação alavanca. Distâncias de Cook. Gráficos de diagnóstico no R. Quatro observações finais sobre as Regressões Lineares: os problemas da multicolinearidade, transformações linearizantes, a extensão às regressões polinomiais e o facto de uma associação estatística não ser sinónimo duma relação de causa e efeito.
(30 Out 09, 6a-f.)
[Slides 200 a 235]
A Análise de Variância: conceitos introdutórios. A Análise de Variância a um Factor: formulação do modelo como caso particular do Modelo Linear; a estimação dos parâmetros; o modelo para efeitos inferenciais; o teste aos efeitos do factor como teste global de ajustamento do modelo; a leitura particular das Somas de Quadrados no contexto duma ANOVA a 1 factor; as ANOVAs a 1 factor no R.
(3 Nov 09, 3a-f.)
[Slides 236 a 245]
A exploração ulterior de H1: comparações múltiplas de médias. A distribuição de Tukey para a Amplitude Studentizada duma amostra aleatória Normal. A aplicabilidade deste resultado ao problema da comparação múltipla de médias: intervalos de confiança simultâneos para todas as diferenças de médias de pares de níveis.
(6 Nov 09, 6a-f.)
[Slides 246 a 269]
Teste de comparações múltiplas de Tukey. Tukey e o R. Uma chamada de atenção sobre Tukey e delineamentos não equilibrados. Uma chamada de atenção sobre os gráficos de resíduos numa ANOVA a 1 factor. A hipótese de homogeneidade de variâncias. Relação entre média aritmética e média geométrica. O Teste de Bartlett. Algumas precauções sobre o teste de Bartlett. Breve discussão sobre o impacto da violação dos pressupostos numa ANOVA. Advertência sobre condições alternativas para ultrapassar o problema de excesso de parâmetros no modelo. Unidades experimentais e a sua homogeneidade. O efeito de heterogeneidade não controlada sobre o teste F aos efeitos do factor. A necessidade de controlar a heterogeneidade das unidades experimentais.
(10 Nov 09, 3a-f.)
Resolução de Exercícios de Regressão Linear Múltipla, como preparação para o teste. Exercícios resolvidos: Ex. 10, 11.
(13 Nov 09, 6a-f.)
O primeiro teste decorreu no horário da aula teórica.
Jorge Cadima
Last modified: Wed Nov 18 10:45:33 WET 2009