Sumários das aulas Teóricas (Estatística e Delineamento, 2009/10)



(15 Set 09, 3a-f.) [Slides 1 a 10] Aula de apresentação. Apresentação da página web da disciplina. Programa. Avaliação de conhecimentos (tendo ficado decidido que o primeiro teste realiza-se na sexta-feira, dia 13 de Novembro, das 11h30 às 14h00).


(18 Set 09, 6a-f.) [Slides 11 a 29] Conceitos básicos de modelação estatística. O Modelo Linear: introdução. Revisão de conceitos de Regressão linear simples, num contexto descritivo. Pressupostos adicionais para o Modelo de Regressão Linear Simples. Primeiras consequências do Modelo. O estimador do declive da recta populacional.

(23 Set 09, 3a-f.) [Slides 30 a 36] O estimador do declive da recta populacional e o estimador da ordenada na origem. As suas distribuições. O problema do desconhecimento da variância dos erros aleatórios. O Quadrado Médio Residual como estimador centrado dessa variância dos erros aleatórios.

(25 Set 09, 6a-f.) [Slides 37 a 48] O efeito de substituir a variância dos erros aleatórios pelo seu estimador, nas distribuições associadas aos estimadores de beta e alfa. A construção de intervalos de confiança para beta e alfa. Breve revisão do conceito de Teste de Hipóteses: as hipóteses nula e alternativa; características duma estatística de teste; nível de significância; a região crítica ou de rejeição; as conclusões. Construção de um teste de hipóteses bilateral para o declive beta da recta de regressão simples. Discussão do significado do intervalo de confiança e sua relação com o Teste de Hipoteses.

(29 Set 09, 3a-f.) [Slides 48 a 58] Testes de Hipoteses sobre beta: testes bilaterais e unilaterais. Níveis de significância e p-values. Testes de Hipóteses sobre alfa. A informação para Intervalos de Confiança e Testes de Hipóteses no R. A inferêncioa sobre o valor esperado de Y, dado x. O estimador de E[Y|x] e sua distribuição.

(2 Out 09, 6a-f.) [Slides 59 a 79] A construção de intervalos de confiança para E[Y|x]. A construção de intervalos de predição para observações individuais de Y, dado X=x. Intervalos de confiança e intervalos de predição no R. O teste F de ajustamento de um modelo de regressão linear simples: motivação e construção. Duas formas alternativas de escrever as hipóteses e a estatística do teste. Justificação da região crítica do teste. Introdução ao problema de validar os pressupostos do Modelo: o papel dos resíduos. A distribuição dos resíduos sob o Modelo.

(6 Out 09, 3a-f.) [Slides 80 a 91] O estudo dos resíduos para avaliar a validade dos pressupostos do Modelo: alguns gráficos e respectiva leitura. Transformações estabilizadoras da variância. Algumas prevenções. Transformações linearizantes para algumas relações não-lineares particulares: exponencial (como surge e como se lineariza), logística (como surge e como se lineariza), potência ou alométrica (como surge e como se lineariza).

(9 Out 09, 6a-f.) [Slides 92 a 119] Ainda as transformações linearizantes: mais dois casos particulares. Algumas prevenções.
A Regressão Linear Múltipla: introdução; notação; conceitos geométricos. Duas formas alternativas de representar geometricamente os dados. A estimação dos parâmetros do modelo. A fórmula fundamental da Regressão Linear como aplicação do Teorema de Pitágoras. O Coeficiente de Determinação como conceito geométrico. A Regressão Linear Múltipla no R.

(13 Out 09, 3a-f.) [Slides 120 a 129] A Regressão Linear Múltipla: O contexto inferencial. O Modelo da Regressão Linear Múltipla. A notação matricial/vectorial. Vectores aleatórios: definição e propriedades do vector esperado e da matriz de variâncias-covariâncias. A distribuição Normal Multivariada: definição; representação gráfica da densidade duma normal bivariada; principais propriedades duma Normal multivariada. O modelo de Regressão Linear Múltipla em versão vectorial/matricial.

(16 Out 09, 6a-f.) [Slides 130 a 141] O modelo de Regressão Linear Múltipla em versão vectorial/matricial. A distribuição de probabilidades do estimador do vector dos parâmetros. QMRE e a estimação da variância dos erros aleatórios. A quantidade central para a inferência sobre parâmetros individuais. Intervalos de confiança e Testes de Hipóteses sobre beta_i's individuais. Comandos do R associados a esta inferência.

(20 Out 09, 3a-f.) [Slides 142 a 157] Combinações lineares dos parâmetros: conceito e casos particulares; a distribuição do respectivo estimador; intervalos de confiança e testes de hipóteses para essas combinações lineares. Os casos particulares da soma ou diferença de dois betas, e do valor esperado de Y para um dado conjunto de valores das variáveis preditoras. Intervalos de predição para uma observação individual de Y. O teste F de ajustamento global no contexto da Regressão Linear Múltipla. O princípio da parcimónia na Regressão Linear Múltipla.

(23 Out 09, 6a-f.) [Slides 158 a 182] Modelos e submodelos: o teste F parcial para a comparação de modelo e submodelo. Algoritmos de pesquisa baseados nas hipóteses Beta_i=0: o algoritmo de exclusão sequencial, o algoritmo de inclusão sequencial e algoritmos alternados de exclusão/inclusão. O Critério de Informação de Akaike (AIC). Algoritmos de escolha de submodelos no R. Prevenções sobre os algoritmos de escolha de submodelos.

(27 Out 09, 3a-f.) [Slides 183 a 199] A Análise dos Resíduos na Regressão Múltipla: distribuição dos resíduos, sendo válido o Modelo; gráficos aconselhados; os conceitos de observação atípica (outlier), observação influente e observação alavanca. Distâncias de Cook. Gráficos de diagnóstico no R. Quatro observações finais sobre as Regressões Lineares: os problemas da multicolinearidade, transformações linearizantes, a extensão às regressões polinomiais e o facto de uma associação estatística não ser sinónimo duma relação de causa e efeito.


(30 Out 09, 6a-f.) [Slides 200 a 235] A Análise de Variância: conceitos introdutórios. A Análise de Variância a um Factor: formulação do modelo como caso particular do Modelo Linear; a estimação dos parâmetros; o modelo para efeitos inferenciais; o teste aos efeitos do factor como teste global de ajustamento do modelo; a leitura particular das Somas de Quadrados no contexto duma ANOVA a 1 factor; as ANOVAs a 1 factor no R.


(3 Nov 09, 3a-f.) [Slides 236 a 245] A exploração ulterior de H1: comparações múltiplas de médias. A distribuição de Tukey para a Amplitude Studentizada duma amostra aleatória Normal. A aplicabilidade deste resultado ao problema da comparação múltipla de médias: intervalos de confiança simultâneos para todas as diferenças de médias de pares de níveis.


(6 Nov 09, 6a-f.) [Slides 246 a 269] Teste de comparações múltiplas de Tukey. Tukey e o R. Uma chamada de atenção sobre Tukey e delineamentos não equilibrados. Uma chamada de atenção sobre os gráficos de resíduos numa ANOVA a 1 factor. A hipótese de homogeneidade de variâncias. Relação entre média aritmética e média geométrica. O Teste de Bartlett. Algumas precauções sobre o teste de Bartlett. Breve discussão sobre o impacto da violação dos pressupostos numa ANOVA. Advertência sobre condições alternativas para ultrapassar o problema de excesso de parâmetros no modelo. Unidades experimentais e a sua homogeneidade. O efeito de heterogeneidade não controlada sobre o teste F aos efeitos do factor. A necessidade de controlar a heterogeneidade das unidades experimentais.


(10 Nov 09, 3a-f.) Resolução de Exercícios de Regressão Linear Múltipla, como preparação para o teste. Exercícios resolvidos: Ex. 10, 11.


(13 Nov 09, 6a-f.) O primeiro teste decorreu no horário da aula teórica.


Jorge Cadima
Last modified: Wed Nov 18 10:45:33 WET 2009