Sumários das aulas Teóricas (Estatística e Delineamento, 2011/12)

Docente: Jorge Cadima
Terças-feiras, 12h30-13h30, e quintas-feiras, 13h00-14h00, Anfiteatro A1.


(13 Set 11, 3a-f.) [Slides 1 a 9] Aula de apresentação: docentes, programa, organização das teóricas e práticas, avaliação de conhecimentos, discussão da data do primeiro teste, bibliografia.
(15 Set 11, 5a-f.) [Slides 10 a 33] Revisão dos conceitos fundamentais de Testes de Hipóteses. Os dados de contagem e o contexto para os testes qui-quadrado de Pearson. Testes de ajustamento de uma distribuição discreta. A estatística de Pearson e sua distribuição assintótica. Critério para a validade da distribuição assintótica. Hipóteses incompletamente especificadas: a estimação de parâmetros e o seu efeito sobre a distribuição da estatística.
(20 Set 11, 3a-f.) [Slides 34 a 56] Testes qui-quadrado para tabelas de contingência. Dois contextos: testes de homogeneidade e testes de independência.
(22 Set 11, 5a-f.) [Slides 57 a 75] O Modelo Linear: conceitos introdutórios de modelação estatística; terminologia e notação relativa à Regressão Linear Simples. Revisão de Regressão Linear Simples como técnica descritiva. Transformações linearizantes para alguns modelos não-lineares frequentes: o caso da relação exponencial.
(27 Set 11, 3a-f.) [Slides 76 a 84] Mais modelos não lineares passíveis de linearização através de transformações das variáveis: logística, potência, hiperbólica e Michaelis-Menten. O problema da inferência na regressão linear simples: recta amostral e recta populacional.
(29 Set 11, 5a-f.) [Slides 85 a 93] O contexto inferencial. O Modelo da Regressão Linear Simples. Primeiras consequências do modelo. Os estimadores dos parâmetros da recta de regressão populacional. A distribuição do estimador do declive da recta de regressão (demonstração incompleta).
(4 Out 11, 3a-f.) [Slides 93 a 102] Conclusão da demonstração relativa ao teorema do Acetato 93 (distribuição do estimador do declive). O problema dos desconhecimento da variância dos erros aleatórios, sigma^2. O Quadrado Médio Residual como estimador de sigma^2. O efeito de substituir sigma^2 por QMRE nas distribuições associadas aos estimadores. Intervalos de confiança para os parâmetros da recta populacional.
(6 Out 11, 5a-f.) [Slides 103 a 117] Discussão dos intervalos de confiança para os parâmetros da recta populacional. Testes de hipóteses (bilaterais e unilaterais) para os parâmetros da recta. Inferência sobre os valores esperados de Y, dado um valor de x: o estimador e a sua distribuição. Intervalos de confiança para E[Y|X=x]. Bandas de confiança.
(11 Out 11, 3a-f.) [Slides 118 a 129] Intervalos e bandas de confiança para E[Y|x] (revisão). Intervalos e bandas de predição para observações individuais de Y, dado X=x. O teste F de ajustamento global, no contexto da regressão linear simples. Hipóteses, estatística e sua distribuição, região crítica.
(13 Out 11, 5a-f.) [Slides 132 a 144] A análise dos resíduos para validar os pressupostos do modelo. A distribuição dos resíduos, dado o Modelo. Gáficos de diagnóstico.
(18 Out 11, 3a-f.) [Slides 145-162] A regressão linear múltipla: conceitos introdutórios; a equação do modelo; as duas formas de representação gráfica; o critério de estimação dos parâmetros; relação entre a minimização de SQRE e uma projecção ortogonal; a fórmula para as estimativas dos parâmetros; a fórmula SQT=SQR+SQRE como aplicação do Teorema de Pitágoras.
(20 Out 11, 5a-f.) [Slides 163 a 176] Revisão da estimação na regressão linear múltipla. O vector das observações centradas de Y e um outro triângulo estatisticamente mais interessante: fórmula fundamental e coeficiente de determinação. O modelo para um contexto inferencial. O modelo tradicional. A caminho do modelo em notação vectorial/matricial. Vectores aleatórios: vectores esperados e matrizes de variância-covariância.
(25 Out 11, 3a-f.) [Slides 177-185] Ferramentas para trabalhar com vectores aleatórios e respectivas propriedades. O modelo de regressão múltipla: versão matricial/vectorial. Primeiras consequências do modelo. O estimador beta_chapéu e respectiva distribuição.
(27 Out 11, 5a-f.) [Slides 186 a 204] Intervalos de confiança e testes para parâmetros individuais. Intervalos de confiança e testes de hipóteses para qualquer combinação linear de parâmetros (incluîndo como casos particulares, somas e diferenças de dois parâmetros e valores esperados de Y, dado um conjunto de valores das variáveis preditoras). Intervalos de predição para observações individuais de Y.
(1 Nov 11, 3a-f.) FERIADO
(3 Nov 11, 5a-f.) [Slides 205 a 221] O teste F de ajustamento global do modelo: formas alternativas das hipóteses e da estatística do teste. O Teste F parcial de comparação de um modelo e um seu submodelo: formas alternativas da estatística do teste. O problema da selecção de submodelos.
(8 Nov 11, 3a-f.) [Slides 221 a 239] O algoritmo de exclusão sequencial para escolher um submodelo. O Critério de Informação de Akaike (AIC) como critério alternativo. A Regressão Polinomial. A análise de resíduos na Regressão Múltipla.
(10 Nov 11, 5a-f.) [Slides 240 a 254] A análise de resíduos na Regressão Múltipla. Algumas ferramentas de diagnóstico: resíduos estandardizados; distâncias de Cook (influência); efeito alavanca (leverage); o R^2 modificado. Advertências finais.
AVISO: A matêria para avaliação no teste de dia 19 de Novembro acaba aqui.
(15 Nov 11, 3a-f.) [Slides 255 a 267] A Análise de Variância. Introdução. A ANOVA como caso particular do Modelo Linear. A ANOVA a um factor. Necessidade duma restrição e natureza dos parâmetros resultantes da opçõo para essa restrição.
(17 Nov 11, 5a-f.) [Slides (268 a 285) e (293 a 295)] A ANOVA a um factor: estimação dos parâmetros. O modelo para efeitos inferenciais. O teste aos efeitos do factor como teste global de ajustamento do modelo. Expressões específicas para as Somas de Quadrados e interpretação da decomposição das Somas de Quadrados neste contexto. A necessidade de testes de coparações múltiplas.
NOTA: Os slides 286 a 292 incluem os principais comandos para ANOVAs no R. São material de leitura aconselhada para as aulas práticas.
(22 Nov 11, 3a-f.) [Slides 296 a 322] (Os slides 304-307 e 319 referem os comandos do R úteis neste contexto; servem sobretudo de apoio às aulas práticas) Comparações múltiplas de médias de nível: o resultado de Tukey; testes e intervalos de confiança baseados nesse resultado. A análise de resíduos: particularidades do contexto ANOVA a um factor. Um teste à homogeneidade de variâncias de nível: o teste de Bartlett (motivação e discussão). Algumas advertências.
(24 Nov 11, 5a-f.) GREVE GERAL
(29 Nov 11, 3a-f.) [Slides 323 a 358] Delineamentos: a importância de unidades experimentais homogéneas; a introdução de novos factores como forma de controlar heterogeneidade nas unidades experimentais. Delineamento factorial a dois factores. O modelo sem interacção: conceitos de base, as restrições aos parâmetros, a decomposição de SQT com parcelas associadas aos efeitos de cada factor. Os dois testes F aos efeitos de cada factor. Fórmulas para um delineamento equilibrado.
(1 Dez 11, 5a-f.) FERIADO
(6 Dez 11, 3a-f.) [Slides 359 a 386] Delineamento factorial a dois factores: o modelo com interacção: conceito de interacção, as restrições aos parâmetros, a decomposição de SQT com parcelas associadas aos efeitos de cada factor e de interacção. Os três testes F associados a cada tipo de efeitos. Fórmulas para os valores ajustados de Y, para os estimadores dos parâmetros e para SQRE. Fórmulas para SQA e SQB num delineamento equilibrado. Comparações múltiplas de médias de células: testes e intervalos de confiança de Tukey. Análise de resíduos e teste de Bartlett no modelo a dois factores com interacção.
(8 Dez 11, 5a-f.) FERIADO
(13 Dez 11, 3a-f.) [Slides 387 a 405] Delineamentos factoriais: gráficos de interacção. Delineamentos a dois factores hierarquizados (nested): conceito, exemplo motivador, modelo, restrições e interpretação dos parâmetros. a decomposição da variância. Os dois testes F aos efeitos do modelo. Adaptações nas comparaçõs múltiplas de Tukey. Análise de resíduos e adaptações no teste de Bartlett.
(15 Dez 11, 5a-f.) Foi resolvido o exercício 14 dos Exercícios de Análise de Variância, relativo a um delineamento hierarquizado.
Jorge Cadima