SUMÁRIOS

ESTATÍSTICA E DELINEAMENTO EXPERIMENTAL

Semestres V (Eng. Florestal) e VII (Eng. Agronómica)

2000/2001


[ Pág. Dep. | Disciplinas | Página da Disciplina EDE


Aula 1 (18.9.00)

Prof. Jorge Cadima

APRESENTAÇÃO: 
  • dos professores
  • do programa 
  • do método de avaliação 
  • dos problemas relativos às aulas práticas 
Aula 2 (21.9.00)

Prof. Jorge Cadima

I. TESTES DE HIPÓTESES

Revisão dos conceitos fundamentais de Inferência Estatística: Conceitos de População, amostra e população de amostras. Conceitos de amostragem aleatória e de inferência estatística. Conceitos de experiência aleatória, espaço de resultados e acontecimento aleatório. Definição de probabilidades. Conceito de variável aleatória e suas formas de caracterização. Conceito de amostra aleatória. Construção de intervalos de confiança: revisão do conceito através do caso de um IC para uma média duma população Normal, com variância conhecida.

Aula 3 (25.9.00)

Prof. Jorge Cadima

I. TESTES DE HIPÓTESES (continuação)

Intervalos de confiança: revisão dos IC para médias populacionais (com variância populacional conhecida ou desconhecida) e para variâncias populacionais (no caso de populações Normais). Uma abordagem alternativa: os Testes de Hipóteses. Exemplificação do conceito através de um Teste a Hipóteses sobre uma média populacional (com variância populacional desconhecida). Os conceitos de Hipóteses Nula e Alternativa. O conceito de Estatística do Teste. O conceito de Região Crítica. As quatro situações possíveis num Teste de Hipóteses, com os dois Tipos de Erros. O nível de significância de um Teste. A definição duma Região Crítica. Regiões Críticas bilaterais e unilaterais.

Aula 4 (28.9.00)

Prof. Jorge Cadima

I. TESTES DE HIPÓTESES. (continuação)

Formalização de Testes de Hipóteses a valores de parâmetros populacionais: formulação das hipóteses, escolha da estatística do Teste, escolha do nível de significância, definição da região crítica, selecção da amostra, cálculo do valor da estatística e conclusões. Novo exemplo de Teste de Hipóteses: um teste de hipóteses a valores da variância duma População Normal. O problema das Hipóteses Nulas Compostas: discussão da escolha do valor fronteiro na definição da região crítica. A falta de simetria entre o papel das Hipóteses Nula e Alternativa. Como deve ser interpretada a Hipóese Nula, e uma sua não rejeição.

Aula 5 (2.10.00)

Prof. Jorge Cadima

I. TESTES DE HIPÓTESES. (continuação)

Novo exemplo: teste de hipóteses sobre a diferença de médias de populações Normais, para amostras independentes. O conceito de potência de um Teste. Testes de Hipóteses e Testes de Significância: o conceito de significância (ou "p-value", em inglês) duma valor observado da estatística. A relação entre os Testes de Hipóteses dados e os Intervalos de Confiança correspondentes. Testes de Hipóteses para comparar as médias de duas populações com base em amostras emparelhadas.

Aula 6 (5.10.00)

Prof. Jorge Cadima

FERIADO
Aula 7  (9.10.00)

Prof. Jorge Cadima

I. TESTES DE HIPÓTESES. (continuação)

Teste de Hipóteses para comparar a variância de duas populações com base em amostras independentes.

Testes Não-paramétricos:

O Teste dos Sinais para testar o valor de quantis populacionais. Conceito, a estatística do Teste e sua distribuição sob a Hipótese Nula. Problemas na definição da Região Crítica para uma Estatística do Teste discreta. Exemplo com um Teste ao valor duma mediana populacional.

Aula 8 (12.10.00)

Prof. Jorge Cadima

I. TESTES DE HIPÓTESES (continuação)

Comentários à utilização do Teste dos Sinais: aproximação pela distribuição Normal para amostras grandes; uma estatística alternativa. O problema de comparar a localização de duas populações com base em amostras emparelhadas: a adequação do Teste dos Sinais. O problema de diferenças nulas.

A comparação da localização de duas populações com base em amostras independentes: o Teste de Wilcoxon-Mann-Whitney. Ideia geral do teste; a estatística do Teste, a distribuição da estatística sob a hipótese de igualdade nas distribuições das duas populações. As possíveis hipóteses alternativas.

Aula 9 (16.10.00)

Prof. Jorge Cadima

I. TESTES DE HIPÓTESES (Conclusão).

Revisão do Teste de Mann-Whitney, com regiões críticas bilaterais e unilaterais. Observações: a formulação de hipóteses com base nas medianas e sua relação com as verdadeiras hipóteses; valor esperado e variância da estatística; aproximação pela distribuição Normal para grandes amostras; o problema dos valores repetidos.

II. TESTES DE AJUSTAMENTO A DISTRIBUIÇÕES.

Introdução ao conceito de Testes de Ajustamento a Distribuições. Hipóteses simples e compostas para distribuições.

O Teste do Qui-quadrado: Aplicabilidade para variáveis discretas, contínuas e mesmo categóricas. Frequências esperadas e observadas. A estatística de Pearson e sua distribuição assintótica. A forma de região crítica. Critério para a admissibilidade da aproximação da distribuição.

Aula 10 (19.10.00)

Prof. Jorge Cadima

II. TESTES DE AJUSTAMENTO (continuação)

O Teste do Qui-Quadrado com hipóteses nulas compostas. Quatro exemplos de aplicação do Teste do Qui-Quadrado: ajustamento a uma distribuição Uniforme, completamente especificada (caso de uma variável categórica); ajustamento a uma Binomial completamente especificada (variável discreta); ajustamento a uma Binomial sem especificação do parâmetro p; ajustamento a uma distribuição Normal, sem qualquer parâmetro especificado (variável contínua).

O Teste de Kolmogorov-Smirnov, para ajustar distribuições de variáveis contínuas completamente especificadas: o conceito de distribuição cumulativa empírica, a estatística do Teste e sua interpretação, a natrureza da Região Crítica. O caso de hipóteses nulas compostas: a distribuição de Lilliefors para o caso de Normalidade.

Aula 11 (23.10.00)

Prof. Jorge Cadima

II. TESTES DE AJUSTAMENTO (conclusão)

Exemplo de aplicação do Teste de Kolmogorov-Smirnov. Um teste de ajustamento para uma distribuição específica: o Teste de Shapiro-Wilk. A estatística do Teste de Shapiro-Wilk, e a natureza da região crítica associada.

III. A REGRESSÃO LINEAR.

Conceitos fundamentais de Regressão Linear. A Regressão Linear num contexto inferencial. O Modelo de Regressão Linear Simples. Consequências do Modelo. Valores estimados de Y, resíduos e soma dos quadrados dos resíduos. O critério de estimação dos parâmetros da recta teórica.

Aula 12 (26.10.00)

Prof. Jorge Cadima

III. REGRESSÃO LINEAR (continuação)

Dedução dos estimadores de mínimos quadrados para o declive da recta e a ordenada na origem. Distribuição dos estimadores de beta-zero e beta-um: os resultados e a sua demonstração.

Aula 13 (30.10.00)

Prof. Jorge Cadima

III. REGRESSÃO LINEAR (continuação)

A covariância entre os estimadores de beta-zero e beta-um (e a sua falta de independência). A recta teórica e a recta estimada. A distribuição de probabilidades do estimador do valor da recta teórica no ponto X=x_i. A necessidade de estimar a variância dos erros aleatórios para poder estimar beta-zero, beta-um e a recta teórica. O estimador QMRE. A distribuição de probabilidades associada à Soma de Quadrados Residual. As distribuições de probabilidades associadas aos estimadores de beta-zero, beta-um e da recta teórica, sem a utilização de quantidades populacionais desconhecidas. Uma primeira aplicação: um intervalo de confiança para o declive da recta teórica, beta-um.

Aula 14 (2.11.00)

Prof. Jorge Cadima

III. REGRESSÃO LINEAR (continuação)

A inferência sobre os parâmetros da recta de regressão: o seu significado; os intervalos de confiança e os Testes de Hipóteses. A inferência sobre os valores esperados de Y, dado um valor de x (inferência sobre a recta de regressão): intervalos de confiança e Testes de Hipóteses. Mais resultados relativos à regressão linear: as três somas de quadrados, a sua natureza e a relação entre elas. O coeficiente de determinação e seu significado num contexto inferencial.

Aula 15 (6.11.00)

Prof. Jorge Cadima
III. REGRESSÃO LINEAR (continuação)

Alguns resultados relativos à Soma de Quadrados da Regressão, incluíndo a distribuição que lhe está associada se beta-um fôr zero. O teste de ajustamento do Modelo de Regressão Linear Simples: a estatística do Teste, sua distribuição caso beta-um seja nulo, e a natureza da Região Crítica associada ao Teste. A relação entre o Teste a beta-um, usando a estatística t, e o teste de ajustamento do modelo, no caso da Regressão Linear Simples. A Tabela-Resumo da Regressão. A validação do Modelo: desconhecimento dos erros; distribuição dos resíduos, dado o Modelo e sua falta de independência.

Aula 16 (9.11.00)

Prof. Jorge Cadima
III. REGRESSÃO LINEAR (continuação)

A validação das hipóteses do Modelo relativas aos erros aleatórios através do estudo dos resíduos. Os resíduos internamente Studentizados: sua definição e justificação. Os problemas que dificultam a existência de testes formais às hipóteses sobre os erros aleatórios. A análise gráfica para procurar violações grosseiras às hipóteses do Modelo: histogramas, qqplots, nuvens de pontos de resíduos contra valores estimados de Y; contra valores de x; contra a ordem de observação (quando isso fôr relevante). O problema das observações atípicas (outliers): sua natureza e forma de abordagem. Os resíduos externamente Studentizados e um critério de classificação de outliers. Um exemplo de aplicação da Regressão Linear Simples: Area Foliar vs.Comprimento da Nervura Principal nas folhas da casta Fernão Pires.

Aula 17 (13.11.00)

Prof. Jorge Cadima
III. REGRESSÃO LINEAR (continuação)

A abordagem matricial da regressão linear simples. A relação de base entre Y e x, em notação matricial. O problema geométrico associado à estimação dos parâmetros do modelo pelo método dos mínimos quadrados: a regressão como uma projecção. O vector dos parâmetros estimados, e sua equivalência com os resultados obtidos anteriormente. A definição de vector esperado e de matriz de variâncias-covariâncias dum vector aleatório.O caso do vector aleatório dos erros e do vector aleatório das observações de Y, no caso do MRLS. O vector esperado e a matriz de variâncias-covariâncias dum produto AY (A matriz constante e Y vector aleatório). A utilização destes resultados no (re-)cálculo do vector esperado e matriz de variâncias-covariâncias dos estimadores dos parâmetros da recta, e das matrizes de variâncias-covariâncias de erros aleatórios e valores estimados de Y.

Aula 18 (16.11.00)

Prof. Jorge Cadima
III. REGRESSÃO LINEAR (continuação)

O Modelo de Regressão Linear Múltipla (MRLM): hipóteses e primeiras consequências. A abordagem matricial do MRLM, e equivalência ao problema da Regressão Linear Simples.Os estimadores dos parâmetros beta_i, e as respectivas distribuições Normais. O problema da variância (desconhecida) dos erros aleatórios. A distribuição associada à Soma de Quadrados Residual. A distribuição associada aos beta_i utilizando o Quadrado Médio Residual. Intervalos de Confiança e Testes de Hipóteses para os beta_i.

Aula 19 (20.11.00)

Prof. Jorge Cadima
III. REGRESSÃO LINEAR (continuação)

O teste de ajustamento global do Modelo de Regressão Linear Múltipla: a natureza das hipóteses; distribuição associada à Soma de Quadrados devida à Regressão; independência entre SQR e SQRE; a estatística F e sua interpretação; a natureza da Região Crítica. A validação das hipóteses do Modelo relativas aos erros aleatórios através da inspecção gráfica dos resíduos.

A inferência sobre os valores esperados de Y, dado um conjunto de valores das variáveis x_i. Resultados conducentes a intervalos de confiança para esse valor esperado: o caso em que o conjunto de valores das variáveis predictoras foi observado, e o caso em que se trata dum conjunto de valores não observado.

Aula 20 (23.11.00)

Prof. Jorge Cadima
III. REGRESSÃO LINEAR (conclusão)

Submodelos dum modelo de Regressão Múltipla. Um teste para avaliar se um dado Submodelo difere significativamente do Modelo completo: o teste dos Modelos Encaixados. Algoritmos de escolha de Submodelos que não difiram significativamente do Modelo completo: os algoritmos Backward e Forward.

 Aula 21 (27.11.00)

Prof. Jorge Cadima
IV. A ANÁLISE DE VARIÂNCIA

Introdução. O conceito de delineamento experimental. Aspectos que caracterizam diferentes delineamentos experimentais. A natureza da variável-resposta. O delineamento a 1 factor, totalmente casualizado, de efeitos fixos e equilibrado. Exemplo. O Modelo associado a esse delineamento. As hipóteses a testar. Os estimadores de Mínimos Quadrados das constantes do Modelo. Algumas consequências do Modelo.

Aula 22 (30.11.00)

Prof. Jorge Cadima
IV. A ANÁLISE DE VARIÂNCIA (continuação)

A distribuição do estimador dos efeitos de nível do factor. As três Somas de Quadrados. O papel da Soma de Quadrados associada aos Nîveis do Factor. A relação SQT=SQA+SQRE. As distribuições de probabilidades associadas a SQRE (sempre) e SQA (se H_0 verdadeira). Consequências desses resultados. A estatística do Teste aos efeitos de nível do Factor. A natureza da Região Crítica associada ao Teste, baseada nos valores esperados de QMRE e QMA.

A validação das hipóteses do Modelo relativas aos erros aleatórios: (i) com base na inspecção gráfica dos resíduos; e (ii) com base no Teste de Bartlett para validar a hipótese de variâncias homogéneas nos vários níveis do Factor.

Aula 23 (4.12.00)

Prof. Jorge Cadima
IV. A ANÁLISE DE VARIÂNCIA (continuação)

Um exemplo de aplicação duma ANOVA a um Factor, totalmente casualizado, de efeitos fixos e equilibrado. O problema do estudo da Hipótese alternativa, quando se rejeita H_0. O teste da Diferença Mínima Significativa: derivação e aplicabilidade. A necessidade de testes de comparações múltiplas. As amplitudes Studentizadas. O Teste de Tukey.

Aula 24 (7.12.00)
Prof. Jorge Cadima
IV. A ANÁLISE DE VARIÂNCIA (continuação)

A comparação múltipla através de contrastes: o Teste de Scheffé. O Delineamento a Um Factor com Blocos Casualizados (de efeitos fixos no Factor e nos Blocos). Introdução ao conceito de Blocos Casualizados. O Modelo associado: hipóteses do Modelo, consequências, estimadores de Mínimos Quadrados dos parâmetros do Modelo. O objectivo do estudo: as hipóteses Nula e Alternativa que se pretende testar. As 4 Somas de Quadrados associadas ao Modelo. As distribuições associadas às Somas de Quadrados. A estatística F do Teste.

Aula 25 (11.12.00)

Prof. Jorge Cadima
IV. A ANÁLISE DE VARIÂNCIA (continuação)

Justificação para o Teste Geral ANOVA no caso de um Delineamento a Um Factor, com Blocos Casualizados: a natureza da Região Crítica. A validação do Modelo, incluíndo a validação da opção por Blocos, através do Teste aos Efeitos de Bloco. As comparações à posteriori. O Delineamento a Dois Factores, Factorial, de efeitos fixos e equilibrado. O conceito de interacção. O Modelo. Os estimadores de Mínimos Quadrados das constantes do Modelo. Os três tipos de Testes a efectuar.

Aula 26 (14.12.00)

Prof. Jorge Cadima
IV. A ANÁLISE DE VARIÂNCIA (conclusão)

As Somas de Quadrados no Delineamento Factorial a 2 Factores: definiçõs, propriedades, valores esperados, distribuições associadas (caso sejam verdade as hipóteses nulas. Os três testes gerais associados a este delineamento. A Validação das hipóteses do Modelo. Os testes de comparações à posteriori: no caso de se admitir efeitos de interacção; no caso de não se admitir interacção. A Tabela-Resumo dum delineamento factorial a 3 factores.


[ Pág. Dep. | Disciplinas | Página da Disciplina EDE