Friday 7 July 2017

Influência Estatística Em Stata Forex


Análise de Regressão Múltipla usando Stata Introdução A regressão múltipla (uma extensão da regressão linear simples) é usada para prever o valor de uma variável dependente (também conhecida como variável de resultado) com base no valor de duas ou mais variáveis ​​independentes (também conhecidas como variáveis ​​preditoras ). Por exemplo, você pode usar uma regressão múltipla para determinar se a ansiedade do exame pode ser prevista com base na marca do curso, tempo de revisão, atendimento de conferência e pontuação de QI (ou seja, a variável dependente seria a ansiedade do exame e as quatro variáveis ​​independentes seriam a nota do curso, a revisão Tempo, atendimento de conferência e pontuação de QI). Alternativamente, você poderia usar uma regressão múltipla para determinar se a renda pode ser prevista com base na idade, gênero e nível educacional (ou seja, a variável dependente seria renda e as três variáveis ​​independentes seriam idade, gênero e nível educacional). Se você tem uma variável dependente dicotômica você pode usar uma regressão logística binomial. A regressão múltipla também permite que você determine o ajuste geral (variação explicada) do modelo e a contribuição relativa de cada uma das variáveis ​​independentes para a variância total explicada. Por exemplo, você pode querer saber o quanto da variação na ansiedade do exame pode ser explicada pela nota do curso, tempo de revisão, atendimento de conferência e pontuação de QI como um todo, mas também a contribuição relativa de cada variável independente na explicação da variância. Este guia de início rápido mostra como realizar uma regressão múltipla usando o Stata, bem como como interpretar e relatar os resultados desse teste. No entanto, antes de apresentarmos este procedimento, você precisa entender os diferentes pressupostos que seus dados devem atender para que a regressão múltipla lhe dê um resultado válido. Nós discutimos estes pressupostos a seguir. Suposições Existem oito pressupostos que sustentam a regressão múltipla. Se qualquer um desses oito pressupostos não for cumprido, você não pode analisar seus dados usando uma regressão múltipla porque você não obterá um resultado válido. Como as premissas 1 e 2 referem-se à sua escolha de variáveis, elas não podem ser testadas para usar o Stata. No entanto, você deve decidir se seu estudo atende a esses pressupostos antes de seguir em frente. Assunção 1: sua variável dependente deve ser medida no nível contínuo. Exemplos de tais variáveis ​​contínuas incluem altura (medida em pés e polegadas), temperatura (medida em 176C), salário (medido em dólares norte-americanos), tempo de revisão (medido em horas), inteligência (medida com o escore de QI), tempo de reação Em milissegundos), o desempenho do teste (medido de 0 a 100), as vendas (medidas em número de transações por mês), e assim por diante. Se você não tem certeza se sua variável dependente é contínua (ou seja, medido no intervalo ou nível de relação), consulte o nosso Guia de Tipos de Variáveis. Assunção 2: você possui duas ou mais variáveis ​​independentes. Que deve ser medido no nível contínuo ou categórico. Para exemplos de variáveis ​​contínuas. Veja a bala acima. Exemplos de variáveis ​​categóricas incluem gênero (por exemplo, 2 grupos: masculino e feminino), etnia (por exemplo, 3 grupos: caucasiano, afro-americano e hispânico), nível de atividade física (por exemplo, 4 grupos: sedentário, baixo, moderado e alto), profissão (eg 5 grupos: cirurgião, médico, enfermeiro, dentista, terapeuta), e assim por diante. Neste guia, mostramos o procedimento de regressão múltipla porque temos uma mistura de variáveis ​​independentes contínuas e categóricas. Nota: Se você tem apenas variáveis ​​independentes categóricas (ou seja, não há variáveis ​​independentes contínuas), é mais comum abordar a análise a partir da perspectiva de uma ANOVA bidirecional (para duas variáveis ​​independentes categóricas) ou ANOVA fatorial (para três ou mais categórico Variáveis ​​independentes) em vez de regressão múltipla. Felizmente, você pode verificar os pressupostos 3, 4, 5, 6, 7 e 8 usando o Stata. Ao passar às premissas 3, 4, 5, 6, 7 e 8, sugerimos testá-las nesta ordem porque representa uma ordem em que, se uma violação ao pressuposto não for corrigível, você não poderá mais usar múltiplas regressão. Na verdade, não se surpreenda se seus dados falharem em uma ou mais dessas premissas, pois isso é bastante típico quando se trabalha com dados do mundo real, em vez de exemplos de livros didáticos, que geralmente mostram apenas como realizar uma regressão linear quando tudo corre bem. No entanto, não se preocupe, porque mesmo quando seus dados falham em certos pressupostos, muitas vezes há uma solução para superar isso (por exemplo, transformar seus dados ou usar outro teste estatístico em vez disso). Basta lembrar que, se você não verificar se seus dados atendem a essas premissas ou você as testou corretamente, os resultados obtidos ao executar a regressão múltipla podem não ser válidos. Assunção 3: Você deve ter independência de observações (isto é, independência de resíduos), que você pode verificar em Stata usando a estatística de Durbin-Watson. Assunção 4: Deve haver uma relação linear entre (a) a variável dependente e cada uma de suas variáveis ​​independentes, e (b) a variável dependente e as variáveis ​​independentes coletivamente. Você pode verificar a linearidade em Stata usando diagramas de dispersão e parcelas de regressão parcial. Assunção 5: seus dados precisam mostrar homoscedasticidade. Que é onde as variâncias ao longo da linha de melhor ajuste permanecem similares à medida que você se move ao longo da linha. Você pode verificar a homoscedasticidade em Stata, traçando os resíduos estudados contra os valores preditos não padronizados. Assunção 6: seus dados não devem mostrar multicolinearidade. Que ocorre quando você tem duas ou mais variáveis ​​independentes que estão altamente correlacionadas entre si. Você pode verificar essa suposição em Stata através de uma inspeção de coeficientes de correlação e valores ToleranceVIF. Assunção 7: Não deve haver valores atípicos significativos. Pontos altos de alavanca ou pontos altamente influentes. Que representam observações em seu conjunto de dados que são de alguma forma incomuns. Estes podem ter um efeito muito negativo na equação de regressão que é usada para prever o valor da variável dependente com base nas variáveis ​​independentes. Você pode verificar por outliers, pontos de alavanca e pontos influentes usando o Stata. Assunção 8: Os resíduos (erros) devem ser aproximadamente normalmente distribuídos. Que você pode verificar em Stata usando um histograma (com uma curva normal sobreposta) e Plot P-P Normal, ou um Lote Q-Q Normal dos resíduos estudados. Na prática, verificar as hipóteses 3, 4, 5, 6, 7 e 8 provavelmente ocuparão a maior parte do tempo ao realizar uma regressão múltipla. No entanto, não é uma tarefa difícil, e a Stata fornece todas as ferramentas que você precisa para fazer isso. Na seção, Procedimento de teste em Stata. Ilustramos o procedimento Stata necessário para executar uma regressão múltipla assumindo que nenhum pressuposto foi violado. Primeiro, apresentamos o exemplo que usamos para explicar o procedimento de regressão múltipla no Stata. Um pesquisador de saúde quer poder prever o VO 2 max, um indicador de fitness e saúde. Normalmente, para executar este procedimento requer equipamento de laboratório caro, além de exigir que os indivíduos exercem seu máximo (isto é, até que eles não possam continuar exercendo devido ao esgotamento físico). Isso pode afastar indivíduos que não são muito ativos e aqueles que podem estar em maior risco de saúde (por exemplo, assuntos mais antigos inaptos). Por estas razões, foi desejável encontrar uma maneira de prever um indivíduo VO 2 max com base em atributos que podem ser medidos de forma mais fácil e econômica. Para este fim, um pesquisador recrutou 100 participantes para realizar um teste máximo VO 2 max, mas também registrou sua idade, peso, freqüência cardíaca e gênero. A freqüência cardíaca é a média dos últimos 5 minutos de um teste de ciclismo de carga de trabalho de 20 minutos, muito mais fácil e menor. O objetivo dos pesquisadores é poder prever o VO 2 max com base nesses quatro atributos: idade, peso, freqüência cardíaca e gênero. Nota: O exemplo e os dados utilizados para este guia são fictícios. Acabamos de criá-los para os propósitos deste guia. Configuração em Stata In Stata, criamos cinco variáveis: (1) VO 2 max. Qual é a capacidade aeróbica máxima (isto é, a variável dependente) e (2) idade. Que é o peso da idade dos participantes (3). Qual é o peso dos participantes (tecnicamente, é sua massa) (4) heartrate. Qual é a freqüência cardíaca dos participantes e (5) gênero. Qual é o gênero dos participantes (ou seja, as variáveis ​​independentes). Depois de criar essas cinco variáveis, inserimos as pontuações para cada uma nas cinco colunas da planilha do Editor de Dados (Editar), conforme mostrado abaixo: Publicado com permissão por escrito da StataCorp LP. Procedimento de teste no Stata Nesta seção, mostramos como analisar seus dados usando regressão múltipla no Stata quando os oito pressupostos na seção anterior, Suposições. Não foram violados. Você pode realizar uma regressão múltipla usando código ou interface gráfica do usuário do Statas (GUI). Depois de ter realizado sua análise, mostramos como interpretar seus resultados. Primeiro, escolha se deseja usar o código ou a interface gráfica do usuário Statas (GUI). O código para realizar uma regressão múltipla em seus dados assume a forma: regressar DependenteVariável IndependenteVariable1 IndependenteVariable2 IndependenteVariable3 IndependenteVariable4 Usando nosso exemplo onde a variável dependente é VO2max e as quatro variáveis ​​independentes são idade. peso. Heartrate e gênero. O código necessário seria: regress VO2max idade peso musculação i. gender Nota: Você verá a partir do código acima que as variáveis ​​independentes contínuas são simplesmente inseridas como está, enquanto as variáveis ​​independentes categóricas têm o prefixo i (por exemplo, idade para idade, uma vez que é um Variável independente contínua, mas i. gender para gênero, uma vez que esta é uma variável independente categórica). Portanto, digite o código, regresse VO2max age weight heartrate i. gender. E pressione o botão ReturnEnter no seu teclado. Você pode ver a saída da Stata que será produzida aqui. Interface Gráfica do Usuário (GUI) Os sete passos necessários para realizar a regressão múltipla no Stata são mostrados abaixo: Clique em Estatísticas gt Modelos lineares e gt relacionados Regressão linear no menu principal, conforme mostrado abaixo: Publicado com permissão por escrito da StataCorp LP. Nota: Não se preocupe com a seleção de estatísticas gt Modelos lineares e gt relacionados Regressão linear no menu principal, ou que as caixas de diálogo nas etapas a seguir tenham o título, Regressão linear. Você não cometeu um erro. Você está no lugar correto para realizar o procedimento de regressão múltipla. Este é apenas o título que a Stata dá, mesmo quando executa um procedimento de regressão múltipla. Você será apresentado com a regressão - caixa de diálogo de regressão linear, conforme mostrado abaixo: Publicado com permissão por escrito da StataCorp LP. Selecione a variável dependente, VO2max. Da variável Dependente: caixa e selecione as variáveis ​​independentes contínuas, idade. Peso e musculação das variáveis ​​independentes: caixa, usando o botão suspenso, conforme mostrado abaixo: Publicado com permissão por escrito da StataCorp LP. Selecione a variável independente categórica, gênero. Das variáveis ​​independentes: caixa, primeiro clicando no botão. Isto irá apresentá-lo com a seguinte caixa de diálogo onde suas variáveis ​​independentes contínuas (idade e peso) serão já inseridas na caixa Varlist: Publicado com permissão por escrito da StataCorp LP. Deixe a variável Fator selecionada no ndashType da área variablendash. Em seguida, na área ndashAdd factor variablendash, deixe selecionado na caixa Especificação:. Agora, selecione gênero na caixa Variáveis ​​usando o botão suspenso e selecione Padrão na caixa Base. Finalmente, clique no botão. Você receberá a seguinte caixa de diálogo onde a variável categórica independente, i. gender. Foi inserido na caixa Varlist: Publicado com permissão por escrito da StataCorp LP. Clique no botão. Você será retornado para regressar - caixa de diálogo de regressão linear, mas com a variável categórica independente, i. gender. Agora entrou na caixa Variáveis ​​independentes: como mostrado abaixo: Publicado com permissão por escrito da StataCorp LP. Clique no botão. Isso gerará a saída. Interpretando e Reportando a Saída Stata da Análise de Regressão Múltipla A Stata gerará uma única peça de saída para uma análise de regressão múltipla com base nas seleções feitas acima, assumindo que as oito premissas necessárias para a regressão múltipla foram atendidas. Determinando o quão bem o modelo se encaixa O R 2 e o R 2 ajustado podem ser usados ​​para determinar o quão bem um modelo de regressão se ajusta aos dados: A linha R-quadrado representa o valor R 2 (também chamado de coeficiente de determinação), que é a proporção De variância na variável dependente que pode ser explicada pelas variáveis ​​independentes (tecnicamente, é a proporção de variação explicada pelo modelo de regressão acima e além do modelo médio). Você pode ver do nosso valor de 0,577 que nossas variáveis ​​independentes explicam 57,7 da variabilidade de nossa variável dependente, VO 2 max. No entanto, você também precisa ser capaz de interpretar o Adj R-squared (adj. R 2) para informar com precisão seus dados. Significado estatístico O F - ratio prova se o modelo de regressão geral é adequado para os dados. A saída mostra que as variáveis ​​independentes predizem estatisticamente significativamente a variável dependente, F (4, 95) 32,39, p lt .0005 (ou seja, o modelo de regressão é um bom ajuste dos dados). Coeficientes estimados do modelo A forma geral da equação para prever o VO 2 max da idade. peso. O sexo e o gênero são: Núcleo predicado VO 2 max 87,83 ndash (0,165 x idade) ndash (0,385 x peso) ndash (0.118 x heartrate) (13.208 x gênero) Isto é obtido no Coef. Coluna, como mostrado abaixo: Os coeficientes não padronizados indicam o quanto a variável dependente varia com uma variável independente, quando todas as demais variáveis ​​independentes são mantidas constantes. Considere o efeito da idade neste exemplo. O coeficiente não padronizado, B 1. Para a idade é igual a -0.165 (veja a primeira linha da coluna Coef.). Isso significa que, para cada aumento de idade de 1 ano, há uma diminuição no VO 2 max de 0,165 mlminkg. Significado estatístico das variáveis ​​independentes Você pode testar a significância estatística de cada uma das variáveis ​​independentes. Isso verifica se os coeficientes não padronizados (ou padronizados) são iguais a 0 (zero) na população. Se p lt .05, você pode concluir que os coeficientes são estatisticamente significativamente diferentes de 0 (zero). O valor t e o valor p correspondente estão localizados nas colunas t e Pgtt, respectivamente, como destacado abaixo: você pode ver na coluna Pgtt que todos os coeficientes de variáveis ​​independentes são estatisticamente significativamente diferentes de 0 (zero). Embora a intercepção, B 0. É testado quanto à significância estatística, isso raramente é uma descoberta importante ou interessante. Relatando o resultado da análise de regressão múltipla Você poderia escrever os resultados da seguinte maneira: uma regressão múltipla foi executada para prever o VO 2 max do gênero, idade, peso e freqüência cardíaca. Essas variáveis ​​previam estatisticamente significativamente VO 2 max, F (4, 95) 32,39, p lt. 0005, R 2, 577. As quatro variáveis ​​adicionadas de forma estatisticamente significante à predição, p lt .05. Análise de Revisão 13 Para encontrar o erro padrão da estimativa, tomamos a soma de todos os termos residuais quadrados e dividimos por (n-2) e, em seguida, pegue o quadrado Raiz do resultado. Nesse caso, a soma dos resíduos quadrados é 0.090.160.642.250.04 3.18. Com cinco observações, n - 2 3 e SEE (3.183) 12 1.03. A computação para erro padrão é relativamente semelhante à do desvio padrão para uma amostra (n - 2 é usado em vez de n - 1). Isso dá alguma indicação da qualidade preditiva de um modelo de regressão, com números SEE mais baixos indicando que previsões mais precisas são possíveis. No entanto, a medida de erro padrão não indica a medida em que a variável independente explica variações no modelo dependente. Coeficiente de Determinação Como o erro padrão, esta estatística dá uma indicação de quão bem um modelo de regressão linear serve como um estimador de valores para a variável dependente. Ele funciona medindo a fração da variação total na variável dependente que pode ser explicada pela variação na variável independente. Neste contexto, a variação total é constituída por duas frações: Variação total variação explicada variação inexplicável variação total variação total O coeficiente de determinação. Ou variação explicada como porcentagem da variação total, é o primeiro desses dois termos. Às vezes é expresso como 1 - (variação total de variação inexplicada). Para uma regressão linear simples com uma variável independente, o método simples para calcular o coeficiente de determinação é a quadratura do coeficiente de correlação entre as variáveis ​​dependente e independente. Uma vez que o coeficiente de correlação é dado por r, o coeficiente de determinação é popularmente conhecido como R 2. ou R-quadrado. Por exemplo, se o coeficiente de correlação for 0.76, o R-quadrado é (0.76) 2 0.578. Os termos R-quadrado são geralmente expressos em porcentagens, portanto 0,578 seria 57,8. Um segundo método de computação deste número seria encontrar a variação total na variável dependente Y como a soma dos desvios quadrados da média da amostra. Em seguida, calcule o erro padrão da estimativa seguindo o processo descrito na seção anterior. O coeficiente de determinação é então calculado por (variação total na variação Y inexplicável em Y) variação total em Y. Este segundo método é necessário para regressões múltiplas, onde há mais de uma variável independente, mas para nosso contexto, seremos fornecidos O r (coeficiente de correlação) para calcular um R-quadrado. O que R 2 nos diz são as mudanças na variável dependente Y que são explicadas por mudanças na variável independente X. R 2 de 57.8 nos diz que 57.8 das mudanças no resultado Y de X também significa que 1 - 57.8 ou 42.2 de As mudanças em Y são inexplicadas por X e são o resultado de outros fatores. Assim, quanto maior o R-quadrado, melhor a natureza preditiva do modelo de regressão linear. Coeficientes de regressão Para qualquer coeficiente de regressão (interceptar a ou inclinação b), um intervalo de confiança pode ser determinado com as seguintes informações: 13 Um valor de parâmetro estimado de uma amostra 13 Erro padrão da estimativa (SEE) 13 Nível de significância para o t - Distribuição 13 Graus de liberdade (que é tamanho de amostra - 2) 13 Para um coeficiente de inclinação, a fórmula para o intervalo de confiança é dada por btc SEE, onde tc é o valor t crítico no nosso nível significativo escolhido. Para ilustrar, faça uma regressão linear com retornos de fundos mútuos como variável dependente e índice SampP 500 como variável independente. Durante cinco anos de retornos trimestrais, o coeficiente de inclinação b é de 1,18, com um erro padrão da estimativa de 0,147. A distribuição t dos alunos para 18 graus de liberdade (20 trimestres - 2) com um nível de significância de 0,05 é 2.101. Esses dados nos fornecem um intervalo de confiança de 1,18 (0,147) (2,101), ou uma faixa de 0,87 a 1,49. Nossa interpretação é que há apenas uma chance de que a inclinação da população seja inferior a 0,87 ou superior a 1,49 - estamos confiantes de que esse fundo é pelo menos 87 tão volátil quanto o SampP 500, mas não mais de 149 como Volátil, com base em nossa amostra de cinco anos. Teste de Hipóteses e Coeficientes de Regressão Os coeficientes de regressão são freqüentemente testados usando o procedimento de teste de hipóteses. Dependendo do que o analista pretenda provar, podemos testar um coeficiente de inclinação para determinar se explica chances na variável dependente e na medida em que explica as mudanças. Os Betas (coeficientes de inclinação) podem ser determinados acima ou abaixo de 1 (mais voláteis ou menos voláteis do que o mercado). Alphas (o coeficiente de intercepção) pode ser testado em uma regressão entre um fundo mútuo e o índice de mercado relevante para determinar se há evidência de um alfa suficientemente positivo (sugerindo valor agregado pelo gerente do fundo). A mecânica do teste de hipóteses é semelhante aos exemplos que usamos anteriormente. Uma hipótese nula é escolhida com base em um valor não igual a maior ou menor do que o caso, com a alternativa que satisfaz todos os valores não cobertos no caso nulo. Suponha que, em nosso exemplo anterior, regredimos um retorno de fundos mútuos no SampP 500 por 20 trimestres, nossa hipótese é que esse fundo mútuo é mais volátil do que o mercado. Um fundo igual em volatilidade para o mercado terá declive b de 1,0, então, para este teste de hipóteses, apresentamos a hipótese nula (H 0), caso o declive seja menor ou maior a 1,0 (ou seja, H 0: l 1,0 ). A hipótese alternativa H a tem b gt 1.0. Sabemos que este é um caso maior do que o caso (ou seja, um atinente) - se assumimos um nível de significância de 0,05, t é igual a 1,734 em graus de liberdade n - 2 18. Exemplo: Interpretando um teste de hipótese De nossa amostra, nós Tinha estimado b de 1,18 e erro padrão de 0,147. Nossa estatística de teste é calculada com esta fórmula: t coeficiente estimado - coeficiente de hipótese. Erro padrão (1.18 - 1.0) 0.147 0.180.147, ou t 1.224. Para este exemplo, nossa estatística de teste calculada está abaixo do nível de rejeição de 1.734, portanto não podemos rejeitar a hipótese nula de que o fundo é mais volátil do que o mercado. Interpretação: a hipótese de que b gt 1 para este fundo provavelmente precisa de mais observações (graus de liberdade) para ser comprovada com significância estatística. Além disso, com 1,18 apenas um pouco acima de 1,0, é bem possível que este fundo não seja tão volátil quanto o mercado, e estávamos corretos para não rejeitar a hipótese nula. Exemplo: Interpretação de um coeficiente de regressão O exame CFA provavelmente dará as estatísticas resumidas de uma regressão linear e pedirá interpretação. Para ilustrar, assuma as seguintes estatísticas para uma regressão entre um fundo de crescimento de pequena capitalização e o índice Russell 2000: 13 Coeficiente de correlação 13 As duas abreviaturas a entender são RSS e SSE: 13 RSS. Ou a soma de regressão dos quadrados, é a quantidade de variação total na variável dependente Y que é explicada na equação de regressão. O RSS é calculado calculando cada desvio entre um valor Y predito e o valor Y médio, esquadrinhando o desvio e somando todos os termos. Se uma variável independente explica nenhuma das variações em uma variável dependente, então os valores previstos de Y são iguais ao valor médio e RSS 0. 13 SSE. Ou a soma do erro quadrado dos resíduos, é calculado ao encontrar o desvio entre um Y predito e um Y real, o quadrado do resultado e a adição de todos os termos. 13 TSS, ou variação total, é a soma de RSS e SSE. Em outras palavras, este processo ANOVA quebra a variância em duas partes: uma que é explicada pelo modelo e um que não é. Essencialmente, para que uma equação de regressão tenha alta qualidade preditiva, precisamos ver um RSS elevado e um SSE baixo, o que tornará a relação (RSS1) SSE (n - 2) alta e (com base em uma comparação com um F - Valor estatisticamente significativo. O valor crítico é retirado da distribuição F e é baseado em graus de liberdade. Por exemplo, com 20 observações, os graus de liberdade seriam n - 2 ou 18, resultando em um valor crítico (da tabela) de 2.19. Se o RSS fosse 2,5 e a SSE fosse 1,8, então a estatística de teste calculada seria F (2,5 (1,818) 25, que está acima do valor crítico, o que indica que a equação de regressão possui qualidade preditiva (b é diferente de 0) Estimativa de estatísticas econômicas Com modelos de regressão Os modelos de regressão são freqüentemente utilizados para estimar as estatísticas econômicas, como a inflação e o crescimento do PIB. Suponha que a seguinte regressão seja feita entre a inflação anual estimada (X ou variável independente) eo número real (Y ou variável dependente): Usando isso Modelo, o número de inflação previsto seria calculado com base no modelo para os seguintes cenários de inflação: 13 Estimativa de inflação 13 Inflação baseada no modelo 13 As previsões baseadas neste modelo parecem funcionar melhor para estimativas de inflação típicas e sugerem que estimativas extremas tendem a Supera a inflação - por exemplo, uma inflação real de apenas 4,46 quando a estimativa foi de 4,7. O modelo parece sugerir que as estimativas são altamente preditivas. Embora para avaliar melhor este modelo, precisamos ver o erro padrão eo número de observações em que se baseia. Se conhecemos o valor verdadeiro dos parâmetros de regressão (inclinação e interceptação), a variância de qualquer valor previsto de Y seria igual ao quadrado do erro padrão. Na prática, devemos estimar os parâmetros de regressão, portanto nosso valor previsto para Y é uma estimativa baseada em um modelo estimado. Quão confiável podemos estar em tal processo. Para determinar um intervalo de predição, use as seguintes etapas: 1. Preditar o valor da variável dependente Y com base na observação independente X. 2. Calcular a variância do erro de predição, usando o Seguinte equação: 13 Onde: s 2 é o erro padrão quadrado da estimativa, n é o número de observações, X é o valor da variável independente usada para fazer a predição, X é o valor médio estimado da variável independente e sx 2 é a variância de X. 3. Escolha um nível de significância para o intervalo de confiança. 4. Construa um intervalo de confiança de (1 -), usando a estrutura Y t c s f. Este é outro caso em que o material se torna muito mais técnico do que o necessário e pode-se ficar atolado na preparação, quando na realidade a fórmula para a variação de um erro de previsão provavelmente não será coberta. Priorize - não desperdice horas preciosas de estudo memorizando. Se o conceito for testado, provavelmente será dada a resposta para a Parte 2. Simplesmente sabe como usar a estrutura na Parte 4 para responder a uma pergunta. Por exemplo, se a observação X prevista for 2 para a regressão Y 1.5 2.5X, teríamos um Y predito de 1.5 2.5 (2), ou 6.5. Nosso intervalo de confiança é 6.5 t c s f. O t-stat é baseado em um intervalo de confiança escolhido e graus de liberdade, enquanto sf é a raiz quadrada da equação acima (para variância do erro de predição. Se esses números são tc 2.10 para confiança 95 e sf 0.443, o intervalo É 6.5 (2.1) (0.443), ou 5.57 a 7.43. Limitações da análise de regressão Concentre-se em três limitações principais: 1. Instabilidade de parâmetros - Esta é a tendência para que as relações entre as variáveis ​​mudem ao longo do tempo devido a mudanças na economia ou nos mercados , Entre outras incertezas. Se um fundo mútuo produzisse um histórico de retorno em um mercado onde a tecnologia era um setor de liderança, o modelo pode não funcionar quando os mercados estrangeiros e de capitais pequenos são líderes. 2. Divulgação pública do relacionamento - Em um mercado eficiente , Isso pode limitar a eficácia desse relacionamento em períodos futuros. Por exemplo, a descoberta de que os valores baixos de preço a valor de estoque superam o alto valor de preço por valor significa que esses estoques podem ser mais elevados e baseados em valores As abordagens de vestuário não manterão o mesmo relacionamento que no passado. 3. Violação dos relacionamentos de regressão - Anteriormente, resumimos os seis pressupostos clássicos de uma regressão linear. No mundo real, essas premissas são muitas vezes pouco realistas - por ex. Assumindo que a variável independente X não é aleatória.

No comments:

Post a Comment