Tuesday 12 September 2017

Measuring Skewness And Kurtosis In Stata Forex


Uma abordagem simplificada para calcular a volatilidade Muitos investidores experimentaram níveis anormais de volatilidade do desempenho do investimento durante vários períodos do ciclo do mercado. Embora a volatilidade possa ser maior do que o esperado durante determinados períodos de tempo, também pode ser feito um caso de que a forma como a volatilidade é normalmente medida contribui para o problema da volatilidade inesperada. O objetivo deste artigo é discutir as questões associadas à medida tradicional da volatilidade e explicar uma abordagem mais intuitiva que pode ser usada pelos investidores, a fim de ajudá-los a avaliar a magnitude dos riscos de investimento. Medida tradicional da volatilidade A maioria dos investidores deve estar ciente de que o desvio padrão é a estatística típica utilizada para medir a volatilidade. O desvio padrão é simplesmente definido como a raiz quadrada do desvio médio quadrático dos dados da sua média. Embora esta estatística seja relativamente fácil de calcular, os pressupostos por trás da sua interpretação são mais complexos, o que, por sua vez, suscita preocupação quanto à sua precisão. Como resultado, há um certo nível de ceticismo em torno de sua validade como uma medida precisa de risco. (Para saber mais, veja Os Usos e Limites de Volatilidade.) Para explicar, para que o desvio padrão seja uma medida precisa de risco, deve-se concluir que os dados do desempenho do investimento seguem uma distribuição normal. Em termos gráficos, uma distribuição normal de dados será traçada em um gráfico de uma maneira que se parece com uma curva em forma de sino. Se esse padrão for verdade, então aproximadamente 68 dos resultados esperados devem situar-se entre 1 desvio padrão do retorno esperado dos investimentos. 95 deve situar-se entre 2 desvios-padrão e 99 deve situar-se entre 3 desvios-padrão. Por exemplo, durante o período de 1º de junho de 1979 até 1º de junho de 2009, o desempenho médio anualizado do índice SampP 500 de três anos foi de 9,5 e seu desvio padrão foi de 10. Atendendo a esses parâmetros de desempenho iniciais, seria de esperar Que 68 do tempo o desempenho esperado do índice SampP 500 ficaria dentro de um intervalo de -0,5 e 19,5 (9,5 10). Infelizmente, existem três razões principais pelas quais os dados do desempenho do investimento podem não ser normalmente distribuídos. Em primeiro lugar, o desempenho do investimento é normalmente distorcido, o que significa que as distribuições de retorno são tipicamente assimétricas. Como resultado, os investidores tendem a experimentar períodos de desempenho anormalmente altos e baixos. Em segundo lugar, o desempenho do investimento tipicamente exibe uma propriedade conhecida como kurtosis. O que significa que o desempenho do investimento exibe um número anormalmente grande de períodos positivos ou negativos de desempenho. Em conjunto, esses problemas danificam a aparência da curva em forma de sino e distorcem a precisão do desvio padrão como medida de risco. Além da aspereza e da curtose, um problema conhecido como heterocedasticidade também é motivo de preocupação. Heterosqueticidade simplesmente significa que a variância dos dados de desempenho de investimento de amostra não é constante ao longo do tempo. Como resultado, o desvio padrão tende a flutuar com base no comprimento do período de tempo usado para fazer o cálculo, ou o período de tempo selecionado para fazer o cálculo. Como a aspereza e a curtose, as ramificações da heterocedasticidade causarão um desvio padrão como uma medida de risco pouco confiável. Tomados coletivamente, esses três problemas podem fazer com que os investidores entendam mal a potencial volatilidade de seus investimentos e levem a potencialmente riscos muito mais do que o esperado. (Para saber mais, consulte o nosso Guia de exame de métodos quantitativos de nível 1 de CFA). Uma medida simplificada da volatilidade Felizmente, há uma maneira muito mais fácil e precisa de medir e examinar o risco. Através de um processo conhecido como método histórico, o risco pode ser capturado e analisado de forma mais informativa do que através do uso do desvio padrão. Para utilizar este método, os investidores simplesmente precisam representar o histórico do desempenho de seus investimentos, gerando um gráfico conhecido como um histograma. Um histograma é um gráfico que traça a proporção de observações que se enquadram em vários tipos de categorias. Por exemplo, no gráfico abaixo, foi realizado o desempenho médio anualizado do índice SampP 500 de três anos para o período de 1º de junho de 1979 até 1º de junho de 2009. O eixo vertical representa a magnitude do desempenho do Índice SampP 500 e o eixo horizontal representa a freqüência em que o Índice SampP 500 teve esse desempenho. Figura 1: Histograma de desempenho do índice SampP 500: Investopedia 2009 Como ilustra o gráfico, o uso de um histograma permite aos investidores determinar a porcentagem de tempo em que a performance de um investimento está dentro, acima ou abaixo de um determinado intervalo. Por exemplo, 16 das observações do desempenho do Índice SampP 500 obtiveram retorno entre 9 e 11,7. Em termos de desempenho abaixo ou acima de um limiar, também pode ser determinado que o índice SampP 500 sofreu uma perda maior ou igual a 1,1, 16 do tempo e desempenho acima de 24,8, 7,7 do tempo. Comparando os Métodos O uso do método histórico através de um histograma tem três vantagens principais sobre o uso do desvio padrão. Primeiro, o método histórico não requer que o desempenho do investimento seja normalmente distribuído. Em segundo lugar, o impacto da aspereza e da curtose é explicitamente capturado no gráfico de histograma, que fornece aos investidores as informações necessárias para mitigar a surpresa de volatilidade inesperada. Em terceiro lugar, os investidores podem examinar a magnitude dos ganhos e perdas experimentados. A única desvantagem para o método histórico é que o histograma, como o uso do desvio padrão, sofre do impacto potencial da heteroscedilástica. No entanto, isso não deve ser uma surpresa, pois os investidores devem entender que o desempenho passado não é indicativo de retornos futuros. Em qualquer caso, mesmo com esta ressalva, o método histórico ainda serve como uma excelente medida de linha de base do risco de investimento e deve ser usado pelos investidores para avaliar a magnitude e a freqüência de seus ganhos e perdas potenciais associados às suas oportunidades de investimento. Aplicação da Metodologia Agora que os investidores entendem que o método histórico pode ser usado como uma maneira informativa de medir e analisar o risco, a questão então se torna: como os investidores geram um histograma para ajudá-los a examinar os atributos de risco de seus investimentos. Uma recomendação É solicitar a informação de desempenho do investimento das empresas de gestão de investimentos. No entanto, as informações necessárias também podem ser obtidas através da coleta do preço de fechamento mensal da opção de investimento, geralmente encontrada através de várias fontes, e depois do cálculo manual do desempenho do investimento. Depois que as informações de desempenho foram coletadas ou calculadas manualmente, um histograma pode ser construído importando os dados para um pacote de software, como o Microsoft Excel. E usando o recurso de complemento de análise de dados de softwares. Ao utilizar esta metodologia, os investidores devem ser capazes de gerar facilmente um histograma, o que, por sua vez, deve ajudá-los a avaliar a verdadeira volatilidade de suas oportunidades de investimento. Conclusão Em termos práticos, a utilização de um histograma deve permitir aos investidores examinar o risco de seus investimentos de forma a ajudá-los a avaliar a quantidade de dinheiro que eles podem fazer ou perder anualmente. Dado este tipo de aplicabilidade do mundo real, os investidores devem ser menos surpreendidos quando os mercados flutuam drasticamente e, portanto, eles devem se sentir muito mais satisfeitos com sua exposição ao investimento em todos os ambientes econômicos. (Para mais, veja Compreensão das medidas de volatilidade.) Skewness e Kurtosis Uma tarefa fundamental em muitas análises estatísticas é caracterizar a localização e a variabilidade de um conjunto de dados. Uma caracterização adicional dos dados inclui a aspereza e a curtosis. Skewness é uma medida de simetria, ou mais precisamente, a falta de simetria. Uma distribuição ou conjunto de dados é simétrico se parecer o mesmo à esquerda e à direita do ponto central. A curtose é uma medida de se os dados são pesados ​​ou ligeiros em relação a uma distribuição normal. Ou seja, os conjuntos de dados com alta curtose tendem a ter caudas pesadas, ou outliers. Os conjuntos de dados com baixa curtidez tendem a ter caudas leves, ou a falta de outliers. Uma distribuição uniforme seria o caso extremo. O histograma é uma técnica gráfica efetiva para mostrar a aspereza e a curtose do conjunto de dados. Definição de Skewness Para dados univariados Y 1. Y 2. Y N. A fórmula para skewness é: g frac (Y - bar) N onde (bar) é a média, s é o desvio padrão e N é o número de pontos de dados. Note-se que, ao computar a aspereza, o s é calculado com N no denominador em vez de N - 1. A fórmula acima para a afinidade é referida como o coeficiente Fisher-Pearson de skewness. Muitos programas de software realmente calculam o coeficiente de Fisher-Pearson ajustado de ignição G frac frac (Y-bar) N Este é um ajuste para o tamanho da amostra. O ajuste se aproxima de 1, pois N é grande. Para referência, o fator de ajuste é 1,49 para N 5, 1,19 para N 10, 1,08 para N 20, 1,05 para N 30 e 1,02 para N 100. A asfalto para uma distribuição normal é zero e qualquer dado simétrico deve ter uma afinidade Perto de zero. Os valores negativos para o skewness indicam dados que estão distorcidos para a esquerda e os valores positivos para o skewness indicam dados que estão distorcidos diretamente. Por distorcido à esquerda, queremos dizer que a cauda esquerda é longa em relação à cauda direita. Da mesma forma, a direita distorcida significa que a cauda direita é longa em relação à cauda esquerda. Se os dados forem multimodais, isso pode afetar o sinal da aspereza. Algumas medidas têm um limite inferior e estão inclinadas para a direita. Por exemplo, em estudos de confiabilidade, os tempos de falha não podem ser negativos. Deve-se notar que existem definições alternativas de skewness na literatura. Por exemplo, o Galton skewness (também conhecido como Bowleys skewness) é definido como mbox frac Q -2 Q-Q, onde Q 1 é o quartil inferior, Q 3 é o quartil superior e Q 2 é a mediana. O skewness Pearson 2 O coeficiente é definido como S3 fractail) onde (tilde) é a mediana da amostra. Há muitas outras definições para a ignorância que não serão discutidas aqui. Definição de Kurtosis Para dados univariados Y 1. Y 2. Y N. A fórmula para a curtose é: mbox frac (Y - bar) N onde (bar) é a média, s é o desvio padrão e N é o número de pontos de dados. Note-se que, ao calcular a curtose, o desvio padrão é computado usando N no denominador em vez de N - 1. Definição Alternativa de Kurtose A curtose para uma distribuição normal padrão é de três. Por esse motivo, algumas fontes usam a seguinte definição de curtose (muitas vezes referida como excesso de curtose): mbox frac (Y - bar) N - 3 Esta definição é usada de modo que a distribuição normal padrão tenha uma kurtosis de zero. Além disso, com a segunda definição, a correção positiva indica que uma distribuição de cauda pesada e uma curtose negativa indicam uma distribuição ligeira. A definição de kurtosis utilizada é uma questão de convenção (este manual usa a definição original). Ao usar o software para calcular a curtose da amostra, você precisa estar ciente de qual convenção está sendo seguida. Muitas fontes usam o termo "kurtosis" quando eles estão realmente calculando o excesso de curtose, portanto, nem sempre pode ser claro. O exemplo a seguir mostra histogramas para 10.000 números aleatórios gerados a partir de um normal, um duplo exponencial, um Cauchy e uma distribuição de Weibull. O primeiro histograma é uma amostra de uma distribuição normal. A distribuição normal é uma distribuição simétrica com caudas bem comportadas. Isso é indicado pela asqueria de 0,03. A curtose de 2,96 está perto do valor esperado de 3. O histograma verifica a simetria. Distribuição Exponencial Dupla O segundo histograma é uma amostra de uma distribuição exponencial dupla. A exponencial dupla é uma distribuição simétrica. Comparado com o normal, ele tem um pico mais forte, uma decadência mais rápida e caudas mais pesadas. Ou seja, esperamos uma ascensão próxima a zero e uma kurtosis superior a 3. A asmotomia é 0,06 e a curtose é de 5,9. O terceiro histograma é uma amostra de uma distribuição de Cauchy. Para melhor comparação visual com os outros conjuntos de dados, restringimos o histograma da distribuição Cauchy a valores entre -10 e 10. O conjunto completo de dados para os dados Cauchy, de fato, tem um mínimo de aproximadamente -29,000 e um máximo de aproximadamente 89,000. A distribuição de Cauchy é uma distribuição simétrica com caudas pesadas e um único pico no centro da distribuição. Uma vez que é simétrico, esperamos uma ascensão próxima a zero. Devido às caudas mais pesadas, podemos esperar que a curtosis seja maior do que para uma distribuição normal. Na verdade, a aspereza é 69,99 e a curtose é 6,693. Estes valores extremamente elevados podem ser explicados pelas caudas pesadas. Assim como o desvio padrão e padrão pode ser distorcido por valores extremos nas caudas, também pode a medida da aspereza e da curtose. O quarto histograma é uma amostra de uma distribuição de Weibull com o parâmetro de forma 1.5. A distribuição de Weibull é uma distribuição distorcida com a quantidade de skewness dependendo do valor do parâmetro de forma. O grau de deterioração à medida que nos afastamos do centro também depende do valor do parâmetro da forma. Para este conjunto de dados, o skewness é 1.08 e a curtose é 4.46, o que indica uma asmose moderada e uma curtose. Lidar com Skewness e Kurtosis Muitos testes e intervalos estatísticos clássicos dependem de pressupostos de normalidade. Assegura e kurtosis significativas indicam claramente que os dados não são normais. Se um conjunto de dados exibir esqueleto ou kurtosis significativo (como indicado por um histograma ou as medidas numéricas), o que podemos fazer sobre isso. Uma abordagem é aplicar algum tipo de transformação para tentar tornar os dados normais ou mais normais. A transformação Box-Cox é uma técnica útil para tentar normalizar um conjunto de dados. Em particular, tomar o registro ou a raiz quadrada de um conjunto de dados é frequentemente útil para dados que exibem uma omissão direta moderada. Outra abordagem é usar técnicas baseadas em distribuições diferentes do normal. Por exemplo, em estudos de confiabilidade, as distribuições exponenciais, Weibull e lognormal normalmente são usadas como base para modelagem em vez de usar a distribuição normal. O gráfico do coeficiente de correlação da trama de probabilidade e o gráfico de probabilidades são ferramentas úteis para determinar um bom modelo de distribuição para os dados. Os coeficientes de skewness e kurtosis estão disponíveis na maioria dos programas de software estatístico de propósito geral.

No comments:

Post a Comment