Eu quero calcular as taxas de crescimento em Stata para observações com a mesma ID. Meus dados se assemelham a isto de forma simplificada: Agora eu quero calcular para cada ID taxas de crescimento de variáveis af de 2010 a 2017: Por exemplo, ID 10 e variável a seria: (3-2) / 2, para a variável b . (5-4) / 4, etc. e armazenar os resultados em novas variáveis (por exemplo, crescimento, crescimento, etc). Como eu tenho mais de 120k observações e cerca de 300 variáveis, existe uma maneira eficiente de fazê-lo (loop) Meu código parece o seguinte (simplificado): FYI: variáveis a-f são numéricas. Mas Stata diz: local não encontrado e não tenho certeza se o código está correto. Eu também tenho que classificar para o primeiro ano pediu agosto 25 15 at 8:31 Que código você tentou Querendo código e ter nenhum não é um problema de programação para estouro de pilha. Ndash Nick Cox Aug 25 15 em 9:04 Obrigado por lembrar. Eu coloquei no post original. Ndash Jay G Aug 25 15 at 9:15 1 Resposta O erro específico em é um erro na sintaxe de foreach. Que aqui espera sintaxe como foreach x de variáveis locais. Dado o seu uso anterior de uma macro local. Com a palavra - chave em. Foreach toma a palavra local literalmente e aqui procura uma variável com esse nome: daí a mensagem de erro. Esta é a sintaxe foreach básica: veja a sua ajuda. Este código é problemático por outras razões. A classificação no ID não garante a ordem de classificação correta, aqui a ordem do tempo por ano. Para cada identificação distinta. Se as observações são misturadas dentro de ID. Os resultados serão lixo. O código assume que todos os valores de tempo estão presentes, caso contrário o intervalo de tempo entre as observações pode ser desigual. Uma maneira mais limpa de obter taxas de crescimento é uma vez que você tem tsset (ou xtset) os operadores série de tempo pode ser usado sem medo: a classificação correta é automática e os operadores são inteligentes sobre lacunas nos dados (por exemplo, saltos de 1982 a 1984 em dados anuais ). Para mais variáveis o loop poderia ser onde ltwhatevergt poderia ser um general (numérico) varlist. EDIT: A questão mudou desde o primeiro lançamento e os juros são declarados no cálculo das taxas de crescimento somente de 2010 a 2017, com a implicação no exemplo de que apenas esses anos estão presentes. O código mais geral acima, naturalmente, continuará a trabalhar para o cálculo dessas taxas de crescimento. Métodos Demográficos Princeton University Este é o site para Eco 572 Métodos de Pesquisa em Demografia. Como oferecido na Primavera de 2017. O curso é cruzado como Pop 502 e Soc 532. O site tem uma coleção de folhetos, a maioria deles mostrando como usar Stata ou R (com dplyr e ggplot2) na análise demográfica. Os estudantes registrados encontrarão o programa e materiais adicionais no quadro-negro do site. 1. Tarifas e Normalização Heres uma folha de cálculo sobre as taxas de crescimento e tempo de duplicação. O tópico da primeira classe, seguido por um sobre Taxas e Padronização. Onde discutimos a padronização direta e indireta e a decomposição das diferenças de taxas, os sujeitos do nosso segundo encontro. 2. Interpolação e Graduação Na semana 2, começamos com a idade amontoando e índice de Myers antes de entrar no maravilhoso mundo de splines. Para saber mais sobre meios de execução, linhas em execução e todos os tipos de splines, leia as primeiras 6 páginas de um folheto de demografia estatística em Regressão não-paramétrica e Suavização. As aplicações começam com meios e linhas de execução. Incluindo o lowess mais suave, e continuar com splines de regressão e interpolação spline. 3. Tabelas de Vida Começamos semana 3 com uma revisão de tabelas de vida, e um folheto na construção de tabela de vida de período. Discutimos também a estimativa de Kaplan-Meir de uma curva de sobrevivência a partir de dados censurados. 4. Sobrevivência Como rapidamente nós envelhecemos Nós encaixamos uma curva de Gompertz à mortalidade adulta nos E. U.A. Nós trabalhamos com sobrevivência masculina e convidamo-lo a fazer os mesmos cálculos para fêmeas. Temos uma ilustração do modelo logit relacional Brasss e uma aplicação da regressão de Cox aos dados de recaída de câncer que usamos para Kaplan-Meier. 5. Heterogeneidade não observada Leia este folheto sobre a heterogeneidade não observada como uma alternativa para o papel na lista de leitura. (Foco na heterogeneidade gama e na fórmula de inversão). A ilustração trata da heterogeneidade e da mortalidade cruzada. 6. Riscos Competentes Examinamos o exemplo do livro de texto que trabalha com tabelas de vida de múltiplo decremento e de eliminação de causas, incluindo uma abordagem simplificada que assume riscos constantes dentro de cada faixa etária. Ilustramos as tabelas de vida de incremento-decremento usando um conjunto de dados clássico sobre a descontinuidade de contraceptivos. 7. Nupcialidade A primavera está no ar e nos voltamos para um estudo de matrimônio. O folheto abrange as tabelas de vida do estado atual. Com aplicações à nupcialidade e duração da amamentação. E heres a aplicação dos modelos de Coale-McNeil e de Hernes do casamento. 8. Taxas de Fertilidade Começamos nosso estudo de fertilidade computando taxas de fertilidade específicas de idade de dados de pesquisa usando um método exato e aproximado. Nós ajustamos Coales modelo de fertilidade conjugal por idade para os dados em Brostroms papel. Em seguida, aplicamos o modelo Páginas para estudar a fertilidade por idade e duração desde a primeira união em áreas urbanas e rurais. 9. Intervalos de nascimento Heres a bith intervalos de análise da transição do segundo para o terceiro nascimento na Colômbia, em 1976, por lugar de residência da infância. Incluo cálculos ilustrativos de quintess e trimeans e, para boa medida, um modelo de riscos proporcionais. 10. Efeitos do Tempo Para fornecer alguns antecedentes para a nossa discussão dos efeitos do tempo sobre a fertilidade e mortalidade, está uma análise da fertilidade dos EUA 1917-1980. Incluindo uma aplicação da fórmula de tradução de Ryders e o ajuste do tempo Bongaarts-Feeney. 11. Projeções de População Os folhetos incluem uma aplicação do método de componente de coorte aos dados suecos no livro de texto usando uma matriz de Leslie e um exame de aspectos-chave da abordagem de Lee-Carter para a previsão da mortalidade, com uma aplicação da decomposição de valor singular Para os dados dos EUA para 1933-1987 e uma simulação de previsões estocásticas. 12. Populações estáveis Chegamos ao fim com dois folhetos sobre populações estáveis. O primeiro lida com a computação Lotkas r ea distribuição de idade equivalente estável. Seguindo os exemplos das casas 7.1 e 7.2 do livro de texto. O segundo lida com a estimativa do ímpeto da população usando o método de Preston-Guillot ilustrado na caixa 7.3 do livro e, como comparação, a fórmula de Keyfitzs. Cópia 2017 Germaacuten Rodriacuteguez, Princeton UniversityGrowth Taxas e tempo de duplicação O US Census Bureau tem contagens de população para os EU de 1790 a 2010. Eu tenho as contagens até 2000 a partir da Tabela 4 neste relatório do Censo (Tabela 2 tinha ligeiramente diferentes contagens para 1830 e 1940), e adicionou a contagem 2010 de Wikipedia. Esses dados estão em um arquivo ascii chamado uspop1790to2010.dat na seção de conjuntos de dados do site do curso. O arquivo tem duas colunas que representam o ano ea população. A primeira tarefa é ler os dados. Lemos a população quanto tempo para garantir que obtemos todos os dígitos. Vamos plotar a população em milhões (caso contrário, obter rótulos ruins) usando absolutas e escalas log. Taxas de crescimento Qual foi a taxa de crescimento no último período intercensal Vamos listar as contagens de população para os dois últimos censos. Nós especificamos um formato para que Stata não liste grandes números usando a notação científica 14.0fc diz Stata para usar até 14 dígitos sem decimal, usando uma vírgula para indicar milhares Assim, a população dos EUA cresceu 27.323.632 entre 2000 e 2010. Verifique que no anterior Período intercensal cresceu 32.712.048. Se dividimos o aumento populacional pela população no início do período intercensal, ou simplesmente tomamos a proporção e subtraímos uma, obtemos Assim, a população cresceu 9,7 em dez anos. Você acha que isso é 0,97 por ano, mas isso é apenas aproximado porque não compõe o crescimento ao longo dos dez anos. Se começarmos com uma população P1 e composto k vezes por ano a uma taxa r por dez anos, a população crescerá para P2 P1 (1r / k) (10k). Resolvendo para r dá uma taxa de crescimento de r k (P2 / P) (1 / (10k)) - 1. Heres a taxa que obtemos usando valores diferentes de k Um valor unitário de k significa composição anual, 12 significa mensal e 365 significa diariamente. Poderíamos continuar agravando cada minuto, ou cada segundo, mas você pode ver que nosso cálculo está se aproximando rapidamente de um limite. A partir do cálculo elementar, sabemos que, como k - infin, nossa equação se torna P2 P1 exp (10 r). E resolvendo para r dá log (P2 / P1) / 10. De modo que o valor limite é Esta é uma taxa média anualizada de crescimento. Observe que pelo tempo que combinamos a cada dois meses já tínhamos o valor correto para cinco casas decimais. Crescendo mais lentamente Podemos agora calcular a taxa de crescimento de toda a história (censitária) dos EUA. Tratamos todos os censos com dez anos de diferença, embora isso não seja exatamente verdadeiro: ao longo do tempo, o recenseamento mudou de agosto para junho e depois para abril (Exceto para 1920, que foi feito em janeiro). Se você quiser fazer um cálculo mais preciso as datas necessárias estão na referência dada na parte superior. Observe o uso de n-1 para referir-se ao valor anterior, gerando um valor ausente para a primeira linha Agora, nós traçamos as taxas ao longo do tempo. Como a taxa de crescimento se refere ao período entre dois censos faz sentido plotar contra os pontos médios dos anos do censo, excluindo o último. O gráfico é mostrado abaixo, combinado com um gráfico de tempo de duplicação. Vemos que a taxa de crescimento foi de cerca de 3 por cerca de metade do século 19, declinou de forma constante por quase 100 anos com um mergulho antes da guerra, recuperou com o baby boom pós-guerra e, em seguida, retomou seu declínio. Tempo de duplicação A uma taxa de crescimento instantânea r. O tempo de duplicação é log (2) / r. A população dos Estados Unidos dobrava a cada 22-24 anos na primeira metade do século XIX, mas o tempo de duplicação aumentou constantemente (exceto para um pico de antes da guerra) e agora leva 75 anos para dobrar. Verificar que no período intercensal anterior a taxa de crescimento foi de 0,0124 eo tempo de duplicação foi de 56 anos. Cópia 2017 Germaacuten Rodriacuteguez, Universidade de Princeton
No comments:
Post a Comment