Estou tentando combinar vários lotes de caixa em categorias de diferentes tamanhos. Aqui está um exemplo que ilustra o problema: isso me dá os seguintes resultados. Tudo funciona de acordo com o manual, portanto, mas tenho dois problemas com esta saída. Em primeiro lugar - estética. Pessoalmente, acho que o gráfico com a mesma largura entre as linhas seria melhor. Em segundo lugar, e mais importante - em gráficos mais complexos, o tamanho da fonte para categorias, eixos, etc. também é dimensionado proporcionalmente. Então, mesmo se eu especificar, digamos - tamanho médio do eixo em todos os gráficos - alguns deles serão um pouco maiores ou menores. Eu estava pensando se há uma opção para forçar a largura da segunda linha de lotes de caixa para ter o mesmo tamanho que o primeiro. Perguntou 15 de janeiro às 16:27 Isso é o que você quer. É baseado em um truque, mas o truque é bastante geral. A lógica é que as duas variáveis categóricas são combinadas longitudinalmente. Isso assegura que cada gráfico de caixa seja do mesmo tamanho. Ao especificar furos, persuadimos a caixa do gráfico para colocar gráficos em duas linhas. Eu acho que o problema do tamanho do seu rótulo desaparecerá uma vez que a solução seja resolvida. Para ainda mais flexibilidade, talvez seja necessário abandonar a caixa do gráfico e usar o twoway em vez disso. Uma discussão detalhada foi dada por mim no Stata Journal em 2009: você pode ir direto para stata-journalsjpdf. htmlarticlenumgr0039Some Stata Commands General Plotting Commands Traçar um histograma de uma variável: gráfico vn, bin (xx) Traçar um histograma de uma variável usando Frequências: gráfico vn, bin (xx) freq Traçar um histograma de uma variável com uma aproximação normal: gráfico vn, bin (xx) norma onde xx é o número de caixas. Traçar um boxplot de uma variável: graph vn, box Traçar parcelas de caixa lado a lado para uma variável (vone) por categorias de outra variável vtwo. (Vtwo deve ser categórico)): classifique vtwo graph vone, box by (vtwo) Um gráfico de dispersão de duas variáveis: graph vone vtwo Uma matriz de gráficos de dispersão para três variáveis: v2 do gráfico vtwo vthr, matriz Um gráfico de dispersão de duas variáveis com Os valores de uma terceira variável usada no lugar dos pontos no gráfico (vthr pode conter valores numéricos ou indicar categorias, como masculino (m) e fêmea (f)): vone vtwo gráfico, símbolo (vthr) Planta de quantile normal: qnorm Vn Comandos gerais Para calcular meios e desvios padrão de todas as variáveis: resumir ou, usando uma abreviação, summ Para calcular os meios e desvios padrão de variáveis selecionadas: resuma vone vtwo vthr ou, usando uma abreviatura, summ vone vtwo vthr Para obter mais resumos numéricos Para uma variável: summ vone, detalhe Correlação entre duas variáveis: correlate vone vtwo Para ver todos os valores (todas as variáveis e todas as observações, não recomendadas para grandes conjuntos de dados): lista Para listar valores para duas variáveis: list vone vtwo Para listar o primeiro Valor 10 S para duas variáveis: list vone vtwo em 110 Para listar os últimos 10 valores para duas variáveis: list vone vtwo in -10l (O fim deste comando é menos 10letter l.) Tabelas Tabular variável vn: tabular vn ou, usando uma abreviatura , Tabulação vn Tabulação cruzada de duas variáveis: tab vone vtwo Tabuleiro cruzado duas variáveis, inclua uma ou mais opções para produzir porcentagens de coluna, linha ou célula e para suprimir a impressão de freqüências: guia vone vtwo, coluna de linha de coluna Gerando novas variáveis gerais. Gerar índice de casos 1,2, ldots, n) (isso pode ser útil se você classificar os dados, então deseja restaurar os dados para o formulário original sem recarregar os dados): gerar caso n ou, usando uma abreviatura, gen casen Multiplique valores em vx por b e adicione um. Armazenar resultados em vy: gen vy a b vx Gerar uma variável com todos os valores 0: gen vone0 Gerar uma variável com valores 0 a menos que vtwo seja maior que c. Então faça o valor 1: gen vone0 substitua vone1 se vtwogtc números aleatórios. Defina números de observações para n. Definir semente de número aleatório para XXXX, o padrão é 1000: definir semente XXXX Gerar n variáveis aleatórias uniformes (chance igual de todos os resultados entre 0 e 1: gen vnuniform () Gerar n variáveis aleatórias uniformes (chance igual de todos os resultados entre uma E b. Gen vna (ba) uniform () Gerar n variáveis aleatórias discretas e uniformes (chance igual de todos os resultados entre 1 e 6): gen vn1int (6uniform ()) Dados normais com média 0 e desvio padrão 1: gen vn invnorm (uniforme ()) Dados normais com média mu e desvio padrão sigma. Gen vn mu sigma invnorm (uniforme ()) Regressão Calcula linha de regressão simples (vy é resposta, vx é preditor): regredir Vy vx Calcule as previsões, crie uma nova variável yhat: preveja yhat Produza o gráfico de dispersão com a linha de regressão adicionada: gráfico vy yhat vx, conecte o símbolo (.s) (oi) Calcule os resíduos, crie nova variável tt residuals: preveja resíduos, resid Produza um residual Gráfico com linha horizontal a 0: resíduos do gráfico, y Linha (0) Identifique os pontos com os maiores e menores resíduos: classifique a lista de resíduos na lista 15 em -5l (o último comando é menos 5 letra l.) Calcule a equação de regressão múltipla (vy é resposta, vone, vtwo e vthr são preditores): Regredir vy vone vtwo vthr Notas importantes sobre o comando do caule Existe uma falha com o comando da haste Statas para os gráficos de haste e folha. A função do caule parece reordenar permanentemente os dados para que eles sejam classificados de acordo com a variável que o gráfico de haste e folha foi plotado. A melhor maneira de evitar esse problema é evitar fazer parcelas de haste e folha (fazer histogramas em vez disso). No entanto, se você realmente quer fazer um gráfico de haste e folha, você sempre deve criar uma variável contendo os números de observação originais (chamado índice, por exemplo). Um comando para o fazer é: gerar índice n Se você fizer isso, você pode reordenar os dados após o gráfico de haste e folha de acordo com a variável de índice (comando Stata: classificar índice) para que os dados estejam de volta A ordem original. Comandos. Aqui estão alguns outros comandos que você pode achar úteis (esta não é, de modo algum, uma lista exaustiva de todos os comandos do Stata): operação geral de ANOVA, ANCOVA ou repetição de regressão para categorias de intervalos de confiança variáveis para significa eliminar o conjunto de dados anterior de correlação de memória insuficiente Entre variáveis descreve brevemente os dados (de obs, nomes de variáveis, etc.) distribuição de parcelas de diagnóstico elimina variáveis da memória melhor alternativa à entrada para Macs cria novas variáveis (por exemplo, gerar anos de início próximo) comando gráfico geral (este comando possui muitas opções) Permite selecionar um subconjunto de observações (p. Ex., Lista se o raio gt 3000) ler um conjunto de dados de formato não-Stata (arquivo ASCII ou texto) digitar dados em bruto lista todo o conjunto de dados na memória (você também pode listar apenas certas variáveis) salvar ou imprimir Stata ouput (exceto gráficos) pesquisa por palavra-chave de comandos, muitas vezes precursor para ajudar oneway análise de variância coeficientes de correlação parcial text-mode (crude) scatterplots calculado prédio val Ues (y-hat), resíduos (ordinários, padronizados e studentized), alavancas, distância de Cooks, erro padrão do indivíduo predito y. Erro padrão da média predita y. Erro padrão de residual da regressão
Comments
Post a Comment