Área do cabeçalho
gov.br
Portal da UFC Acesso a informação da UFC Ouvidoria Conteúdo disponível em:Português
Brasão da Universidade Federal do Ceará

Universidade Federal do Ceará
Grupo de Atenção Integral e Pesquisa em Acupuntura e Medicina Tradicional Chinesa – GAIPA UFC

Área do conteúdo

ANÁLISE ESTATÍSTICA

Tipos de testes estatísticos indicados para cada análise

HIPÓTESE/OBJETIVO DA ANÁLISE TESTES PARAMÉTRICOS TESTES NÃO-PARAMÉTRICOS
Comparar as medidas de tendência central de 1 grupo com algum valor de referência. One-Semple T Test. Wilcoxon One-Sample.
Comparar as medidas de tendência central de 2 grupos distintos (amostras não pareadas). T Student Independente. Mann Whitney U.
Comparar as medidas de tendência central de 1 grupo avaliado em dois momentos (amostras pareadas). T Student Pareado. Wilcoxon Pareado.
Comparar as medidas de tendência central de mais de 2 grupos distintos (amostras não pareadas).

ANOVA One Way;

ANOVA Two Way;

ANCOVA.

Kruskal-Walis.
Comparar as medidas de tendência central de 1 grupo avaliado em mais de dois momentos (amostras pareadas). ANOVA Medidas Repetidas. Friedman.
Comparar as medidas de tendência central de 2 ou mais grupos avaliados em 2 ou mais momentos.

ANOVA Fatorial Mista;

ANCOVA;

MANOVA;

MANCOVA;

Modelo linear de efeitos mistos.

Kruskal-Walis;

Friedman.

Analisar se as frequências de distribuição de  uma variável categórica se ajustam as frequências previstas por um modelo teórico Qui-Quadrado de aderência (uma amostra);
Analisar se há associação entre as frequências de variáveis categóricas.

Qui-Quadrado de Pearson (independência).

Exato de Fisher.

Analisar se há associação/correlação entre as medidas de tendência central de dois grupos. Coeficente de Pearson. Coeficiente de Spearman.
Investigar a relação existente entre 1 variável independente e 1 variável dependente contínua. Regressão Linear Simples.
Investigar a relação existente entre mais de uma variável independente e 1 variável dependente contínua. Regressão Linear Múltipla.
Investigar a relação existente entre 1 variável independente e 1 variável dependente categórica dicotômica. Regressão Logística Simples.
Investigar a relação existente entre 1 variável independente e 1 variável dependente categórica com mais de dois níveis. Regressão Logística Multinomial.
Investigar a relação existente entre 1 variável independente e 1 variável dependente categórica ordinal. Regressão Logística Ordinal.
Avaliar a confiabilidade/reprodutibilidade (reliability) dos escores de variáveis contínuas entre diferentes instrumentos de medida, ou observadores, como também a concordância entre o mesmo instrumento de medida, ou observador, em momentos diferentes.

Alfa de Cronbach (α);

Coeficiente de Correlação Intraclasse (ICC);

Curva ROC;

Análise de Bland-Altman.

Avaliar a concordância/confiabilidade (agreement) dos escores de variáveis categóricas dicotômicas obtidas por um observador/instrumento em dois momentos ou entre dois observadores/instrumentos em um único momento. Kappa de Cohen (κ) .
Avaliar a concordância/confiabilidade (agreement) dos escores de variáveis categóricas ordinais obtidas por um observador/instrumento em dois momentos ou entre dois observadores/instrumentos em um único momento. Kappa Ponderado (weighted).
Avaliar a concordância/confiabilidade (agreement) dos escores de variáveis categóricas obtidas por mais de dois observadores ou momentos. Kappa de Fleis.
Analisar a normalidade dos dados (análise univariada). Shapiro-Wilk.
  • Anotações para análise estatística <Clique aqui>.
Avaliação da normalidade dos dados
Estatística Descritiva
Os dados foram digitados em dupla entrada no programa Excel®. Para verificar inconsistências, foram sobrepostos os bancos por meio do software Microsoft Excel 2016. Dados não recuperáveis foram registrados no banco como missing. A análise dos dados foi feita no programa Stata, versão 15.0. Inicialmente, foi realizado o teste de Kolmogorov-Smirnov com correção de Lilliefors para verificar a normalidade e as variáveis com p-valor>0,05 foram consideradas com distribuição normal (Ghasemi A; Zahediasl S, 2012). Em seguida, foi feita a análise descritiva das variáveis sociodemográficas relacionadas à morbidade e à dor, expressas em frequência absoluta (n) e relativa (%), mediana, intervalo interquartil (IIQ) e valores de mínimo e máximo. Os domínios do WHOQOL-OLD foram ponderados com base em suas respectivas sintaxes e expressos em valores de média e desvio-padrão (DP).

 

Conversão de valores

Estimar a média e DP a partir da mediana e IQ <Clique aqui>

Estimar o DP a partir do erro padrão ou IC95% <Clique aqui>

Estimar o DP a partir do p-Valor e t-Valor <Clique aqui>.

Estimar o IC95% para médias e proporções <Clique aqui>

Combinar médias e DPs em um único grupo <https://www.statstodo.com/CombineMeansSDs.php>

Tabelas

  • FEIJOO, A.M.L.C. Organização e interpretação da tabela. In: A pesquisa e aestatística na psicologia e na educação [online]. Rio de Janeiro: Centro Edelstein de Pesquisas Sociais, 2010, pp. 4-5. <http://books.scielo.org/id/yvnwq/pdf/feijoo-9788579820489-03.pdf>.
  • Spriestersbach A et al. Descriptive statistics: the specification of statistical measures and their presentation in tables and graphs. Part 7 of a series on evaluation of scientific publications. Dtsch Arztebl Int. 2009 Sep;106(36):578-83. <https://pubmed.ncbi.nlm.nih.gov/19890414/>.
Análise de tabelas de contingência foi utilizada para a investigação de variáveis categoriais, com o resultado estatístico sendo distribuído como qui-quadrado de Pearson (c2). Taxas de sensibilidade, especificidade, valor preditivo positivo (vpp), e valor preditivo negativo (vpn) foram estimadas a partir de tabelas de contingência 2X2.

Gráficos

Escolha do teste estatístico

Estatística Analítica ou Inferencial

Análise Estatística

Estatística no Excel

REAL STATISTICS USING EXCEL <https://www.real-statistics.com/>.

Suplementos <https://drive.google.com/file/d/19w1hJTiTG04uA3fXoyamZBVyPRwJEJtl/view?usp=sharing>.

Estatística no R e RStudio

Canal do Prof. Ronaldo Lima Jr. (UNB) <https://www.youtube.com/watch?v=sjX4rPfA_H0&list=PLzkA7H-mNfYhdbUe1e0FMpJDdLj1585zq>.

Tutoriais para análise estatística no SPSS

Análise descritiva e inferencial (testes de associação e comparação)  <Clique aqui>.

Análise testes de comparação <Clique aqui>. <Clique aqui>.

Análise testes de Regressão (linear e múltipla) <Clique aqui>.

Análise testes de Regressão (linear e logística) <Clique aqui>.

Análise testes de Validade e Confiabilidade <Clique aqui>.

Análise da pontuação do WHODAS 2.0 <Clique aqui>.

Tutorial para metanálise

Metanálise utilizado o RevMan <Clique aqui>.

Imputação de dados perdidos

Cálculo Amostral

PROGRAMAS

FÓRUMULAS

N = tamanho da população.

n = tamanho da amostra.

δ = nível de confiança escolhido, expresso em número de Desvio Padrão (por convenção utiliza 1,96).

P =prevalência do fenômeno, ou percentagem (expresso em decimal).

Q = percentagem complementar, ou quociente (Q=1-P).

e = erro máximo permitido (por convenção se utiliza 3, 4 ou 5).

 

CÁLCULO AMOSTRAL PARA POPULAÇÃO FINITA

n = δ² x P x Q x N / e² (N-1) + (δ² x P x Q).

 

CÁLCULO AMOSTRAL PARA POPULAÇÃO INFINITA

n = δ² x P x Q / e².

Exemplos:

  • Conventional Rules.
    • “Because cross-validity formula estimates are primarily functions of sample size and the number of predictors, conventions have evolved that are based on the premise that with a large enough ratio of subjects to predictors, the sample regression coefficients will be reliable and will closely estimate the true population values (Miller & Kunce, 1973; Pedhazur & Schmelkin, 1991; Tabachnick & Fidell, 2001). For example, Stevens (2002) suggested a ratio of 15 subjects for each predictor (e.g., with 3 predictors 45 subjects are required) and Pedhazur and Schmelkin (1991) recommended N ≥ 30k, where k is the number of predictors. Others have provided rules that combine some minimum value with a subject-to-predictor ratio, including N ≥ 30 + 10k (Knapp & Campbell-Heider, 1989), N ≥ 50 + k (Harris, 1985), and N ≥ 50 + 8k (Green, 1991). Sawyer (1982) developed a formula where setting an inflation factor to a constant of 5% results in a sample size recommendation of N ≥ 10.8k + 11.8.”

Exemplos:

Estudo transversal

O processo de amostragem foi estratificado por grupos para ser representativo para a população do estudo. A amostragem probabilística foi realizada em duas etapas, primeiramente por meio de setores censitárias e depois por domicílios, de acordo com as recomendações do Instituto Brasileiro de Geografia e Estatística (IBGE). Para o cálculo final da amostra, foram consideradas estimativa de prevalência de 50%, nível de confiança de 95%, erro máximo de 0,10 e o drawing effect de aproximadamente 2. O tamanho mínimo da amostra para o estudo foi de aproximadamente 400 participantes. A fim de maximizar a representatividade da amostra, 1.557 mulheres foram selecionadas aleatoriamente e entrevistadas.

Ensaio clínico 

Ex. PMID: 18601750

In calculating the sample size, a power of 90% and an α value of 5% were assumed, to detect a mean change in pain intensity, measured on the 100 mm visual analogue scale, of 32.3 mm between the initial and final values among the experimental group, and a mean reduction of 19.8 mm among the control group (standard deviation 31.9 mm). These assumptions require a sample size of 140 patients per group, in a design with two equal groups. We propose to recruit 400 patients in order to allow for a 30% drop out rate.

Tamanho de Efeito

Cálculo e interpretação do tamanho de efeito da intervenção

  • Cohen’s d = (Mean group B – Mean group A)/Pooled standard deviation.
  • Pooled standard deviation = √((Standard deviation Group A² + Standard deviation Group B²)/2).
  • Classificação do tamanho de efeito: 0.01-0.19 (muito pequeno); 0.20-0.49 (pequeno); 0.50-0.79 (moderado); 0.80-1.19 (grande); 1.20-1.99 (muito grande); >2.00 (enorme).
  • Calculadora para tamanho de efeito em testes não-paramétricos <calculos-tde-kruskal-wallis>.
  • Therapies were compared with control groups by measuring difference in mean changes in pain and function scores. An alternative experimental design would be based on a “responder analysis,” namely, comparing the proportion of patients within each therapy who experienced a change greater than the MCID. This type of data presentation could bemore informative because it focuses on patients who experience an improvement at least as large as the MCID. This approach is useful when the data are highly skewed by outliers in such a way that the calculated mean value may be above the MCID even when most patients do not have an effect greater than the MCID. (PMID: 25268441).

  • Effective Rate (ER) = (“total number of patients” – “number of patients without response”) /total number of patients; “no response” is defined as no significant change in VAS score after treatment. (PMID: 37143907)
  • The primary outcome was the proportion of participants who showed improvement of 50% or more in symptoms between the groups (the difference in the proportion), as assessed by the ? (Instrument) at ? weeks. The proportions of patients with depression recovery and remission based on the PHQ-9 at 4 weeks. The proportion of participants who achieved a score of less than 5 on the PHQ-9 (indicating depression remission). Participants, No./Total No.(%); RR (95% CI) (11 of 24 participants [46%] in theSA group vs 3 of 23 participants in the NSA group[13%]; RR, 1.99; 95% CI, 1.16-3.34; P=.02). Effect size was calculated as RR for dichotomous data. Statistical significance was calculated with Fisher exact test. Intragroup analysis was performed using the Cochran Q test. Intragroup analysis was performed usingth the Friedman analysis of variance test followed by post hoc tests for the differences in PHQ-9 scores at each time point compared with baseline. (PMID: 38032640); (PMID: 35602489); (PMID: 33371123); (PMID: 21178832).
  • Proportion Achieving Meaningful Improvement: In addition to the mean change over time in the pain scores, we evaluated the proportion of participants with a clinically meaningful 30% improvement. To compare the proportion of participants with a clinically meaningful response on the RMDQ, NRS, and a global impression of change, the outcomes were dichotomized and tested using χ2 analyses at each point. (PMID: 26903081).
  • The Number Needed to Treat (NNT): is the number of patients you need to treat to prevent one additional bad outcome. Is an absolute effect measure which is interpreted as the number of patients needed to be treated with one therapy versus another for one patient to encounter an additional outcome of interest within a defined period of time. NNT = 1 / Absolute risk reduction (π1 – π0). π0 = risk control group (incidende among non exposed / n group). π1 = risk in treatment group (incidence among exposed / n group). (PMID: 28571585).

Testes

Correlação:

 

Regressão linear simples:

Ex. Paz MG da et al., 2021.

Análises bivariadas e múltiplas foram utilizadas para averiguar os fatores associados aos domínios da QV. Na análise bivariada realizou-se regressão linear simples para verificar associação entre as variáveis independentes e os domínios (variáveis dependentes). A seguir, variáveis com p-valor ≤ 0,20 na análise bivariada foram incluídas no modelo de regressão linear múltipla para ajuste das variáveis confundidoras (Schneider A et al., 2010). O método de entrada das variáveis foi feito em etapa única. A magnitude das associações foi apresentada em coeficiente de regressão não ajustado (β) com respectivos IC 95%. Os modelos foram avaliados e validados quanto aos seguintes pressupostos da regressão linear: (i) multicolinearidade pelo fator de inflação de variância (FIV) – considerou-se ausência de multicolinearidade FIV médio < 5,0 (Kim JH et al., 2019); normalidade dos resíduos pelo teste K-S, adotando valores de p do teste > 0,05 (Ghasemi A; Zahediasl S, 2012); (iii) homocedasticidade, avaliada pelo teste de Breusch-Pagan/Cook-Weisberg – a homocedasticidade dos modelos foi confirmada quando valor de p > 0,05 (Daye ZJ et al., 2012); e (iv) linearidade analisada pela visualização gráfica (26).

 

Regressão linear múltipla:

 

Regressão logística:

 

Kappa:

 

Modelo linear de efeitos mistos:


Programas

Logotipo da Superintendência de Tecnologia da Informação
Acessar Ir para o topo