Descrição de Variáveis e Medidas-Resumo
Residência Hospital Santo Antônio
Curso de Extensão em Estatística Básica
Agosto de 2025
Este conteúdo foi desenvolvido como material didático para um curso de extensão em estatística, com foco na aplicação prática para a pesquisa e a clínica médica. Nosso objetivo é capacitar profissionais da saúde a interpretar e aplicar conceitos estatísticos de forma crítica e eficaz em seu dia a dia.
A estatística médica é a espinha dorsal da medicina baseada em evidências. Dominar seus princípios permite que você:
🎯 Objetivos de aprendizagem:
💡 Metodologia: Cada conceito será apresentado com exemplos práticos da área médica para facilitar a compreensão e aplicação no dia a dia clínico. Os infográficos e elementos visuais foram criados especificamente para tornar o aprendizado mais didático e envolvente.
Fundamentos para compreender e classificar as características que estudamos em medicina
Para iniciar sua jornada na estatística, é crucial entender a distinção entre dado e variável. Embora frequentemente usados de forma intercambiável no senso comum, em estatística eles possuem significados precisos.
Variável: É uma propriedade ou característica que pode ser observada e que varia entre os indivíduos ou elementos de uma população ou amostra.
Dado: É o valor específico que uma variável assume para um determinado indivíduo ou observação.
Uma variável é tudo aquilo que varia! Portanto, é toda característica para a qual podemos atribuir valores, ou melhor, um espectro de valores, que também são conhecidos como dados.
Considere a pressão arterial sistólica de pacientes em uma clínica:
A pressão varia de um paciente para outro, por isso é uma variável.
Importante: As variáveis não estão presentes apenas nos seres humanos. Toda característica que tem a capacidade de variar entre elementos de um mesmo conjunto pode ser considerada uma variável. Por exemplo, em um estudo sobre hospitais, o "número de leitos" seria uma variável.
As variáveis são classificadas em duas naturezas fundamentais: quantitativas e qualitativas, que determinam os tipos de análises estatísticas que podem ser realizadas.
São aquelas que podem ser mensuradas ou quantificadas por meio de números. Elas representam quantidades e podem ser subcategorizadas em contínuas e discretas.
Admitem valores decimais e formam um intervalo contínuo de valores. Geralmente resultam de medições.
Não admitem "casas decimais", limitando-se a números inteiros. Geralmente resultam de contagens.
São aquelas às quais não podemos atribuir valores numéricos que representem uma quantidade, mas que expressam uma qualidade, atributo ou característica.
Nomeamos a característica, sem que haja uma ordem ou hierarquia natural entre as categorias.
As categorias apresentam uma ordem ou hierarquia entre si, mas a diferença entre as categorias não é necessariamente uniforme.
Atenção: A classificação de uma variável pode depender de como ela é coletada ou utilizada no estudo. Por exemplo, a idade pode ser tratada como contínua (25,5 anos) ou como ordinal (faixas etárias: 0-10 anos, 11-20 anos, etc.).
Para auxiliar na classificação correta de qualquer variável em sua prática ou pesquisa, siga este algoritmo simples:
1. Pode ser quantificada? SIM (ex: 95 mg/dL, 110 mg/dL)
2. Pode ser fracionada? SIM (ex: 95,5 mg/dL, 110,3 mg/dL)
Resultado: Variável Quantitativa Contínua.
1. Pode ser quantificado? NÃO (ex: A, B, AB, O)
2. Existe ordem? NÃO (não há hierarquia entre os tipos)
Resultado: Variável Qualitativa Nominal.
Dica Clínica: Em questões de prova ou na interpretação de estudos, se a descrição da variável sugere uma progressão, gravidade, ou classificação em estágios (como estadiamento de doença, grau de dor, ou classificação funcional), é muito provável que seja uma variável ordinal.
Abaixo, uma tabela com variáveis frequentemente encontradas na prática médica e suas classificações:
Variável | Natureza | Exemplo de Valores | Aplicação Clínica |
---|---|---|---|
Idade | Contínua | 25,5 anos; 67,2 anos | Estratificação de risco, dosagem medicamentosa |
Peso | Contínua | 65,5 kg; 78,2 kg | Cálculo de IMC, dosagem de medicamentos |
Pressão arterial | Contínua | 120,5/80,2 mmHg | Diagnóstico de hipertensão, ajuste terapêutico |
Número de filhos | Discreta | 0, 1, 2, 3... | História obstétrica, planejamento familiar |
Doses de vacina | Discreta | 1, 2, 3... | Controle de imunização, esquemas vacinais |
Sexo/Gênero | Nominal | Masculino, Feminino | Estratificação epidemiológica, medicina personalizada |
Tipo sanguíneo | Nominal | A, B, AB, O | Transfusões, transplantes, genética |
Grau de queimadura | Ordinal | 1°, 2°, 3° | Prognóstico, protocolo de tratamento |
Estadiamento do câncer | Ordinal | I, II, III, IV | Prognóstico, escolha terapêutica |
Grau de dor | Ordinal | Leve, Moderada, Intensa | Manejo da dor, escolha de analgésicos |
Importante: A classificação pode variar dependendo de como a variável é coletada e tratada no estudo. Sempre observe as informações fornecidas no contexto da questão ou pesquisa.
Ferramentas estatísticas essenciais para sintetizar e descrever as principais características de um conjunto de dados
As medidas de tendência central indicam o valor em torno do qual os dados se agrupam. As mais comuns são a média, a mediana e a moda.
A média é a soma de todos os valores dividida pelo número total de observações. É a medida mais utilizada para variáveis quantitativas contínuas com distribuição simétrica.
Idades de 5 pacientes: 30, 34, 37, 41, 49 anos.
Média = (30 + 34 + 37 + 41 + 49) / 5 = 191 / 5 = 38,2 anos
Vantagens: Utiliza todos os dados, familiar e fácil de calcular.
Desvantagens: Muito sensível a valores extremos (outliers).
A mediana é o valor central quando os dados estão ordenados. Ela divide o conjunto em duas metades, com 50% das observações abaixo e 50% acima.
Idades dos 5 pacientes ordenadas: 30, 34, 37, 41, 49.
A mediana é 37 anos.
Tempo de resposta (min): 10, 12, 15, 18, 20, 25.
Valores centrais: 15 e 18.
Mediana = (15 + 18) / 2 = 16,5 minutos.
Vantagens: Não é afetada por outliers, robusta para distribuições assimétricas.
Desvantagens: Não utiliza todos os dados no cálculo.
A moda é o valor que aparece com maior frequência. É a única medida que pode ser usada para variáveis qualitativas nominais.
Tipos sanguíneos: A, B, O, A, AB, O, A, A, B, O.
Frequência: A (4), B (2), AB (1), O (3).
A moda é o tipo A.
As medidas de dispersão indicam o quão espalhados ou variados os dados estão em relação à medida de tendência central. Elas complementam as medidas de tendência central, fornecendo uma imagem mais completa da distribuição dos dados.
A amplitude é a diferença entre o maior e o menor valor. É a medida de dispersão mais simples.
Idades: 30, 34, 37, 41, 49 anos.
Amplitude = 49 - 30 = 19 anos.
A variância mede a dispersão média dos dados em torno da média. É calculada como a média dos quadrados das diferenças entre cada valor e a média.
Usando as idades: 30, 34, 37, 41, 49. Média = 38,2.
Diferenças: -8,2, -4,2, -1,2, 2,8, 10,8
Quadrados: 67,24, 17,64, 1,44, 7,84, 116,64
Variância = 210,8 / 4 = 52,7
O desvio-padrão é a raiz quadrada da variância. Expressa a dispersão na mesma unidade da variável original, sendo mais fácil de interpretar.
Usando a variância calculada (52,7):
Desvio-Padrão = √52,7 ≈ 7,26 anos
Isso significa que, em média, as idades se desviam em 7,26 anos da média de 38,2 anos.
O coeficiente de variação é uma medida de dispersão relativa, expressa como porcentagem. Útil para comparar variabilidade entre diferentes variáveis.
Comparar variabilidade:
Ambos têm a mesma variabilidade relativa.
Aplicação Clínica: As medidas de dispersão são fundamentais para avaliar a precisão de exames laboratoriais, a variabilidade de respostas a tratamentos, e para estabelecer valores de referência em medicina.
As medidas de posição dividem um conjunto de dados ordenado em partes iguais, indicando a posição relativa de um valor dentro da distribuição. São particularmente úteis para descrever distribuições não simétricas e para identificar valores de corte.
Os quartis dividem um conjunto de dados ordenado em quatro partes iguais:
Colesterol LDL (mg/dL) de 11 pacientes:
80, 85, 90, 92, 95, 100, 105, 110, 115, 120, 130
Os percentis dividem um conjunto de dados ordenado em 100 partes iguais. O P-ésimo percentil é o valor abaixo do qual P% das observações caem.
Se um bebê está no 90º percentil de peso para a idade, significa que:
💡 Dica Prática: Em medicina, os percentis são amplamente utilizados para interpretar exames laboratoriais e avaliar o crescimento e desenvolvimento. Familiarize-se com os valores de referência mais comuns em sua área de atuação.
Nesta apostila, exploramos os conceitos fundamentais de descrição de variáveis e medidas-resumo, essenciais para qualquer profissional da saúde que lida com dados. Compreender a natureza das variáveis e como sumarizar informações de forma adequada é o primeiro passo para realizar análises estatísticas válidas e tomar decisões clínicas baseadas em evidências.
🔬 Próximos Passos: Continue praticando e aplicando esses conceitos em sua rotina para aprimorar sua capacidade de interpretar e gerar evidências científicas. A estatística não é apenas um conjunto de fórmulas, mas uma ferramenta poderosa para entender a variabilidade, identificar padrões e transformar dados brutos em conhecimento útil para a saúde.
Lembre-se: A medicina baseada em evidências depende da sua capacidade de compreender e aplicar conceitos estatísticos. Cada paciente é único, mas os padrões estatísticos nos ajudam a tomar as melhores decisões possíveis com base no conhecimento científico disponível.
Material desenvolvido para profissionais da saúde
📊 Foco em aplicações práticas da estatística na medicina
💡 Baseado em evidências e melhores práticas metodológicas
🏥 Para mais informações, consulte literatura especializada em bioestatística e epidemiologia
Autor: EQUIPE UNEMAT | Data: Agosto de 2025