Instrumentação Automática vs Manual

Uma das primeiras decisões ao adotar o OpenTelemetry é escolher entre instrumentação automática e manual — ou uma combinação das duas. Cada abordagem tem seus pontos fortes e fracos, e a escolha certa depende do seu contexto.

Instrumentação automática

A instrumentação automática (ou auto-instrumentação) injeta código de telemetria automaticamente em bibliotecas e frameworks populares, sem que você precise modificar o código da sua aplicação.

Como funciona

Dependendo da linguagem, a auto-instrumentação usa diferentes mecanismos:

Linguagem	Mecanismo
Java	Agente Java (bytecode manipulation)
.NET	Bibliotecas de instrumentação via DI
Python	`opentelemetry-instrument` (monkey patching)
Node.js	Módulos de instrumentação automática
Go	Não tem auto-instrumentação — instrumentação manual via bibliotecas

Vantagens

Zero alteração no código — especialmente em Java, basta adicionar o agente
Cobertura ampla — instrumenta HTTP, banco de dados, mensageria, cache de uma vez
Rápido para começar — resultados em minutos
Mantido pela comunidade — as instrumentações são atualizadas quando bibliotecas mudam

Limitações

Spans genéricos — os spans gerados refletem operações de infraestrutura (HTTP request, SQL query), não a lógica de negócio
Ruído — pode gerar muitos spans que você não precisa
Menos controle — difícil customizar atributos ou filtrar spans específicos
Overhead — em alguns casos, a auto-instrumentação pode adicionar overhead de performance

Quando usar

✅ Use instrumentação automática quando:

Está começando com OpenTelemetry e quer resultados rápidos
Quer visibilidade básica de infraestrutura (HTTP, DB, cache)
O time não tem experiência com instrumentação
Está avaliando o OpenTelemetry em um projeto existente

Instrumentação manual

A instrumentação manual significa adicionar código explícito para criar spans, registrar métricas e emitir logs nos pontos que você escolher.

Exemplo prático

from opentelemetry import trace

tracer = trace.get_tracer("meu-servico")

def processar_pedido(pedido):
    with tracer.start_as_current_span("processar_pedido") as span:
        span.set_attribute("pedido.id", pedido.id)
        span.set_attribute("pedido.valor", pedido.valor_total)
        span.set_attribute("pedido.itens", len(pedido.itens))

        validar_estoque(pedido)
        calcular_frete(pedido)
        processar_pagamento(pedido)

Vantagens

Spans significativos — representam operações de negócio, não apenas infraestrutura
Atributos relevantes — você escolhe exatamente quais dados associar aos spans
Controle total — decida onde instrumentar e com qual nível de detalhe
Melhor depuração — traces contam a história do que aconteceu no seu domínio

Limitações

Mais trabalho — requer escrever e manter código de instrumentação
Precisa de conhecimento — o time precisa entender como OTel funciona
Risco de inconsistência — sem padrões claros, cada dev instrumenta de um jeito

Quando usar

✅ Use instrumentação manual quando:

Precisa de visibilidade da lógica de negócio
Quer spans que representem operações do seu domínio
Precisa de atributos específicos nos spans (IDs de pedido, dados do cliente, etc.)
Quer controlar o nível de detalhe da telemetria

A abordagem híbrida (recomendada)

Na prática, a maioria dos times acaba usando as duas abordagens juntas:

┌─────────────────────────────────────┐
│  Instrumentação Automática          │
│  → HTTP, banco de dados, cache,     │
│    mensageria, gRPC                 │
├─────────────────────────────────────┤
│  Instrumentação Manual              │
│  → Lógica de negócio, operações     │
│    específicas do domínio           │
└─────────────────────────────────────┘

Como combinar

Comece com auto-instrumentação — ative para ter visibilidade básica imediatamente
Identifique gaps — olhe os traces e veja onde falta contexto de negócio
Adicione spans manuais — instrumente as operações de negócio mais importantes
Enriqueça com atributos — adicione dados do domínio aos spans (IDs, status, valores)
Itere — à medida que precisa de mais visibilidade, adicione mais instrumentação manual

Exemplo de trace híbrido

[auto] HTTP POST /api/pedidos (200ms)
  └── [manual] processar_pedido (180ms)
        ├── [manual] validar_estoque (20ms)
        │     └── [auto] SQL SELECT estoque... (5ms)
        ├── [manual] calcular_frete (30ms)
        │     └── [auto] HTTP GET api-correios... (25ms)
        └── [manual] processar_pagamento (120ms)
              ├── [auto] HTTP POST gateway-pagamento... (100ms)
              └── [auto] SQL INSERT pagamento... (10ms)

Neste exemplo, a auto-instrumentação captura as chamadas HTTP e SQL, enquanto a instrumentação manual adiciona contexto de negócio (processar pedido, validar estoque, etc.).

Dicas práticas

1. Defina uma convenção de nomes

Antes de sair instrumentando, combine com o time como nomear spans e atributos. Veja nosso guia de Convenções de Nomes.

2. Não instrumente tudo

Mais spans nem sempre é melhor. Foque nas operações que:

São frequentes e/ou lentas
Representam pontos de decisão de negócio
Cruzam limites de serviço
São difíceis de depurar quando falham

3. Use o Collector para filtragem

Se a auto-instrumentação gera spans demais, use o Collector para filtrar e amostrar em vez de desativar a instrumentação.

4. Teste a performance

Especialmente com auto-instrumentação em linguagens interpretadas (Python, Node.js), meça o impacto no desempenho em um ambiente de staging antes de ir para produção.

Discussão

Tem alguma dúvida ou quer compartilhar sua experiência? Comente abaixo!