MODULO 1.7

⚑ Performance e Otimizacao

Aprenda tecnicas para criar skills rapidas e eficientes, otimizando uso de contexto, minimizando chamadas de tools e melhorando a experiencia do usuario.

6
Topicos
35
Minutos
Intermed.
Nivel
Pratico
Tipo
1

πŸ“ Entendendo Gargalos

Para otimizar, primeiro entenda onde o tempo e gasto. Skills podem ser lentas por varios motivos.

⏱️ Onde o Tempo e Gasto

  • 40% Processamento LLM: Cada token de entrada/saida custa tempo
  • 30% Chamadas de Tools: Cada Bash, Read, Write tem overhead
  • 20% Network: APIs externas, MCP servers
  • 10% Outros: Carregamento de skills, parsing

Impacto por Tipo de Operacao

Skill com 1000 linhas Muito lento
10+ chamadas Bash sequenciais Lento
API externa sem cache Lento
Skill otimizada (100 linhas) Rapido

πŸ’‘ Regra de Ouro

Menos e mais. Menos texto na skill = menos tokens = mais rapido. Menos tools = menos overhead. Foque no essencial.

2

πŸ“ Otimizando Tamanho da Skill

O tamanho da skill afeta diretamente quanto contexto consome. Skills enxutas sao mais rapidas e deixam mais espaco para o trabalho real.

βœ— Skill Verbosa (Evitar)

## Instrucoes Detalhadas

Esta skill foi criada para ajudar
usuarios a formatar codigo Python
de acordo com as melhores praticas
da comunidade, incluindo PEP8...

[... 50 linhas de contexto ...]

Voce deve primeiro verificar se o
arquivo existe, depois ler o conteudo,
analisar a estrutura...

[... 100 linhas de instrucoes ...]

~200 linhas = muitos tokens

βœ“ Skill Concisa (Ideal)

## Python Formatter

Formata codigo Python usando PEP8.

### Uso
1. Ler arquivo .py solicitado
2. Aplicar black + isort
3. Salvar formatado

### Comando
black {file} && isort {file}

~20 linhas = rapido

βœ‚οΈ Tecnicas de Reducao

  • 1. Remova redundancias: Nao repita o que o nome ja diz
  • 2. Use bullet points: Mais densos que paragrafos
  • 3. Externalize exemplos: Coloque em /examples/ e referencia
  • 4. Divida skills grandes: Multiplas skills pequenas > uma gigante

🎯 Tamanho Ideal

  • Otimo: 50-100 linhas
  • Aceitavel: 100-200 linhas
  • Revisar: 200-500 linhas (considere dividir)
  • Problematico: 500+ linhas (divida obrigatoriamente)
3

πŸ”§ Minimizando Chamadas de Tools

Cada chamada de tool tem overhead de round-trip. Combine operacoes quando possivel.

βœ— Muitas Chamadas (Lento)

Bash: cd /projeto
Bash: ls
Bash: cat file1.js
Bash: cat file2.js
Bash: cat file3.js
Bash: npm install
Bash: npm test

7 chamadas = 7x overhead

βœ“ Chamadas Combinadas (Rapido)

Bash: cd /projeto && ls
Read: file1.js, file2.js, file3.js
Bash: npm install && npm test

3 chamadas = 3x overhead

⚑ Tecnicas de Combinacao

Bash

  • β€’ Use && para sequenciais
  • β€’ Use ; para independentes
  • β€’ Use pipes para transformacoes

Read/Write

  • β€’ Leia multiplos arquivos juntos
  • β€’ Use Glob para buscar varios
  • β€’ Prefira Edit a Read+Write

Instrucao Otimizada na Skill

## Eficiencia

Para minimizar latencia:
- Combine comandos Bash com && ou ;
- Leia multiplos arquivos em uma chamada Read
- Use Glob para encontrar arquivos antes de ler
- Prefira Edit para modificacoes parciais
- Evite cd; use paths absolutos
4

🎯 Descricoes Eficientes

Uma descricao bem escrita ativa a skill rapidamente e evita falsos positivos que desperdicam contexto.

βœ— Descricao Ruim

description: Helps with code

Muito vaga, ativa em tudo

βœ“ Descricao Boa

description: Formats Python code
  using black and isort. Use when
  user asks to format, lint, or
  clean up Python files.

Especifica, com sinonimos

πŸ“‹ Formula da Descricao Perfeita

[Acao principal] [objeto/contexto].
Use when user [triggers comuns].
Keywords: [sinonimos, termos relacionados]

Exemplo:

Generates PDF documents from markdown.
Use when user asks to create, export,
or convert to PDF. Keywords: pdf,
document, export, convert, report

πŸ’‘ Teste sua Descricao

Pergunte ao agente: "Que skill voce usaria para X?" com diferentes formulacoes. Se a skill nao aparece, adicione os termos usados.

5

πŸ’Ύ Caching e Reutilizacao

Evite refazer trabalho. Cache resultados de operacoes caras e reutilize quando possivel.

πŸ“

Cache de Arquivo

Salve resultados em arquivo para reutilizar

# Instrucao na skill:
Antes de analisar, verifique se existe
.cache/analysis.json com menos de 1h.
Se existir, use-o. Senao, crie novo.
πŸ”„

Verificacao Condicional

So execute se necessario

# Instrucao na skill:
Antes de npm install, verifique:
- Se node_modules existe
- Se package-lock.json mudou
So instale se necessario.
πŸ“Š

Processamento Incremental

So processe o que mudou

# Instrucao na skill:
Use git diff para identificar arquivos
modificados. Analise apenas esses, nao
o projeto inteiro.
6

πŸ“Š Medindo e Comparando

MeΓ§a antes e depois de otimizar. Sem metricas, voce nao sabe se melhorou.

⏱️ Metricas de Tempo

  • β€’ Tempo total de execucao
  • β€’ Tempo ate primeira resposta
  • β€’ Tempo por tool call
  • β€’ Tempo em processamento LLM

πŸ“¦ Metricas de Recursos

  • β€’ Tokens de input usados
  • β€’ Tokens de output gerados
  • β€’ Numero de tool calls
  • β€’ Tamanho da skill (linhas)

πŸ“‹ Template de Benchmark

# Benchmark: [nome-da-skill]

## Cenario de Teste
Input: "formato os arquivos Python em /src"
Arquivos: 10 arquivos .py

## Antes da Otimizacao
- Tempo total: 45s
- Tool calls: 12
- Linhas da skill: 180

## Depois da Otimizacao
- Tempo total: 18s (-60%)
- Tool calls: 4 (-67%)
- Linhas da skill: 45 (-75%)

πŸš€ Proximo Passo

Com performance dominada, o proximo modulo apresenta Casos de Uso Reais - exemplos praticos de skills em producao.

πŸ“š Resumo do Modulo

βœ“
Gargalos - LLM (40%), Tools (30%), Network (20%)
βœ“
Tamanho - 50-100 linhas ideal, use bullet points, externalize exemplos
βœ“
Tools - Combine comandos, use && e pipes, prefira Edit
βœ“
Descricao - Especifica com sinonimos e triggers comuns
βœ“
Caching - Cache de arquivo, verificacao condicional, incremental
βœ“
Metricas - Meca tempo, tokens, tool calls antes/depois

Proximo Modulo:

1.8 - Casos de Uso Reais