π Entendendo Gargalos
Para otimizar, primeiro entenda onde o tempo e gasto. Skills podem ser lentas por varios motivos.
β±οΈ Onde o Tempo e Gasto
- 40% Processamento LLM: Cada token de entrada/saida custa tempo
- 30% Chamadas de Tools: Cada Bash, Read, Write tem overhead
- 20% Network: APIs externas, MCP servers
- 10% Outros: Carregamento de skills, parsing
Impacto por Tipo de Operacao
π‘ Regra de Ouro
Menos e mais. Menos texto na skill = menos tokens = mais rapido. Menos tools = menos overhead. Foque no essencial.
π Otimizando Tamanho da Skill
O tamanho da skill afeta diretamente quanto contexto consome. Skills enxutas sao mais rapidas e deixam mais espaco para o trabalho real.
β Skill Verbosa (Evitar)
## Instrucoes Detalhadas
Esta skill foi criada para ajudar
usuarios a formatar codigo Python
de acordo com as melhores praticas
da comunidade, incluindo PEP8...
[... 50 linhas de contexto ...]
Voce deve primeiro verificar se o
arquivo existe, depois ler o conteudo,
analisar a estrutura...
[... 100 linhas de instrucoes ...]
~200 linhas = muitos tokens
β Skill Concisa (Ideal)
## Python Formatter
Formata codigo Python usando PEP8.
### Uso
1. Ler arquivo .py solicitado
2. Aplicar black + isort
3. Salvar formatado
### Comando
black {file} && isort {file}
~20 linhas = rapido
βοΈ Tecnicas de Reducao
- 1. Remova redundancias: Nao repita o que o nome ja diz
- 2. Use bullet points: Mais densos que paragrafos
- 3. Externalize exemplos: Coloque em /examples/ e referencia
- 4. Divida skills grandes: Multiplas skills pequenas > uma gigante
π― Tamanho Ideal
- Otimo: 50-100 linhas
- Aceitavel: 100-200 linhas
- Revisar: 200-500 linhas (considere dividir)
- Problematico: 500+ linhas (divida obrigatoriamente)
π§ Minimizando Chamadas de Tools
Cada chamada de tool tem overhead de round-trip. Combine operacoes quando possivel.
β Muitas Chamadas (Lento)
Bash: cd /projeto
Bash: ls
Bash: cat file1.js
Bash: cat file2.js
Bash: cat file3.js
Bash: npm install
Bash: npm test
7 chamadas = 7x overhead
β Chamadas Combinadas (Rapido)
Bash: cd /projeto && ls
Read: file1.js, file2.js, file3.js
Bash: npm install && npm test
3 chamadas = 3x overhead
β‘ Tecnicas de Combinacao
Bash
- β’ Use
&¶ sequenciais - β’ Use
;para independentes - β’ Use pipes para transformacoes
Read/Write
- β’ Leia multiplos arquivos juntos
- β’ Use Glob para buscar varios
- β’ Prefira Edit a Read+Write
Instrucao Otimizada na Skill
## Eficiencia
Para minimizar latencia:
- Combine comandos Bash com && ou ;
- Leia multiplos arquivos em uma chamada Read
- Use Glob para encontrar arquivos antes de ler
- Prefira Edit para modificacoes parciais
- Evite cd; use paths absolutos
π― Descricoes Eficientes
Uma descricao bem escrita ativa a skill rapidamente e evita falsos positivos que desperdicam contexto.
β Descricao Ruim
description: Helps with code
Muito vaga, ativa em tudo
β Descricao Boa
description: Formats Python code
using black and isort. Use when
user asks to format, lint, or
clean up Python files.
Especifica, com sinonimos
π Formula da Descricao Perfeita
[Acao principal] [objeto/contexto].
Use when user [triggers comuns].
Keywords: [sinonimos, termos relacionados]
Exemplo:
Generates PDF documents from markdown.
Use when user asks to create, export,
or convert to PDF. Keywords: pdf,
document, export, convert, report
π‘ Teste sua Descricao
Pergunte ao agente: "Que skill voce usaria para X?" com diferentes formulacoes. Se a skill nao aparece, adicione os termos usados.
πΎ Caching e Reutilizacao
Evite refazer trabalho. Cache resultados de operacoes caras e reutilize quando possivel.
Cache de Arquivo
Salve resultados em arquivo para reutilizar
# Instrucao na skill:
Antes de analisar, verifique se existe
.cache/analysis.json com menos de 1h.
Se existir, use-o. Senao, crie novo.
Verificacao Condicional
So execute se necessario
# Instrucao na skill:
Antes de npm install, verifique:
- Se node_modules existe
- Se package-lock.json mudou
So instale se necessario.
Processamento Incremental
So processe o que mudou
# Instrucao na skill:
Use git diff para identificar arquivos
modificados. Analise apenas esses, nao
o projeto inteiro.
π Medindo e Comparando
MeΓ§a antes e depois de otimizar. Sem metricas, voce nao sabe se melhorou.
β±οΈ Metricas de Tempo
- β’ Tempo total de execucao
- β’ Tempo ate primeira resposta
- β’ Tempo por tool call
- β’ Tempo em processamento LLM
π¦ Metricas de Recursos
- β’ Tokens de input usados
- β’ Tokens de output gerados
- β’ Numero de tool calls
- β’ Tamanho da skill (linhas)
π Template de Benchmark
# Benchmark: [nome-da-skill]
## Cenario de Teste
Input: "formato os arquivos Python em /src"
Arquivos: 10 arquivos .py
## Antes da Otimizacao
- Tempo total: 45s
- Tool calls: 12
- Linhas da skill: 180
## Depois da Otimizacao
- Tempo total: 18s (-60%)
- Tool calls: 4 (-67%)
- Linhas da skill: 45 (-75%)
π Proximo Passo
Com performance dominada, o proximo modulo apresenta Casos de Uso Reais - exemplos praticos de skills em producao.
π Resumo do Modulo
Proximo Modulo:
1.8 - Casos de Uso Reais