Modulo 3.7: Vertex AI Integration | Agent Skills Mastery

☁️ AI Studio vs Vertex AI

Entenda quando usar cada plataforma.

🎨 AI Studio

Prototipagem e desenvolvimento

• Free tier generoso
• Interface simples
• Ideal para MVPs
• API key authentication
• Limites de rate mais baixos

☁️ Vertex AI

Producao enterprise

• SLAs garantidos
• VPC e seguranca enterprise
• Quotas maiores
• IAM granular
• Compliance (HIPAA, SOC)

🔧 Setup do Vertex AI

Configuracao inicial no Google Cloud Platform.

Criar Projeto GCP

console.cloud.google.com > Novo Projeto > Nome descritivo

Habilitar APIs

Vertex AI API, Cloud Storage, IAM - via gcloud ou console

Configurar Autenticacao

Service Account com roles Vertex AI User e Storage Object Viewer

🐍 Vertex AI SDK

O SDK google-cloud-aiplatform oferece recursos enterprise.

Uso com Vertex AI

import vertexai
from vertexai.generative_models import GenerativeModel

# Inicializar com projeto e regiao
vertexai.init(
    project="seu-projeto-id",
    location="us-central1"
)

# Criar modelo
model = GenerativeModel("gemini-pro")

# Gerar conteudo
response = model.generate_content("Explique cloud computing")
print(response.text)

📈 Scaling e Performance

Configuracoes para alta carga e disponibilidade.

Quotas

• Solicite aumento de quotas
• Use multiplas regioes
• Implemente rate limiting local

Performance

• Batch requests quando possivel
• Use streaming para UX
• Cache respostas frequentes

🔒 Seguranca Enterprise

Recursos de seguranca para ambientes corporativos.

🔐 Recursos de Seguranca

•VPC Service Controls: Isola recursos em perimetro seguro
•Private Google Access: Acesso sem internet publica
•CMEK: Customer-managed encryption keys
•IAM: Controle granular de acesso
•Audit Logs: Rastreabilidade completa

📊 Monitoring e Observability

Metricas, logs e alertas para operacao em producao.

Metricas Chave

• Request latency (P50, P95, P99)
• Token usage (input/output)
• Error rate por tipo
• Quota utilization

Ferramentas

• Cloud Monitoring dashboards
• Cloud Logging para debug
• Alerting policies
• Error Reporting

📚 Resumo do Modulo

✓

AI Studio vs Vertex - Dev/prototipo vs producao enterprise

✓

Setup - Projeto GCP, APIs, autenticacao

✓

SDK - google-cloud-aiplatform para producao

✓

Scaling - Quotas, multi-region, batch processing

✓

Seguranca - VPC-SC, CMEK, IAM, audit logs

✓

Monitoring - Cloud Monitoring, Logging, Alerting

Proximo Modulo:

3.8 - Projetos Praticos

← Modulo Anterior Proximo Modulo →