MODULO 3.7

☁️ Vertex AI Integration

Deploy em producao, scaling enterprise e integracao completa com Google Cloud Platform.

6
Topicos
35
Minutos
Avancado
Nivel
Pratico
Tipo
1

☁️ AI Studio vs Vertex AI

Entenda quando usar cada plataforma.

🎨 AI Studio

Prototipagem e desenvolvimento

  • • Free tier generoso
  • • Interface simples
  • • Ideal para MVPs
  • • API key authentication
  • • Limites de rate mais baixos

☁️ Vertex AI

Producao enterprise

  • • SLAs garantidos
  • • VPC e seguranca enterprise
  • • Quotas maiores
  • • IAM granular
  • • Compliance (HIPAA, SOC)
2

🔧 Setup do Vertex AI

Configuracao inicial no Google Cloud Platform.

1

Criar Projeto GCP

console.cloud.google.com > Novo Projeto > Nome descritivo

2

Habilitar APIs

Vertex AI API, Cloud Storage, IAM - via gcloud ou console

3

Configurar Autenticacao

Service Account com roles Vertex AI User e Storage Object Viewer

3

🐍 Vertex AI SDK

O SDK google-cloud-aiplatform oferece recursos enterprise.

Uso com Vertex AI

import vertexai
from vertexai.generative_models import GenerativeModel

# Inicializar com projeto e regiao
vertexai.init(
    project="seu-projeto-id",
    location="us-central1"
)

# Criar modelo
model = GenerativeModel("gemini-pro")

# Gerar conteudo
response = model.generate_content("Explique cloud computing")
print(response.text)
4

📈 Scaling e Performance

Configuracoes para alta carga e disponibilidade.

Quotas

  • • Solicite aumento de quotas
  • • Use multiplas regioes
  • • Implemente rate limiting local

Performance

  • • Batch requests quando possivel
  • • Use streaming para UX
  • • Cache respostas frequentes
5

🔒 Seguranca Enterprise

Recursos de seguranca para ambientes corporativos.

🔐 Recursos de Seguranca

  • VPC Service Controls: Isola recursos em perimetro seguro
  • Private Google Access: Acesso sem internet publica
  • CMEK: Customer-managed encryption keys
  • IAM: Controle granular de acesso
  • Audit Logs: Rastreabilidade completa
6

📊 Monitoring e Observability

Metricas, logs e alertas para operacao em producao.

Metricas Chave

  • • Request latency (P50, P95, P99)
  • • Token usage (input/output)
  • • Error rate por tipo
  • • Quota utilization

Ferramentas

  • • Cloud Monitoring dashboards
  • • Cloud Logging para debug
  • • Alerting policies
  • • Error Reporting

📚 Resumo do Modulo

AI Studio vs Vertex - Dev/prototipo vs producao enterprise
Setup - Projeto GCP, APIs, autenticacao
SDK - google-cloud-aiplatform para producao
Scaling - Quotas, multi-region, batch processing
Seguranca - VPC-SC, CMEK, IAM, audit logs
Monitoring - Cloud Monitoring, Logging, Alerting

Proximo Modulo:

3.8 - Projetos Praticos