Desenvolvimento assistido por IA com contexto governado

O desenvolvedor pediu ao copilot um client para API interna. O código compilou. Parecia idêntico ao que “sempre funcionou”. Só que a API mudou há oito meses, e o runbook vigente estava em outro repositório que o modelo nunca viu.

Tema IA & engenharia. Leia a fundação em Contexto antes de IA.

O autocomplete enganoso

Copilot e ferramentas similares reduzem atrito de digitação. Não garantem verdade operacional. Quando o modelo não vê contrato real, ADR vigente ou runbook curado, ele completa com plausibilidade, e plausibilidade em produção vira incidente.

No caso do client para API interna: o código compilou porque a sintaxe estava correta. O endpoint sugerido existiu, em 2024. A versão atual exige header de tenant e path prefix que mudou no refactor do Q3; o runbook vigente estava em repositório de operação que a IDE nunca indexou. Deploy em staging passou porque não havia teste de contrato. Produção falhou na integração que mais fatura.

A pergunta certa não é “qual LLM usamos?”. É: o que o assistente tem permissão de ver, com qual política, quem promoveu aquela versão como canônica, e se busca respeita segregação por ambiente e por cliente. MCP padroniza transporte na IDE; governança continua sendo sua, autenticação, escopo por papel, trilha de auditoria do que foi recuperado.

Riscos que já vimos em campo

Lista curta que vira longa na operação gerenciadas reais:

Alucinação de endpoint ou campo de payload obsoleto.
Dependência sugerida que não existe no registry privado.
Terraform com IAM *:* “temporário” que nunca sai do state.
Agente com permissão de executar delete em produção sem approval gate.
Embedding de repositório inteiro sem classificação, runbook de homologação aparecendo para dev de outro produto.
Fatura de tokens que triplica porque workflow reenvia contexto completo a cada turno.

Mitigação não é prompt maior nem “confiança no modelo”. É sequência operacional: mapear fontes, definir o que é canônico vs. rascunho, política de acesso antes da busca, curadoria com dono por domínio, revisão humana onde o dano é irreversível. Mesma ordem da série Knowledge Operations. Pular etapa externaliza risco para o modelo, e para quem assina o merge.

Busca na IDE, o que precisa existir atrás

Integração MCP na IDE é útil quando o serviço de contexto atrás entrega chunk com metadado: fonte, versão, data de revisão, classificação, owner. Desenvolvedor pergunta “como autenticar na API X?”, resposta cita runbook aprovado, não thread de Slack de 2023. Sem metadado, busca vira loteria semântica.

Em ambiente multi-cliente (consultoria, integradora, operações compartilhadas), segregação é requisito de arquitetura: índice por cliente, filtro por papel, impossibilidade de cruzar contexto de tenant A em sessão de tenant B, humano ou agente. Vazamento lateral via copiloto é incidente de segurança, não “bug do modelo”.

Agentes com supervisão humana

Workflow com agente que propõe mudança em runbook, abre MR ou executa script exige o mesmo approval gate que humano: proposta → revisão → aprovação → ação. Agente que “publica direto” destrói confiança no canônico. Na UCloud, humanos decidem; agentes preparam, em operação e em plataforma.

Custo de agente entra no mesmo cockpit que FinOps de cloud: orçamento por workflow, alerta de anomalia, limite de tokens por sessão. Desenvolvimento assistido sem visibilidade de custo reproduz surpresa na fatura, só que na linha de IA.

Plataforma quando escala

Em parcerias maduras, concentramos serviço de contexto (pgvector + políticas + busca), bibliotecas governadas por domínio e agentes com gates, a mesma base que usamos em operação gerenciada e que o UCloud One estende para times que querem operar internamente. A plataforma comercial evolui; a disciplina já roda em produção real com registro, mapa e revisão editorial em Git.

Começar pelo piloto estreito: um squad, um repositório canônico, um fluxo de MR para promoção. Medir: tempo para resposta correta, taxa de PR com sugestão revertida em revisão, incidentes ligados a código gerado sem contexto. Expandir perímetro com evidência, não com rollout corporativo no trimestre um.