Pular para o conteúdo principal

AI Engineer (Sênior) — Agentes, Plataforma & RAG

Descrição da vaga

A Leega é uma empresa focada no atendimento eficiente e inovador em seus clientes. 

Isso não poderia ser diferente com o nosso principal combustível: as pessoas!  

Nossa cultura é inspiradora e nossos valores estão presentes no dia a dia: ética e transparência, excelência de qualidade, trabalho em equipe, responsabilidade econômica, social e ambiental, relações humanas e credibilidade.

Buscamos profissionais inovadores que sejam movidos por desafios e focados em resultados.

Se você busca uma empresa dinâmica e parceira e que investe em seus colaboradores através de capacitação constante, a Leega é o lugar para você!

>> A LEEGA É PARA TODOS, ficaremos muito felizes em ter você em nosso time. Venha fazer parte da nossa história e da construção do nosso futuro. 

Cadastre-se agora mesmo em nossas vagas!

Responsabilidades e atribuições

Sobre a oportunidade

Você vai construir a plataforma de agentes de IA da Guanabara e o ecossistema que distribui IA generativa governada à companhia. O princípio que rege tudo: a inteligência vem do modelo, mas a confiança vem da estrutura em volta dele — por isso o coração do sistema é uma camada semântica determinística (Cube.js) que impede o modelo de inventar números, somada a verificação e governança de ponta a ponta. 


Seus Desafios 

  • Orquestração de agentes — construir agentes com LangGraph no padrão Supervisor/ReAct, com memória de curto/longo prazo e estado durável (PostgresSaver). 
  • Camada semântica e RAG — evoluir a camada semântica determinística (Cube.js) e a recuperação semântica com Qdrant (busca vetorial + re-ranking) que ancoram as respostas em dado real. 
  • Skills, subagentes e MCP — criar e versionar skills (SKILL.md), subagentes e ferramentas MCP (FastMCP) para o Claude Code, em fluxo spec-driven, conectando agentes a sistemas corporativos. 
  • Verificação e avaliação — manter o verificador (LLM-as-judge) e suítes de eval (offline/online) com amostragem de traces para pegar drift de qualidade. 
  • Plataforma de modelos — operar o gateway LiteLLM (Virtual Keys, budget, RBAC, roteamento multi-provider) otimizando custo e latência. 
  • Adaptação e serving de modelos — quando RAG e prompting não bastam, fazer fine-tuning supervisionado e PEFT (LoRA/QLoRA), quantização e destilação; servir modelos abertos/privados com vLLM e roteamento SLM↔LLM. 
  • Governança e segurança — aplicar guardrails de PII (Presidio), defesa contra prompt injection e observabilidade ponta a ponta (Langfuse). 

Você atua na fronteira entre IA e negócio, colaborando com as áreas de dados, engenharia e as operações que consomem os agentes. 

Requisitos e qualificações

Stack & Ferramentas 

  • Agentes & estado: LangGraph, LangChain (Supervisor/ReAct), PostgresSaver
  • Modelos & gateway: LiteLLM (multi-provider, Bedrock), Hugging Face
  • Fine-tuning & serving: PEFT (LoRA/QLoRA), quantização, destilação, vLLM
  • RAG & busca: Qdrant, re-ranking; GraphRAG/Neo4j sob demanda 
  • Conhecimento & tools: Cube.js (semantic layer), MCP/FastMCP, n8n
  • Governança & eval: Presidio, Langfuse, LLM-as-judge, OpenTelemetry
  • Harness & dev: Claude Code (skills, subagentes, CLAUDE.md), Python/FastAPI 

O que Buscamos 

Essenciais 

  • Experiência construindo aplicações de IA generativa em produção (agentes ou RAG). • Python e design de APIs (FastAPI/FastMCP). 
  • Frameworks de agentes (LangGraph, LangChain) e function calling estruturado (Pydantic). 
  • RAG e vector databases (Qdrant ou similares). 
  • Gateways/roteamento de LLMs (LiteLLM) e o Model Context Protocol (MCP).
  • Fine-tuning e adaptação de modelos: PEFT (LoRA/QLoRA), quantização e serving (vLLM). 
  • Autoria de skills e agentes para o Claude Code — central nesta posição.

Diferenciais 

  • Camadas semânticas (Cube.js) como fonte de recuperação determinística.
  • Fine-tuning avançado: instruction tuning, destilação, fine-tuning de embeddings e roteamento SLM↔LLM. 
  • Guardrails de PII (Presidio) e defesa contra prompt injection. 
  • Observabilidade e avaliação (Langfuse, LLM-as-judge, evals). 
  • GraphRAG / Neo4j como evolução híbrida sob demanda. 
  • Plataformas de automação (n8n) e integração com sistemas corporativos.

Informações adicionais

  • Trabalho Remoto
  • Tempo de Projeto: 6 meses, com possibilidade de extensão/internalização.

Etapas do processo

  1. Etapa 1: Cadastro
  2. Etapa 2: Avaliação de Perfil
  3. Etapa 3: Teste Coploy
  4. Etapa 4: Entrevista Gestor
  5. Etapa 5: Entrevista Cliente
  6. Etapa 6: Contratação

Onde a inteligência humana amplifica o poder dos dados

Na Leega, não entregamos apenas linhas de código ou dashboards. Transformamos desafios tecnológicos complexos em impacto real. Com mais de 15 anos de estrada, unimos a profundidade da experiência humana à velocidade da Inteligência Artificial para criar soluções que mudam negócios e, acima de tudo, melhoram a vida das pessoas.

Somos uma consultoria de tecnologia, agnóstica e estratégica. Com escritórios no Brasil e na Europa, nosso time de mais de 580 talentos multidisciplinares vive e respira o ecossistema de Data Analytics, Cloud e IA. Dominamos a base, da Governança à Engenharia, para garantir que a tecnologia não seja apenas uma ferramenta, mas uma vantagem competitiva sustentável para os maiores players do mercado.