Pular para o conteúdo principal

Cientista de Dados Sênior

Descrição da vaga

A Leega é uma empresa focada no atendimento eficiente e inovador em seus clientes. 

Isso não poderia ser diferente com o nosso principal combustível: as pessoas!  

Nossa cultura é inspiradora e nossos valores estão presentes no dia a dia: ética e transparência, excelência de qualidade, trabalho em equipe, responsabilidade econômica, social e ambiental, relações humanas e credibilidade.

Buscamos profissionais inovadores que sejam movidos por desafios e focados em resultados.

Se você busca uma empresa dinâmica e parceira e que investe em seus colaboradores através de capacitação constante, a Leega é o lugar para você!

>> A LEEGA É PARA TODOS, ficaremos muito felizes em ter você em nosso time. Venha fazer parte da nossa história e da construção do nosso futuro. 

Cadastre-se agora mesmo em nossas vagas!

Responsabilidades e atribuições

Sobre a oportunidade

Você vai transformar dados de demanda, ocupação e comportamento de compra em  modelos que precificam uma malha com milhares de pares origem-destino e rotas multi trecho — um problema de revenue management cientificamente rico, com inventário  perecível de assentos, sazonalidade forte, no-show e tetos regulatórios. É um papel  centrado na descoberta: formular hipóteses, validá-las com rigor estatístico e mover receita  e margem na escala de milhões de viagens por ano. 


Seus Desafios 

Investigação e EDA — conduzir análise exploratória e estatística para descobrir  padrões, levantar hipóteses e guiar a modelagem. 

Previsão de demanda — modelar demanda e no-show por par origem-destino com  gradient boosting e séries temporais, corrigindo o viés de demanda censurada  (unconstrained demand). 

Elasticidade e disposição a pagar — estimar elasticidade-preço e willingness-to-pay por segmento e rota, base para a otimização de preço. 

Revenue management em rede — modelar proteção de assentos e alocação de  capacidade (fare buckets) em rotas multi-trecho, equilibrando ocupação e receita. 

Experimentação causal — desenhar testes A/B e inferência causal que validam  mudanças de preço e medem uplift real, com critérios estatísticos claros de promoção. 

Explicabilidade e confiança — garantir interpretabilidade (ex.: SHAP) para defender  cada preço perante o negócio e o regulador. 

Cold start e calibração — desenhar estratégias para rotas com pouco histórico,  partindo de priors de literatura e evoluindo para ML, por tenant. 

Você é a ponte entre ciência e produto: colabora com ML engineers no caminho até  produção, com data engineers na disponibilidade dos dados, e com as áreas comercial e de operações na definição das metas. 



Requisitos e qualificações

Stack & Ferramentas 

  • Linguagem & libs: Python (pandas, NumPy, scikit-learn, statsmodels), XGBoost,  LightGBM 
  • Estatística & ML clássico: EDA, modelos estatísticos, regressão, classificação,  clustering 
  • Deep learning: PyTorch, TensorFlow 
  • Causal & temporal: séries temporais/forecasting, inferência causal (ex.: EconML,  DoWhy), bayesiano/hierárquico 
  • Revenue management & otimização: elasticidade, fare buckets / seat protection,  programação linear 
  • Experimentação, MLOps & dados: A/B testing, JupyterHub, MLflow, Ray Tune; SHAP,  SQL, Cube.js sobre Athena 

O que Buscamos 

Essenciais 

• Formação quantitativa sólida (Estatística, Economia, Matemática, Engenharia, CC ou  afim) e base robusta em probabilidade, inferência e desenho experimental. • Análise exploratória de dados (EDA) e forte capacidade de storytelling e visualização.

• ML clássico (regressão, classificação, clustering) e séries temporais; familiaridade com deep learning (PyTorch ou TensorFlow). 

• Python e o ecossistema de Data Science (pandas, scikit-learn, statsmodels); SQL para dados em larga escala. 

• Inferência causal e/ou testes A/B e medição de impacto. 

• Comunicação científica clara e conforto com desenvolvimento assistido por IA (Claude Code). 


Diferenciais 

• Revenue management ou pricing em transporte, aviação ou hotelaria (domínios  canônicos de RM). 

• Pesquisa operacional e otimização (programação linear; Gurobi, HiGHS ou OR-Tools). • Deep learning aplicado (PyTorch, TensorFlow) — ex.: demanda com embeddings ou  modelos sequenciais. 

• ML causal (EconML, DoWhy) e modelagem bayesiana/hierárquica (PyMC, Stan). • Reinforcement Learning (em especial RL offline) e ecossistema Ray. • Pós-graduação (Mestrado/Doutorado) e experiência com LLMs/RAG.

Informações adicionais

Trabalho Remoto

Tempo de Projeto: 6 meses, com possibilidade de extensão/internalização.

Etapas do processo

  1. Etapa 1: Cadastro
  2. Etapa 2: Avaliação de Perfil
  3. Etapa 3: Teste Coploy
  4. Etapa 4: Entrevista Gestor
  5. Etapa 5: Entrevista Cliente
  6. Etapa 6: Contratação

Onde a inteligência humana amplifica o poder dos dados

Na Leega, não entregamos apenas linhas de código ou dashboards. Transformamos desafios tecnológicos complexos em impacto real. Com mais de 15 anos de estrada, unimos a profundidade da experiência humana à velocidade da Inteligência Artificial para criar soluções que mudam negócios e, acima de tudo, melhoram a vida das pessoas.

Somos uma consultoria de tecnologia, agnóstica e estratégica. Com escritórios no Brasil e na Europa, nosso time de mais de 580 talentos multidisciplinares vive e respira o ecossistema de Data Analytics, Cloud e IA. Dominamos a base, da Governança à Engenharia, para garantir que a tecnologia não seja apenas uma ferramenta, mas uma vantagem competitiva sustentável para os maiores players do mercado.