Cientista de Dados Sênior
Descrição da vaga
A Leega é uma empresa focada no atendimento eficiente e inovador em seus clientes.
Isso não poderia ser diferente com o nosso principal combustível: as pessoas!
Nossa cultura é inspiradora e nossos valores estão presentes no dia a dia: ética e transparência, excelência de qualidade, trabalho em equipe, responsabilidade econômica, social e ambiental, relações humanas e credibilidade.
Buscamos profissionais inovadores que sejam movidos por desafios e focados em resultados.
Se você busca uma empresa dinâmica e parceira e que investe em seus colaboradores através de capacitação constante, a Leega é o lugar para você!
>> A LEEGA É PARA TODOS, ficaremos muito felizes em ter você em nosso time. Venha fazer parte da nossa história e da construção do nosso futuro.
Cadastre-se agora mesmo em nossas vagas!
Responsabilidades e atribuições
Sobre a oportunidade
Você vai transformar dados de demanda, ocupação e comportamento de compra em modelos que precificam uma malha com milhares de pares origem-destino e rotas multi trecho — um problema de revenue management cientificamente rico, com inventário perecível de assentos, sazonalidade forte, no-show e tetos regulatórios. É um papel centrado na descoberta: formular hipóteses, validá-las com rigor estatístico e mover receita e margem na escala de milhões de viagens por ano.
Seus Desafios
• Investigação e EDA — conduzir análise exploratória e estatística para descobrir padrões, levantar hipóteses e guiar a modelagem.
• Previsão de demanda — modelar demanda e no-show por par origem-destino com gradient boosting e séries temporais, corrigindo o viés de demanda censurada (unconstrained demand).
• Elasticidade e disposição a pagar — estimar elasticidade-preço e willingness-to-pay por segmento e rota, base para a otimização de preço.
• Revenue management em rede — modelar proteção de assentos e alocação de capacidade (fare buckets) em rotas multi-trecho, equilibrando ocupação e receita.
• Experimentação causal — desenhar testes A/B e inferência causal que validam mudanças de preço e medem uplift real, com critérios estatísticos claros de promoção.
• Explicabilidade e confiança — garantir interpretabilidade (ex.: SHAP) para defender cada preço perante o negócio e o regulador.
• Cold start e calibração — desenhar estratégias para rotas com pouco histórico, partindo de priors de literatura e evoluindo para ML, por tenant.
Você é a ponte entre ciência e produto: colabora com ML engineers no caminho até produção, com data engineers na disponibilidade dos dados, e com as áreas comercial e de operações na definição das metas.
Requisitos e qualificações
Stack & Ferramentas
- Linguagem & libs: Python (pandas, NumPy, scikit-learn, statsmodels), XGBoost, LightGBM
- Estatística & ML clássico: EDA, modelos estatísticos, regressão, classificação, clustering
- Deep learning: PyTorch, TensorFlow
- Causal & temporal: séries temporais/forecasting, inferência causal (ex.: EconML, DoWhy), bayesiano/hierárquico
- Revenue management & otimização: elasticidade, fare buckets / seat protection, programação linear
- Experimentação, MLOps & dados: A/B testing, JupyterHub, MLflow, Ray Tune; SHAP, SQL, Cube.js sobre Athena
O que Buscamos
Essenciais
• Formação quantitativa sólida (Estatística, Economia, Matemática, Engenharia, CC ou afim) e base robusta em probabilidade, inferência e desenho experimental. • Análise exploratória de dados (EDA) e forte capacidade de storytelling e visualização.
• ML clássico (regressão, classificação, clustering) e séries temporais; familiaridade com deep learning (PyTorch ou TensorFlow).
• Python e o ecossistema de Data Science (pandas, scikit-learn, statsmodels); SQL para dados em larga escala.
• Inferência causal e/ou testes A/B e medição de impacto.
• Comunicação científica clara e conforto com desenvolvimento assistido por IA (Claude Code).
Diferenciais
• Revenue management ou pricing em transporte, aviação ou hotelaria (domínios canônicos de RM).
• Pesquisa operacional e otimização (programação linear; Gurobi, HiGHS ou OR-Tools). • Deep learning aplicado (PyTorch, TensorFlow) — ex.: demanda com embeddings ou modelos sequenciais.
• ML causal (EconML, DoWhy) e modelagem bayesiana/hierárquica (PyMC, Stan). • Reinforcement Learning (em especial RL offline) e ecossistema Ray. • Pós-graduação (Mestrado/Doutorado) e experiência com LLMs/RAG.
Informações adicionais
Trabalho Remoto
Tempo de Projeto: 6 meses, com possibilidade de extensão/internalização.
Etapas do processo
- Etapa 1: Cadastro
- Etapa 2: Avaliação de Perfil
- Etapa 3: Teste Coploy
- Etapa 4: Entrevista Gestor
- Etapa 5: Entrevista Cliente
- Etapa 6: Contratação
Onde a inteligência humana amplifica o poder dos dados
Na Leega, não entregamos apenas linhas de código ou dashboards. Transformamos desafios tecnológicos complexos em impacto real. Com mais de 15 anos de estrada, unimos a profundidade da experiência humana à velocidade da Inteligência Artificial para criar soluções que mudam negócios e, acima de tudo, melhoram a vida das pessoas.
Somos uma consultoria de tecnologia, agnóstica e estratégica. Com escritórios no Brasil e na Europa, nosso time de mais de 580 talentos multidisciplinares vive e respira o ecossistema de Data Analytics, Cloud e IA. Dominamos a base, da Governança à Engenharia, para garantir que a tecnologia não seja apenas uma ferramenta, mas uma vantagem competitiva sustentável para os maiores players do mercado.
A Leega em outras plataformas