Pular para o conteúdo principal

Cientista de Dados Junior

Descrição da vaga

A Leega é uma empresa focada no atendimento eficiente e inovador em seus clientes. 

Isso não poderia ser diferente com o nosso principal combustível: as pessoas!  

Nossa cultura é inspiradora e nossos valores estão presentes no dia a dia: ética e transparência, excelência de qualidade, trabalho em equipe, responsabilidade econômica, social e ambiental, relações humanas e credibilidade.

Buscamos profissionais inovadores que sejam movidos por desafios e focados em resultados.

Se você busca uma empresa dinâmica e parceira e que investe em seus colaboradores através de capacitação constante, a Leega é o lugar para você!

>> A LEEGA É PARA TODOS, ficaremos muito felizes em ter você em nosso time. Venha fazer parte da nossa história e da construção do nosso futuro. 

Cadastre-se agora mesmo em nossas vagas!

Responsabilidades e atribuições

O que é a área de Ciência de Dados

A área de Ciência de Dados é responsável por aplicar técnicas estatísticas e algoritmos de Machine Learning (ML) para analisar grandes volumes de dados, identificar padrões e construir modelos preditivos. O foco principal é extrair insights acionáveis que suportam a tomada de decisão estratégica, otimizam processos de negócio (como precificação, detecção de fraudes e retenção de clientes) e impulsionam a inovação com soluções baseadas em dados. Você atuará na interface entre os desafios do negócio e a implementação técnica no ambiente Azure Databricks.



Seus Principais Desafios Serão:

  • Compreender as Necessidades do Negócio e Requisitos de ML/IA: Colaborar com stakeholders e Cientistas de Dados Sêniores para entender os problemas de negócio e traduzi-los em hipóteses testáveis e projetos de Machine Learning.
  • Participar de Discussões Baseadas em Dados e IA: Contribuir com análises iniciais, insights e propostas de modelos para solucionar desafios de dados e IA.
  • Interface entre Times de Tecnologia e Data Science: Trabalhar em sinergia com Engenheiros de Dados e Arquitetos para garantir a disponibilidade dos dados e o treinamento eficiente dos modelos.

Preparação e Exploração de Dados no Azure Databricks:

  • Realizar a limpeza, transformação, padronização e enriquecimento de dados brutos utilizando o poder de processamento do Azure Databricks e Spark.
  • Conduzir a Análise Exploratória de Dados (EDA) para entender distribuições, identificar outliers e selecionar features relevantes (Feature Engineering)

Desenvolvimento e Validação de Modelos de ML:

  • Construir, treinar e validar modelos preditivos (regressão, classificação, clustering) utilizando frameworks de Ciência de Dados como Scikit-Learn, TensorFlow ou PyTorch.
  • Documentar e apresentar os resultados e métricas de desempenho dos modelos (e.g., AUC, F1-Score).

Apoiar a Operacionalização (MLOps):

  • Auxiliar na transição dos modelos desenvolvidos para ambientes de produção, utilizando ferramentas como MLflow para rastreamento e gerenciamento de experimentos e modelos no Azure Databricks.
  • Monitoramento da Qualidade dos Dados e Modelos: Acompanhar a qualidade, integridade e drift dos dados e o desempenho dos modelos em produção, propondo ajustes quando necessário.


O que Você Precisa para Fazer Parte Deste Time:

Arquitetura e Ferramentas de Dados:

  • Foco em Azure Databricks: Conhecimento e experiência prática na utilização de Azure Databricks para processamento e análise de dados, incluindo a utilização de notebooks (Python/Spark) e gerenciamento de clusters.
  • Feature Store/Data Lake: Entendimento do conceito de Feature Store e experiência em consumir dados de Data Lakes (preferencialmente Azure Data Lake Storage) e estruturar dados para o consumo de modelos.

Programação e Frameworks de Ciência de Dados:

  • Linguagens: Python (Imprescindível) para manipulação de dados (Pandas, NumPy) e desenvolvimento de modelos.
  • Frameworks de ML/IA (Foco em Treinamento): Experiência prática com as principais bibliotecas e frameworks como Scikit-Learn (modelos clássicos), TensorFlow/Keras ou PyTorch (para aprendizado profundo) e bibliotecas como XGBoost/LightGBM.
  • Gestão de Experimentos: Noções de uso do MLflow para rastreamento e versionamento de modelos e experimentos no ambiente Databricks.
  • Consultas e Transformação: Proficiência em SQL/Spark SQL para consulta e manipulação de dados em larga escala.

Requisitos e qualificações

Ferramentas de Dados: 

  • Experiência com ferramentas para CI/CD e automação de fluxos de machine learning.
  • Observabilidade de Dados.
  • Familiaridade com ferramentas de monitoramento e validação de dados,
  • Orquestração de Pipelines.

Bancos de Dados e Armazenamento de Dados: 

  • Conhecimento em SQL.
  • Data Lakes e Data Warehouses: 
  • Capacidade de gerenciar Data Lakes para preparação de dados de IA, com foco em Azure Databricks.
  • Armazenamento de Features.

Cloud e Infraestrutura


Nuvem:

  • Azure + Databricks.

Conhecimento em Modelagem de IA: 

  • Capacidade de colaborar com os demais Cientistas de Dados para preparar conjuntos de dados para modelos de IA, garantindo alta qualidade e performance.

MLOps: 

  • Implementação de pipelines automatizados para treinamento, validação, deployment e monitoramento de modelos de IA.

Gestão de Features: 

  • Capacidade de definir e gerenciar repositórios de features para modelos de IA (Feature Engineering).

Conhecimentos Complementares

  • Privacidade e Segurança de Dados: Conhecimento de LGPD/GDPR para garantir conformidade regulatória no tratamento de dados para IA.

Metodologias Ágeis:

Experiência de trabalho com metodologias ágeis (Scrum/Kanban).


Capacidade Analítica:

  • Capacidade de entender requisitos de negócio e convertê-los em soluções técnicas para IA.


Atuação: Modelo Remoto

Informações adicionais

Na nossa empresa, você encontrará um ambiente colaborativo e um pacote de benefícios que visa o seu crescimento, saúde e qualidade de vida. Confira abaixo os benefícios que oferecemos:


🏥 Convênio Médico Porto Seguro

Cuidado completo para você e sua família, com possibilidade de incluir cônjuge e filhos.


🦷 Convênio Odontológico Porto Seguro

Proteção odontológica para você e seus dependentes.


💰 Participação nos Lucros e Resultados (PLR)

Reconhecimento pelo seu trabalho e contribuição para o sucesso da empresa.


👶 Auxílio Creche

Suporte financeiro para que pais e mães cuidem dos pequenos com tranquilidade.


🍽️ Vale Alimentação e Refeição Alelo

Garantindo refeições práticas e confortáveis no seu dia a dia.


💻 Auxílio Home Office

Incentivo para que você tenha um espaço de trabalho confortável em casa.


📚 Parcerias com Instituições de Ensino

Educação ao seu alcance, com descontos e incentivos em cursos e graduações.


🚀 Incentivo para Certificações, inclusive em Cloud

Avance sua carreira com certificações nas principais tecnologias como: GCP, Azure, AWS entre outras.


🎁 Pontos Livelo

Acumule pontos e use como preferir, com total liberdade de escolha.


🏋️‍♂️ TotalPass

Incentivo à saúde com planos de academia com desconto para colaboradores e familiares.


🧘‍♂️Mindself

Incentivo à melhorar a qualidade de vida através de meditação e o Mindfulness.

Etapas do processo

  1. Etapa 1: Cadastro
  2. Etapa 2: Mapeamento Comportamental
  3. Etapa 3: Avaliação de Perfil
  4. Etapa 4: Entrevista Gestor
  5. Etapa 5: Entrevista Cliente
  6. Etapa 6: Contratação

Vem trabalhar com a gente!

A LEEGA é referência em consultoria e outsourcing para soluções de Data Analytics .

Temos 15 ANOS de mercado e mais de 20 ANOS de experiência em soluções de Business Intelligence, Data Integration e Analytics, atendendo grandes empresas dos mais diversos segmentos do mercado e contamos com mais de 580 colaboradores.

Conquistamos capacidade técnica e reunimos as melhores pessoas para proporcionar aos nossos clientes a melhor experiência.


Brasileiros, com escritório de projetos, fábrica de software e centro de treinamento em São Paulo (capital) , atuação internacional com escritório também em Portugal, somos conhecidos por viver e respirar Analytics e Big Data, inovando nossa tecnologia, compartilhando conhecimento, evoluindo talentos e entregando VALOR.

 

Em nosso porftólio de serviços ofertamos consultoria especializada, alocação de profissionais, treinamento e desenvolvimento de soluções customizadas para Cloud Computing, Business Intelligence, Big Data, Data Analytics, Machine Learning, Inteligência Artificial, Data Quality, MDM, Governança de Dados e demais soluções de dados