Cientista de Dados Pleno
Descrição da vaga
A Leega é uma empresa focada no atendimento eficiente e inovador em seus clientes.
Isso não poderia ser diferente com o nosso principal combustível: as pessoas!
Nossa cultura é inspiradora e nossos valores estão presentes no dia a dia: ética e transparência, excelência de qualidade, trabalho em equipe, responsabilidade econômica, social e ambiental, relações humanas e credibilidade.
Buscamos profissionais inovadores que sejam movidos por desafios e focados em resultados.
Se você busca uma empresa dinâmica e parceira e que investe em seus colaboradores através de capacitação constante, a Leega é o lugar para você!
>> A LEEGA É PARA TODOS, ficaremos muito felizes em ter você em nosso time. Venha fazer parte da nossa história e da construção do nosso futuro.
Cadastre-se agora mesmo em nossas vagas!
Responsabilidades e atribuições
Seus Principais Desafios Serão:
- Compreender as Necessidades do Negócio e Requisitos de ML/IA: Colaborar com stakeholders e Cientistas de Dados Sêniores para entender os problemas de negócio e traduzi-los em hipóteses testáveis e projetos de Machine Learning.
- Participar de Discussões Baseadas em Dados e IA: Contribuir com análises iniciais, insights e propostas de modelos para solucionar desafios de dados e IA.
- Interface entre Times de Tecnologia e Data Science: Trabalhar em sinergia com Engenheiros de Dados e Arquitetos para garantir a disponibilidade dos dados e o treinamento eficiente dos modelos.
Preparação e Exploração de Dados no Azure Databricks:
- Realizar a limpeza, transformação, padronização e enriquecimento de dados brutos utilizando o poder de processamento do Azure Databricks e Spark.
- Conduzir a Análise Exploratória de Dados (EDA) para entender distribuições, identificar outliers e selecionar features relevantes (Feature Engineering).
Desenvolvimento e Validação de Modelos de ML:
- Construir, treinar e validar modelos preditivos (regressão, classificação, clustering) utilizando frameworks de Ciência de Dados como Scikit-Learn, TensorFlow ou PyTorch.
- Documentar e apresentar os resultados e métricas de desempenho dos modelos (e.g., AUC, F1-Score).
Apoiar a Operacionalização (MLOps):
- Auxiliar na transição dos modelos desenvolvidos para ambientes de produção, utilizando ferramentas como MLflow para rastreamento e gerenciamento de experimentos e modelos no Azure Databricks.
- Monitoramento da Qualidade dos Dados e Modelos: Acompanhar a qualidade, integridade e drift dos dados e o desempenho dos modelos em produção, propondo ajustes quando necessário.
O que Você Precisa para Fazer Parte Deste Time:
Arquitetura e Ferramentas de Dados:
- Foco em Azure Databricks: Conhecimento e experiência prática na utilização de Azure Databricks para processamento e análise de dados, incluindo a utilização de notebooks (Python/Spark) e gerenciamento de clusters.
- Feature Store/Data Lake: Entendimento do conceito de Feature Store e experiência em consumir dados de Data Lakes (preferencialmente Azure Data Lake Storage) e estruturar dados para o consumo de modelos.
Programação e Frameworks de Ciência de Dados:
- Linguagens: Python (Imprescindível) para manipulação de dados (Pandas, NumPy) e desenvolvimento de modelos.
- Frameworks de ML/IA (Foco em Treinamento): Experiência prática com as principais bibliotecas e frameworks como Scikit-Learn (modelos clássicos), TensorFlow/Keras ou PyTorch (para aprendizado profundo) e bibliotecas como XGBoost/LightGBM.
- Gestão de Experimentos: Noções de uso do MLflow para rastreamento e versionamento de modelos e experimentos no ambiente Databricks.
- Consultas e Transformação: Proficiência em SQL/Spark SQL para consulta e manipulação de dados em larga escala.
Requisitos e qualificações
Ferramentas de Dados:
- Experiência com ferramentas para CI/CD e automação de fluxos de machine learning.
- Observabilidade de Dados.
- Familiaridade com ferramentas de monitoramento e validação de dados,
- Orquestração de Pipelines.
Bancos de Dados e Armazenamento de Dados:
- Conhecimento em SQL.
- Data Lakes e Data Warehouses:
- Capacidade de gerenciar Data Lakes para preparação de dados de IA, com foco em Azure Databricks.
- Armazenamento de Features.
Cloud e Infraestrutura
Nuvem:
- Azure + Databricks.
Conhecimento em Modelagem de IA:
- Capacidade de colaborar com os demais Cientistas de Dados para preparar conjuntos de dados para modelos de IA, garantindo alta qualidade e performance.
MLOps:
- Implementação de pipelines automatizados para treinamento, validação, deployment e monitoramento de modelos de IA.
Gestão de Features:
- Capacidade de definir e gerenciar repositórios de features para modelos de IA (Feature Engineering).
Conhecimentos Complementares
- Privacidade e Segurança de Dados: Conhecimento de LGPD/GDPR para garantir conformidade regulatória no tratamento de dados para IA.
Metodologias Ágeis:
Experiência de trabalho com metodologias ágeis (Scrum/Kanban).
Capacidade Analítica:
- Capacidade de entender requisitos de negócio e convertê-los em soluções técnicas para IA.
Atuação: Modelo Remoto
Informações adicionais
Na nossa empresa, você encontrará um ambiente colaborativo e um pacote de benefícios que visa o seu crescimento, saúde e qualidade de vida. Confira abaixo os benefícios que oferecemos:
🏥 Convênio Médico Porto Seguro
Cuidado completo para você e sua família, com possibilidade de incluir cônjuge e filhos.
🦷 Convênio Odontológico Porto Seguro
Proteção odontológica para você e seus dependentes.
💰 Participação nos Lucros e Resultados (PLR)
Reconhecimento pelo seu trabalho e contribuição para o sucesso da empresa.
👶 Auxílio Creche
Suporte financeiro para que pais e mães cuidem dos pequenos com tranquilidade.
🍽️ Vale Alimentação e Refeição Alelo
Garantindo refeições práticas e confortáveis no seu dia a dia.
💻 Auxílio Home Office
Incentivo para que você tenha um espaço de trabalho confortável em casa.
📚 Parcerias com Instituições de Ensino
Educação ao seu alcance, com descontos e incentivos em cursos e graduações.
🚀 Incentivo para Certificações, inclusive em Cloud
Avance sua carreira com certificações nas principais tecnologias como: GCP, Azure, AWS entre outras.
🎁 Pontos Livelo
Acumule pontos e use como preferir, com total liberdade de escolha.
🏋️♂️ TotalPass
Incentivo à saúde com planos de academia com desconto para colaboradores e familiares.
🧘♂️Mindself
Incentivo à melhorar a qualidade de vida através de meditação e o Mindfulness.
Etapas do processo
- Etapa 1: Cadastro
- Etapa 2: Mapeamento Comportamental
- Etapa 3: Avaliação de Perfil
- Etapa 4: Entrevista Gestor
- Etapa 5: Entrevista Cliente
- Etapa 6: Contratação
Vem trabalhar com a gente!
A LEEGA é referência em consultoria e outsourcing para soluções de Data Analytics .
Temos 15 ANOS de mercado e mais de 20 ANOS de experiência em soluções de Business Intelligence, Data Integration e Analytics, atendendo grandes empresas dos mais diversos segmentos do mercado e contamos com mais de 580 colaboradores.
Conquistamos capacidade técnica e reunimos as melhores pessoas para proporcionar aos nossos clientes a melhor experiência.
Brasileiros, com escritório de projetos, fábrica de software e centro de treinamento em São Paulo (capital) , atuação internacional com escritório também em Portugal, somos conhecidos por viver e respirar Analytics e Big Data, inovando nossa tecnologia, compartilhando conhecimento, evoluindo talentos e entregando VALOR.
Em nosso porftólio de serviços ofertamos consultoria especializada, alocação de profissionais, treinamento e desenvolvimento de soluções customizadas para Cloud Computing, Business Intelligence, Big Data, Data Analytics, Machine Learning, Inteligência Artificial, Data Quality, MDM, Governança de Dados e demais soluções de dados
A Leega em outras plataformas