100% remoto

Engenheiro(a) de Dados Pleno | Python, PySpark, Kafka e Dados em Tempo Real

LBPAY Instituição de Pagamentos • Brazil • Tecnologia

A combinar PJ • Pleno

Descrição da vaga

No entretenimento digital, segundos importam. Pagamentos que travam custam caro.

A LBPay nasceu para eliminar esse problema. Como Instituição de Pagamento autorizada pelo Banco Central, atuamos em ambientes de alta exigência como iGaming, e-commerce e operações de alta frequência — onde estabilidade, velocidade e confiabilidade são inegociáveis.

Sobre a posição

Buscamos uma pessoa Engenheira de Dados Pleno para atuar na construção e evolução da nossa plataforma de dados, desenvolvendo pipelines escaláveis e garantindo a disponibilidade de informações críticas para o negócio.

Você trabalhará com grandes volumes de dados transacionais, contribuindo para a qualidade, confiabilidade e performance das soluções que apoiam áreas estratégicas da empresa. Procuramos alguém com perfil hands-on, senso de ownership e interesse em atuar em um ambiente dinâmico, com desafios reais de engenharia de dados e alto impacto no negócio.

  • Desenvolver e manter pipelines de dados utilizando Python, PySpark e SQL.
  • Construir e evoluir fluxos de ingestão de dados baseados em eventos e streaming.
  • Implementar transformações, deduplicação e tratamento de dados nas camadas Bronze, Silver e Gold.
  • Garantir a qualidade, integridade e confiabilidade dos dados processados.
  • Criar e otimizar tabelas e visões analíticas para consumo por dashboards e aplicações de negócio.
  • Trabalhar com armazenamento em Parquet e ambientes S3-compatible.
  • Participar da evolução de schemas e contratos de dados entre sistemas produtores e consumidores.
  • Desenvolver testes automatizados e mecanismos de validação para proteção de indicadores financeiros.
  • Monitorar pipelines e investigar inconsistências ou discrepâncias de dados.
  • Apoiar implantações e operação de soluções em Docker e Kubernetes.
  • Colaborar com times de Produto, Compliance, Tesouraria e Tecnologia na construção de soluções orientadas a dados.

Requisitos

  • Experiência prática atuando como Engenheiro(a) de Dados ou em funções equivalentes.
  • Domínio de Python aplicado à engenharia de dados.
  • Conhecimento sólido de SQL avançado.
  • Experiência com Apache Spark / PySpark para processamento e transformação de dados.
  • Vivência com arquiteturas de dados em camadas (Bronze, Silver e Gold).
  • Experiência trabalhando com arquivos Parquet e armazenamento em nuvem ou object storage.
  • Conhecimento de Docker e noções práticas de Kubernetes.
  • Experiência com testes automatizados, versionamento Git e boas práticas de desenvolvimento.
  • Experiência com mensageria e streaming de dados, especialmente Kafka ou tecnologias similares.

Diferenciais

  • Experiência com Apache Pulsar.
  • Conhecimento de DuckDB e PostgreSQL para workloads analíticos.
  • Conhecimento sobre PIX, Open Finance, SPI, MED ou regulamentações do BACEN.
  • Experiência com observabilidade utilizando Prometheus, Datadog, Grafana ou Metabase.
  • Conhecimento em GitOps, ArgoCD, Helm ou Kustomize.
  • Experiência com Protobuf e arquiteturas orientadas a eventos.

Detalhes da vaga:

Modalidade: Remoto

Contratação: PJ

Benefícios

TotalPass – sua saúde física é importante!

Day off de aniversário