Senior
Hybrydowa,
Stacjonarna
Bangalore, Pune
Technologie i narzędzia
Wymagane
AWS
Databricks
AWS Step Functions
AWS Lambda
Python
bash script
SQL
SPARQL
Amazon Redshift
Git
IaC
Będziesz częścią zespołu Unified Data Platform, przyczyniając się do projektowania i ewolucji skalowalnych, natywnych dla chmury rozwiązań danych, które wspierają raportowanie korporacyjne i przypadki użycia oparte na sztucznej inteligencji w całej firmie. Rola ta koncentruje się na nowoczesnych architekturach jezior danych i hurtowni danych, wykorzystujących AWS i Databricks w celu zapewnienia niezawodnych, bezpiecznych i gotowych na przyszłość platform danych zarówno dla danych strukturalnych, jak i nieustrukturyzowanych.
W tej roli będziesz ściśle współpracować z wielofunkcyjnymi zespołami, w tym analitykami biznesowymi, analitykami danych, architektami i programistami, aby zapewnić zgodność platform danych z ewoluującymi potrzebami biznesowymi i najlepszymi praktykami branżowymi. Będziesz uczestniczyć w inicjatywach ciągłego doskonalenia, stosując nowoczesne wzorce inżynierii danych i innowacje w celu zwiększenia możliwości platformy, skalowalności i długoterminowej konserwacji.
Twoje zadania
- Projektowanie, refaktoryzacja i utrzymywanie pipeline'ów danych wielokrotnego użytku w AWS i Databricks w celu wsparcia raportowania korporacyjnego i przypadków użycia sztucznej inteligencji.
- Budowanie i zarządzanie opartymi na chmurze jeziorami danych, hurtowniami danych, przepływami pracy ETL i usługami zaplecza zarówno dla danych strukturalnych, jak i nieustrukturyzowanych.
- Ścisła współpraca z analitykami biznesowymi, naukowcami zajmującymi się danymi, architektami, programistami i interesariuszami w celu przełożenia wymagań na skalowalne rozwiązania w zakresie danych.
- Wdrażanie solidnych praktyk testowania, monitorowania i dokumentowania przy jednoczesnym uczestnictwie w przeglądach kodu w celu zapewnienia niezawodności, bezpieczeństwa i jakości.
- Optymalizacja pipeline'ów danych i obciążeń pod kątem wydajności, efektywności kosztowej, skalowalności i rozwiązywania wąskich gardeł w środowiskach produkcyjnych
Wymagania
- Silne praktyczne doświadczenie w inżynierii danych w chmurze przy użyciu AWS i Databricks.
- Biegłość w projektowaniu i optymalizacji pipeline'ów ETL/ELT dla ustrukturyzowanych i nieustrukturyzowanych zbiorów danych na dużą skalę.
- Solidna znajomość architektury data lake, hurtowni danych i rozproszonego przetwarzania danych.
- Umiejętność efektywnej współpracy z zespołami wielofunkcyjnymi i przekładania wymagań biznesowych na rozwiązania techniczne
- Doświadczenie w zakresie dostrajania wydajności, optymalizacji kosztów, testowania, monitorowania oraz zapewniania bezpieczeństwa i niezawodności danych.
Nr oferty 260220-QP5S4
Sii zapewnia, że wszystkie decyzje związane z zatrudnieniem są podejmowane wyłącznie na podstawie kwalifikacji i kompetencji. Zobowiązujemy się do równego traktowania wszystkich osób, niezależnie od cech chronionych, oraz promowania zróżnicowanego i integracyjnego środowiska pracy.
Zróżnicowane portfolio klientów
Szeroki wachlarz technologii
Kontrakty z globalnymi markami
Great Place to Work w Europie
Wielu ekspertów, od których możesz się uczyć
Otwarty i dostępny zarząd