Senior ML Engineer (Multimodal speech ve LLM Sistemleri)

Senior ML Engineer (Multimodal speech ve LLM Sistemleri)

Uzaktan | Tam Zamanlı | Yüksek Başarımlı Hesaplama (HPC)

Biz Kimiz?

Bankacılık, Sigortacılık ve Sağlık gibi dünyanın veri hassasiyeti en yüksek sektörleri için "ses öncelikli" (voice-first) yapay zeka uygulamaları geliştiriyoruz. Veri gizliliğinin her şeyden önemli olduğu bir çağda; güvenlik veya hızdan ödün vermeyen, yüksek performanslı ve yerel olarak barındırılan (locally-hosted) yapay zeka sistemleri oluşturma konusunda uzmanlaşıyoruz.

Rol Hakkında

Performans ve hassasiyet konusunda tutkulu bir Kıdemli ML Mühendisi arıyoruz. Özellikle Konuşma (STT/TTS) ve Büyük Dil Modellerinin (LLM) kesişim noktasına odaklanarak, multimodal modellerimizin tüm yaşam döngüsünü yöneteceksiniz. Bu rol, sadece OpenAI API'lerini çağıranlara göre değil; binlerce saatlik ses verisi için veri boru hatları (data pipelines) tasarlayabilen, en yeni NVIDIA GPU'larda model ince ayarı (fine-tuning) yapabilen ve çıkarım (inference) süreçlerini milisaniye düzeyinde optimize edebilen mühendisler içindir.

Temel Sorumluluklar

Konuşma ve Multimodal Pipeline: STT (Konuşmadan Metne) ve TTS (Metinden Konuşmaya) mimarileri için sağlam ön eğitim (pre-training) ve ince ayar (fine-tuning) pipelineları inşa etmek ve sürdürmek.
LLM Finetune: SFT, LoRA ve QLoRA yöntemlerini kullanarak finans ve tıp alanındaki uzmanlık bilgileri için LLM'lerin finetune süreçlerine liderlik etmek.
Ses İçin Büyük Veri: Devasa multimodal veri setlerini (ses + metin) işlemek, temizlemek ve zenginleştirmek için veri boru hatları mimarisi oluşturmak ve ölçeklendirmek.
Yerel İnference: Müşterilerimiz için %100 veri egemenliği sağlayarak; modelleri vLLM veya TensorRT-LLM kullanarak yerel olarak dağıtmak ve sunmak.
Donanım Optimizasyonu: Blackwell ve Hopper kümelerimizden tam kapasiteyle yararlanmak. VRAM gereksinimlerini hesaplamak, KV önbellek (cache) optimizasyonu yapmak ve çeşitli kuantizasyon seviyelerinde (FP8, INT8, AWQ) saniye başına token (tokens/second) miktarını maksimize etmekten sorumlu olacaksınız.
Reliablity: Yüksek derecede regüle edilen ortamlarda model doğruluğunu ve güvenliğini sağlamak için değerlendirme çerçeveleri (evaluation frameworks) oluşturmak.

Gerekli Teknik Nitelikler

Deneyim: ML Mühendisliği alanında, özellikle NLP ve Konuşma (Speech) odaklı 3+ yıl deneyim.
Ses Uzmanlığı: Ses sinyal işleme ve güncel mimariler (örneğin Whisper, Wav2Vec veya Transformer/difüzyon tabanlı TTS) konusunda derin deneyim.
GPU Tecrübesi: NVIDIA GPU mimarisi hakkında uzman düzeyinde bilgi. Bir modeli profillemeyi ve farklı batch boyutları ile bağlam pencereleri (context windows) için VRAM yükünü hesaplamayı bilmelisiniz.
Hosting (Serving): Modelleri vLLM veya benzeri yüksek veri akışlı çıkarım motorlarıyla yerel olarak çalıştırma konusunda kapsamlı deneyim.
Ölçeklenebilir Eğitim: Multi-node GPU kümelerinde (H100/H200) uzun süreli eğitim işlerini yönetme becerisi.
Veri Mühendisliği: Python yetkinliği ve büyük ölçekli ses veri setlerini işlemek için deneyim.
Güvenlik Odaklı Yaklaşım: Y apay zekayı "air-gapped" (fiziksel olarak izole edilmiş) veya yüksek güvenlikli özel bulut ortamlarında konuşlandırmanın inceliklerine hakimiyet.

Tercih Edilen Nitelikler

Unsloth veya benzeri LLM ince ayar kütüphanelerinde deneyim.
Yerelleştirilmiş RAG sistemleri için vektör veritabanları (Qdrant, Milvus) hakkında bilgi.
Regüle edilen sektörlerde (FinTek, Sağlık Teknolojileri veya Kamu Teknolojileri) geçmiş deneyim.

Ne Sunuyoruz?

Önce Uzaktan (Remote-First) Kültür: En verimli olduğunuz yerden çalışın.
Hesaplama Gücü: Eğitim ve çıkarım görevleriniz için NVIDIA Blackwell ve Hopper serisi GPU'lara doğrudan erişim.
Etki: Toplumun en hassas sektörlerinde kullanıcı gizliliğini koruyan yapay zekalar inşa edin.

Similar jobs