إستكشاف

Ingénieur ML (Inference LLM)

  • الفئات: الهندسة
  • االقطاعات:
  • نوع الوظية:
  • المستوى الدراسي:
  • سنوات الخبرة: Confirmé / Expérimenté
  • وضع في: 12-12-2025 à 14:00:03
الوصف
À propos du rôle : Nous recherchons un Ingénieur ML compétent pour soutenir notre application desktop IA, en se concentrant sur l'inférence de modèles accélérés par CPU/GPU et l'exécution efficace des grands modèles de langage (LLM). Vous travaillerez en étroite collaboration avec l'Ingénieur ML Principal et les équipes backend pour garantir des fonctionnalités IA performantes et évolutives.Responsabilités :Implémenter et optimiser les pipelines d'inférence LLM utilisant l'accélération CPU & GPU. Intégrer efficacement les modèles LLM dans l'application pour une exécution locale ou hybride. Collaborer avec les ingénieurs backend pour assurer une intégration API et runtime fluide. Optimiser l'utilisation mémoire et le calcul pour des charges de travail à haut débit. Surveiller et résoudre les problèmes de performance des workloads GPU. Contribuer à l'évaluation, au benchmarking et au déploiement des modèles IA. Garantir la gestion sécurisée des paramètres de modèle et des clés runtime. Collaborer avec des équipes interfonctionnelles (frontend, backend, DevOps) pour soutenir les fonctionnalités ML. Compétences et expérience requises :Solide expérience en programmation GPU et accélération (CUDA, ROCm ou llama.cpp). Maîtrise de Python pour le développement ML et les workflows d'inférence. Expérience pratique avec vLLM ou frameworks similaires d'inférence LLM. Connaissance des inférences distribuées et batch pour grands modèles. Familiarité avec les techniques d'optimisation LLM (quantification, exécution mémoire-efficace). Compréhension de la gestion sécurisée des données et des clés runtime. Expérience de travail en équipes interfonctionnelles et utilisation de GitHub et Jira. Expérience en profiling, débogage et benchmarking de workloads ML. Ce que nous offrons :Rémunération compétitive et perspectives de carrière. Collaboration avec une équipe produit IA innovante et à fort impact. Master Bac+5 en : Informatique Intelligence Artificielle Data Science Mathématiques appliquées Traitement du signal Systèmes & Réseaux (avec forte spécialisation IA)
معلومات الإتصال
المزيد من عروض العمل