JOBS

Rejoignez une équipe jeune et dynamique

Toutes les offres du groupe

Lead Data Scientist Deep Learning NLP H/F

CDI

Colombes

UMANTIC TECHNOLOGIES

Publiée le 02 Septembre 2024

* Contexte de la mission : Renforcer le Centre de Compétences Data Science de notre client final sur la partie NLP


* Tâches à réaliser :


* Aider le commanditaire à cadrer le projet en étant force de proposition


* Accompagner techniquement des data scientists
* Requêter les bases de données du client
* Recenser et agréger les données de différentes sources
* Analyser et explorer les données
* Modéliser en s'appuyant sur des techniques de Machine Learning, Deep Learning
* Automatiser et optimiser les traitements
* Analyser les résultats produits pour s'assurer de la qualité des livrables
* Produire des data visualisations si nécessaire et en minimisant les actions de maintenance que cela impliquerait par la suite
* Restituer les résultats des travaux à l'écrit mais également à l'oral devant des commanditaires et en équipe, en apportant une plus-value dans l'analyse
* Accompagner les commanditaires dans la prise en main des livrables
* Documenter les travaux réalisés sur les aspects techniques et fonctionnels
* Capitaliser et travailler en équipe dans une démarche de boucle d'amélioration
* Utiliser les données en veillant au respect du RGPD

* Compétences recherchées :
* Obligatoires :
* Capacité à accompagner techniquement des data scientists


* Maîtrise de Python
* Maîtrise des tâches de pré-traitement des données textuelles (parsing, expressions régulières, enrichissement (POS Tagging, dependency parsing), normalisation via lemmatisation ou stemming, correction orthographique)
* Compétences en apprentissage automatique sur des données textuelles via au moins l'un des domaines ci-dessous :


* Maîtrise des fondamentaux du Machine Learning : compréhension des concepts clés, des algorithmes et des méthodes d'évaluation
* Expertise en Deep Learning : connaissance approfondie des architectures de réseaux de neurones, notamment les RNN, LSTM, GRU, et Transformers
* Maîtrise des Frameworks de Deep Learning : expérience avec TensorFlow, PyTorch ou Keras
* Connaissance des techniques « Transfer Learning » : expérience avec des modèles LLMs pré entraînés comme CamemBERT, GPT ou Mistral et leur fine-tuning pour des tâches spécifiques
* Prompt engineering


* Capacité à restituer et communiquer efficacement les résultats des travaux menés en data science
* Appétence à l'innovation et à la veille technologique : capacité à rester à jour avec les dernières avancées en NLP
* Proactivité et dynamisme pour piloter un projet de NLP avec des acteurs de profils variés
* Encadrement d'analystes (délai, accompagnement technique, qualité)
* Expérience sur l'un ou plusieurs de ces cas d'usage :


* Classification multi-class / multi-label
* Analyse de sentiment, opinion mining
* Extraction d'entités nommées
* Segmentation de texte
* Similarité sur les données textuelles
* Génération de texte : expérience d'utilisation de LLMs notamment dans des tâches de résumé automatique, synthèse, chatbot, etc


* GitLab : connaissances de versionning et de partage de code (add, commit, push, pull, etc)
* Gestion de la donnée dans un contexte réglementaire RGPD/AI Act
* MLOps : expérience avec des outils et des pratiques pour automatiser le cycle de vie du ML y compris l'intégration continue, le déploiement continu et la surveillance des modèles
* Intégration et déploiement : capacité à intégrer ou packager des modèles entraînés pour les déployer à grande échelle
* Aisance et rigueur
Niveau de diplôme requis : BAC+5
Experience requise : 5-7 ans

Postuler

Cette offre m'intérresse

Mentions légales

Informations générales

  • Dénomination ou raison sociale : Eodesk
  • Adresse et numéro de téléphone du siège social : Rue Nicéphore Niepce, 15000 AURILLAC - FRANCE - Tél.+33 (0)4 71 43 49 96
  • Inscription RCS ou chambre des métiers : RCS PARIS 483 637 039
  • Directeur de la publication : Roland Mor

Hébergement et réalisation du site

Droits de propriété intellectuelle et industrielle

La structure générale, ainsi que les logiciels, textes, images, informations, documents, services et tout autre élément composant ce site sont protégés notamment au titre du droit d'auteur par les dispositions du Code de la Propriété Intellectuelle ou toute autre réglementation relative à la propriété intellectuelle. Toute représentation et/ou reproduction totale ou partielle de ce site (ou de l'un quelconque des éléments qui le composent) par quelque procédé que ce soit, sans l'autorisation expresse préalable de EODesk est interdite et peut constituer un acte de contrefaçon pénalement sanctionné.Tous documents téléchargeables sont également protégés par le droit d'auteur, leur utilisation est limitée à la seule prestation de service assurée par l'éditeur via le site www.eodesk.fr Egalement, les marques et/ou logos figurant sur ce site sont des marques déposées et/ou des créations protégées, propriété exclusive de EODesk.Toute reproduction ou représentation totale ou partielle de ces marques et/ou de ces logos, sans l'autorisation expresse préalable de l'éditeur est interdite et peut constituer un acte de contrefaçon pénalement sanctionné.

Protection des informations

Google Analytics utilise des cookies, qui sont des fichiers texte placés sur votre ordinateur, pour aider le site internet à analyser l'utilisation du site par ses utilisateurs.Les données générées par les cookies concernant votre utilisation du site (y compris votre adresse IP) seront transmises et stockées par Google sur des serveurs situés aux Etats-Unis.Google utilisera cette information dans le but d'évaluer votre utilisation du site, de compiler des rapports sur l'activité du site à destination de son éditeur et de fournir d'autres services relatifs à l'activité du site et à l'utilisation d'Internet.Google est susceptible de communiquer ces données à des tiers en cas d'obligation légale ou lorsque ces tiers traitent ces données pour le compte de Google, y compris notamment l'éditeur de ce site.Google ne recoupera pas votre adresse IP avec toute autre donnée détenue par Google.Vous pouvez désactiver l'utilisation de cookies en sélectionnant les paramètres appropriés de votre navigateur. Cependant, une telle désactivation pourrait empêcher l'utilisation de certaines fonctionnalités de ce site.En utilisant ce site internet, vous consentez expressément au traitement de vos données nominatives par Google dans les conditions et pour les finalités décrites ci-dessus.

Informatique et liberté | Données Personnelles

L’utilisateur est informé que les informations qu’il communique par les formulaires présents sur le site d’eodesk groupe QUODAGIS sont nécessaires pour répondre à sa demande et sont destinées aux services en charge de répondre à sa demande à des fins de suivi de cette demande. Les informations recueillies font également l’objet d’un traitement destiné à communiquer sur des évènements, des offres promotionnelles, des actualités ou tout autre document de communication. Vos données ne sont pas partagées avec des tiers.
Conformément aux articles 38, 39, 40, 41 et 42 de la loi Informatique et liberté du 6 janvier 1978, chaque utilisateur ayant déposé des informations nominatives le concernant sur le site, dispose des droits d'opposition, d'accès et de rectification de ces données. Ainsi, il peut exiger que soient rectifiées, complétées, clarifiées, mises à jour ou effacées les informations le concernant qui sont inexactes, incomplètes, équivoques, périmées, ou dont la collecte ou l'utilisation, la communication ou la conservation est interdite. Chaque utilisateur peut exercer ses droits en écrivant à eodesk groupe QUODAGIS, Rue Nicéphore Niepce, 15000 AURILLAC - FRANCE.