JOBS

Join a young and dynamic team !

All the group's offer

Lead Data Scientist Deep Learning NLP H/F

CDI

Colombes

UMANTIC TECHNOLOGIES

Published on 02 Septembre 2024

* Contexte de la mission : Renforcer le Centre de Compétences Data Science de notre client final sur la partie NLP


* Tâches à réaliser :


* Aider le commanditaire à cadrer le projet en étant force de proposition


* Accompagner techniquement des data scientists
* Requêter les bases de données du client
* Recenser et agréger les données de différentes sources
* Analyser et explorer les données
* Modéliser en s'appuyant sur des techniques de Machine Learning, Deep Learning
* Automatiser et optimiser les traitements
* Analyser les résultats produits pour s'assurer de la qualité des livrables
* Produire des data visualisations si nécessaire et en minimisant les actions de maintenance que cela impliquerait par la suite
* Restituer les résultats des travaux à l'écrit mais également à l'oral devant des commanditaires et en équipe, en apportant une plus-value dans l'analyse
* Accompagner les commanditaires dans la prise en main des livrables
* Documenter les travaux réalisés sur les aspects techniques et fonctionnels
* Capitaliser et travailler en équipe dans une démarche de boucle d'amélioration
* Utiliser les données en veillant au respect du RGPD

* Compétences recherchées :
* Obligatoires :
* Capacité à accompagner techniquement des data scientists


* Maîtrise de Python
* Maîtrise des tâches de pré-traitement des données textuelles (parsing, expressions régulières, enrichissement (POS Tagging, dependency parsing), normalisation via lemmatisation ou stemming, correction orthographique)
* Compétences en apprentissage automatique sur des données textuelles via au moins l'un des domaines ci-dessous :


* Maîtrise des fondamentaux du Machine Learning : compréhension des concepts clés, des algorithmes et des méthodes d'évaluation
* Expertise en Deep Learning : connaissance approfondie des architectures de réseaux de neurones, notamment les RNN, LSTM, GRU, et Transformers
* Maîtrise des Frameworks de Deep Learning : expérience avec TensorFlow, PyTorch ou Keras
* Connaissance des techniques « Transfer Learning » : expérience avec des modèles LLMs pré entraînés comme CamemBERT, GPT ou Mistral et leur fine-tuning pour des tâches spécifiques
* Prompt engineering


* Capacité à restituer et communiquer efficacement les résultats des travaux menés en data science
* Appétence à l'innovation et à la veille technologique : capacité à rester à jour avec les dernières avancées en NLP
* Proactivité et dynamisme pour piloter un projet de NLP avec des acteurs de profils variés
* Encadrement d'analystes (délai, accompagnement technique, qualité)
* Expérience sur l'un ou plusieurs de ces cas d'usage :


* Classification multi-class / multi-label
* Analyse de sentiment, opinion mining
* Extraction d'entités nommées
* Segmentation de texte
* Similarité sur les données textuelles
* Génération de texte : expérience d'utilisation de LLMs notamment dans des tâches de résumé automatique, synthèse, chatbot, etc


* GitLab : connaissances de versionning et de partage de code (add, commit, push, pull, etc)
* Gestion de la donnée dans un contexte réglementaire RGPD/AI Act
* MLOps : expérience avec des outils et des pratiques pour automatiser le cycle de vie du ML y compris l'intégration continue, le déploiement continu et la surveillance des modèles
* Intégration et déploiement : capacité à intégrer ou packager des modèles entraînés pour les déployer à grande échelle
* Aisance et rigueur
Niveau de diplôme requis : BAC+5
Experience requise : 5-7 ans

Apply

I'm interested by this offer

Mentions légales

General

  • Company name: Eodesk
  • Address and phone number of head office: Rue Nicéphore Niepce, 15000 AURILLAC - FRANCE - Tél.+33 (0)4 71 43 49 96
  • Registered corporation: RCS PARIS 483 637 039
  • Publication manager: Roland Mor

Website construction and hosting

Intellectual and industrial property

The overall structure along with the software, text, images, information, documents, services and any other element comprising this site are protected under copyright law as per Intellectual Property Code (IPC) or any other regulation concerning intellectual property. Any rendition and/or partial or wholesale reproduction of this website (or of any element within it) via any process, without prior permission from EODesk is forbidden and may be subject to legal action for counterfeiting. Any downloadable documents are also protected by copyright, their use being restricted to the service provided by the publisher via the website www.eodesk.fr. Furthermore, all trademarks and/or logos included in this website are registered trademarks and/or protected concepts belonging exclusively to EODesk. Any reproduction or partial or wholesale representation of these trademarks and/or logos, without prior permission from the publisher is forbidden and may be subject to legal action for counterfeiting.site.

Protection of information

Google Analytics uses cookies. These are small text files placed on your computer to help our website analyze preferences and details concerning your visit. The general data regarding how you use the site (and including your IP address) that are gathered by these cookies is sent and stored by Google to US-based servers. Google will use this information to assess details of your visit, to compile reports for the publisher concerning website activity and to provide other services related to the website's activity and Internet use. Google is liable to share this data with third parties should it be legally obliged to do so or when said third parties, including the publisher of this website, process such data on behalf of Google. Google will not retrieve your IP address with other data withheld by Google. You may disable the use of cookies by selecting the appropriate settings in your browser. However, this could prevent certain features of the website from functioning. By using this website, you explicitly give your consent for your personal data to be processed by Google within the terms of and for the purposes described above.

Data Protection Act

In application of law #78-17 of 6 January 1978 concerning data protection, every internet user who has placed personal information about him/herself on this website is entitled to oppose (article 38 of the law), access (articles 39, 41 and 42) and rectify (article 40) these data. In this way, the user may demand that any data concerning him or her that are incorrect, incomplete, ambivalent, outdated or for which their use, sharing or storing is forbidden, be rectified, complemented, clarified, updated or erased. Any internet user may exercise his or her rights by writing to Eodesk at rue Nicéphore Niépce, 15000 Aurillac, France.