Submission #308

Submission information
Submitted by Anonyme (not verified)
Wed, 04/18/2018 - 17:06
83.202.120.107
No
Industry
Datascientist NLP
Computer Science
Permanent
Mission Etalab - Service du Premier Ministre
https://www.etalab.gouv.fr/
candidatures-etalab.sgmap@modernisation.gouv.fr
Paris
France
Available here :
https://www.fonction-publique.gouv.fr/biep?idOffre=120068&idOrigine=&LCID=1036&offerReference=2018-120068

Intitulé du poste
Data scientist, spécialiste traitement du langage naturel et reconnaissance d'entités nommées (F/H)

Descriptif de l'employeur
La mission Etalab anime et coordonne la transformation de l'action publique fondée sur les données (data sciences, open data, circulation de la donnée) et l'ouverture (open gov et open data).
Elle développe et administre la plateforme data.gouv.fr, est responsable de la diffusion des données de référence, développe des infrastructures de données (base adresse nationale, API entreprise, etc).
Elle accompagne les administrations dans la mise en œuvre de stratégies fondées sur la donnée et dans leur stratégie d'ouverture et de collaboration avec la société civile.
La mission Etalab fait partie de la Direction interministérielle du numérique et du système d'information et de communication de l'État (DINSIC).

Descriptif du poste
Placé.e au sein de l'équipe data sciences de la mission Etalab, le ou la candidat.e sera chargé.e de développer et mettre en œuvre des méthodes de traitement du langage naturel (NLP).
A titre d'exemple, il.elle pourra être amené.e à travailler sur le développement de méthodes de pseudonymisation des décisions de jurisprudence, afin notamment de pouvoir les diffuser en open data conformément à la Loi pour une République numérique.
De façon générale, il.elle sera amené.e à travailler sur les questions d'occultations d'informations couvertes par des secrets.
Il.elle pourra également travailler sur l'extraction d'informations structurées à partir d'éléments textuels ex. décisions de justice.
L'objectif est de renforcer la compétence de la mission Etalab sur le sujet et de développer des outils libres et documentés pouvant être utilisés par les différentes administrations pour une large diffusion de données en open data.

Description du profil recherché
Le ou la candidat.e doit être titulaire d'un doctorat ou d'un diplôme de niveau master en statistiques ou en data sciences ou avoir une expérience spécifique dans ce domaine.
Il.elle doit avoir de solides connaissances en machine learning et une expérience en traitement du langage naturel (NLP) et reconnaissance d'entités nommées (NER).
Il ou elle doit avoir une bonne connaissance en programmation (Python ou R).

• Capacité à travailler en équipe et de manière agile ;
• Compétences en programmation (Python et/ou R) et connaissance des bibliothèques spécialisées dans le traitement du langage naturel (Spacy, NLTK, NeuroNER, etc) ;
• Compétences en traitement du langage naturel et machine learning.
Euro
629-18-DINSIC-Fiche+de+poste+NLP.pdf
Mon, 06/18/2018