Poste de Post‐Doctorat

Selection de caractéristiques pour l’analyse de données en contexte

Le laboratoire L3i, EA 2118, dans le cadre du projet Tourinflux, lance
un appel à candidatures pour un poste de post-doctorant en informatique
dans le domaine de l’analyse d’évènement touristiques
spatio-temporelles.

*Durée :* 12 mois (une extension de 12 mois est envisageable)

*Date d’embauche :* 1er novembre 2013

*Salaire :* 2100 € net / mois

*Lieu de travail :* dans les locaux du L3i à La Rochelle

*Spécialité :* Informatique

*Mots-clés :* Analyse de données, Evènements spatiaux temporels,
inférence, Modélisation d’occurrence temporelle, Semantic Web,
Ingénierie des connaissances, Logiques de Description, E-tourisme,
Normalisation (TimeML, TourInFrance)

Description du projet et du poste :

Les travaux menés par le candidat se dérouleront au sein du L3i et
s’inscriront dans le projet Tourinflux. Le laboratoire L3i, EA 2118 créé
en 1993, représente la seule et unique composante de recherche du
domaine STIC sur l’Université de la Rochelle associant très efficacement
les chercheurs de l’IUT de la Rochelle, et du Pôle Sciences en
informatique. Dans le cadre de la politique quadriennale (désormais
quinquennale) de l’université de la Rochelle, le L3i vient d’être évalué
A par l’AERES.

Le laboratoire Informatique, Image et Interaction a choisi d’axer son
projet de laboratoire autour de deux thèmes (Axes Thématiques) que sont
« Image, Document et Données Complexes » et « Systèmes Interactifs et
Images », véritables cœurs de métier du laboratoire. Par ailleurs, le
laboratoire propose de mettre en avant ASPIC (Axe Stratégique Pertinence
Intraction/Contenus), vecteur de visibilité de son action scientifique
au sein de projets structurants et en articulation avec le monde
socio-économique. Ainsi, plus d’une dizaine de projets sont actuellement
menés autour de l’analyse de documents et de données complexes d’une
part (en lien avec le centre européen de valorisation des contenus
numériques – Valconum), et autour de l’interaction appliquée aux jeux
vidéos et l’e-Education d’autre part.

De part ses activités de ces six dernières années, le L3i a développé
des outils et des compétences dans l’analyse de données récurrentes dans
le temps et l’espace, mais également l’analyse de contenus et de données
complexes et hétérogènes.

Le projet Tourinflux, sélectionnée dans le cadre de l’appel à projets
Big Data du Fonds National pour la Société Numérique et financé dans le
programme d’investissements d’avenir, rassemble deux entreprises, une
association d’entreprises et le laboratoire L3i, et sera réalisé en
partenariat avec plusieurs acteurs du tourisme de France. Ce projet vise
à apporter aux acteurs du tourisme (d’abord les institutionnels mais
aussi les acteurs privés) un ensemble d’outils leur permettant de gérer
à la fois leurs données internes et les informations disponibles sur le
web afin de mieux comprendre comment un territoire est perçu et de mieux
agir sur cette perception.

Les outils actuellement à disposition des institutionnels du tourisme
sont insuffisants pour répondre à ce besoin du fait des problèmes de
collecte, d’analyse, de manipulation et d’échange d’informations
réalisés de manière beaucoup trop artisanale.
L’objectif de Tourinflux est de proposer un tableau de bord complet
permettant aux institutionnels du tourisme, quelle que soit leur taille,
de visualiser et interpréter l’information disponible par rapport à leur
territoire (aux niveaux micro et macro) afin de prendre les décisions
les plus efficaces.

Plus spécifiquement, le candidat retenu travaillera sur l’analyse
d’objets touristiques (hôtels, festivals, etc) afin de déterminer des
caractéristiques minimales de ces objets pour des profils
d’utilisateurs. L’objectif de ce travail sera de mettre un place une
stratégie de *recherche d’information* adaptée aux besoins des
*professionnels du tourisme*. L’efficacité d’une telle approche repose
sur une *structuration sémantique*de l’ *information touristique* :

1) Structuration sémantique et semi-automatique de l’information
touristique.

Les informations touristiques sont des informations à la fois
hétérogènes (textes libres, pages web, photos, …) et
semi-structurées. La structuration de l’information est un défi
majeur à l’heure où la masse d’information non structurée est en
évolution constante, que ce soit sur le web où dans les
organisations. Les processus classiques de structuration de
l’information sont des processus manuels ou semi-automatique,
fortement dépendant du domaine et de sa sémantique.

Le premier objectif de ce travail sera de mettre en place un
processus semi-automatique de structuration de l’information
touristique. Deux verrous scientifiques ont été identifiés :

- Adapter les techniques de traitement automatique de la langue au
vocabulaire spécifique de l’information touristique pour extraire
les termes caractéristiques du domaine

- Modéliser la sémantique du domaine qui s'organise naturellement
sous une forme hiérarchique (thesaurus ou ontologie)



2) Recherche d’information adaptée aux besoins des professionnels du
tourisme

Dans un processus classique de recherche d'information par requête,
l'utilisateur peut affiner sa recherche en modifiant sa requête
initiale. D'autres stratégies proposent à l'utilisateur une
recherche d’information par navigation dans une structuration a
priori des données (arborescence de fichiers, liens html, ….). Il
existe des mécanismes de recherche d'information dit « par facettes
», à la fois par requête et par navigation, permettant à
l'utilisateur d'exprimer une requête, puis de l'affiner par
navigation. De tels mécanismes favorisent le raffinement des
requêtes, et nous semblent particulièrement adaptés aux
professionnels du tourisme pour une recherche rapide et efficace.

Le second objectif de ce travail sera double :

- Déterminer les caractéristiques minimales de chaque objet
touristique pour un accès plus rapide à l’information. Deux
approches sont envisageables : une approche statistique, et une
approche logique.

- Mettre en place un prototype de recherche d’information par
facettes adaptée aux besoins des professionnels du tourisme.

Qualifications

Les candidats au poste devront être titulaires d’un doctorat en
informatique, avec des compétences en représentation des connaissances
et fouille de données. Une expérience de recherche dans au moins deux
des quatre domaines suivants est également demandée :

- Traitement Automatique des Langues, Fouille de texte

- Connaissances en BigData et entrepôts de données (Hadoop, autre)

- Modélisation, Ontologie et moteur d’inférence

- Annotation et évaluation

- Ecriture de grammaires d’extraction**

- Maitriser un ou plusieurs langages de programmation (Python, C/C++,
java, ...)

Postuler

Les candidats au poste devront envoyer un CV, un énoncé des intérêts de
recherche, et les noms et coordonnées d’au moins trois références
(adresses mail comprises) à : mickael.coustaty [ chez ] univ-lr.fr ;
jean-marc.ogier [ chez ] univ-lr.fr