NLPWorkshop : programme 2023-2024
Cet atelier a pour but, sur une base bi-mensuelle, d’approfondir une technique NLP de manière pratique, en r, en Python ou d’autres solutions. Il est délibérément technique, et il encourage au partage du code.
Cet atelier est une des activités de la plateforme ACSS, il destiné d’abord à l’équipe et à nos étudiants, master et doctorants qu’on encourage à employer ces méthodes dans leurs travaux. Il reste cependant ouvert, par son format hybride, à quiconque souhaite participer. C’est un lieu de partage de savoir-faire où le trick compte plus que le concept ( mais nous aimons les concepts.
Le format de l’atelier est simple:
Une durée d’une heure, les jeudi, de 12h15 à 13h15, tous les 15 jours environ à partir du 14 septembre (voir programme ci-dessous). On tentera de les enregistrer.
L’intervenant et l’animateur sont présents au bureau P421b à Dauphine. On peut y assister à distance, les liens de connexion seront annoncés par le biais d’une mailing liste. S’y Inscrire.
Les sujets portent sur tous les aspects du NLP et des techniques qui le servent. Ils sont traités de manière technique sous forme de tutoriel en direct avec exécution, analyse et discussions des codes. les aspects conceptuels seront secondaires. On garde un esprit d’artisan.
Voici les premières dates pour la saison 2023-2024 (les suggestions sont bienevenues en DM):
- 14 septembre 2023 : Grammaire des données et des graphiques - quarto, dplyr et ggplot - Christophe Benavent / Dauphine-Psl-Acss
- 28 septembre 2023 : Mise en oeuvre du modèle STM pour les données 10 ans de Publicité TV - Bruno Chavez - Dauphine-PSL-Acss)
- 12 octobre 2023 : Personnalité de marque : un modèle seed LDA (Julien Monot - Doctorant Nanterre)
- 26 octobre 2023 : Etudier la transgression avec Rainette - une application à une approche SLR (Sophie Balech - Université de Picardie)
- 9 novembre 2023 : Analyse des réseaux de co-écriture et de co-citations.
- 23 novembre 2023 : Une application créative de GPT4 à la génération et l’évaluation de nouveaux produits (Mehdi Elmoukhliss - Marylink)
- 7 décembre 2023 : Perspectives sur les IA génératives et leur fine-tuning avec Pierre-Carl Langlais (1er Head of research at OpSci), auteur du blog [lebonllm] https://www.lebonllm.fr/auteur/pierre-carl-langlais/)
- 21 décembre 2023 : Analyse NLP de questions ouvertes - le cas “relation sous tension” avec l’Amarc (Christophe Benavent - Paris Dauphine-Psl)
- 11 janvier 2024 :
- 25 janvier 2024 :
- 8 février 2024 :
Certains sujets sont souhaités :
- Metaphor detection
- Retour sur le ZeroShot classification.
- Nlp for abstracts - keyword extraction
- LLM applications
…
En 2022-2023, nous avons eu un certain nombre de séances:
- Jacqueline (Dauphine- Acss) : zero-shot classification
- José Moreno (Dauphine- Acss): implementation of a bert topic model
- Christophe Benavent et Olivier Caron (Dauphine - Acss): Systematic Litterature Review.
- 2023-02-27 Giovanni Visentin (ESCP Paris) - Mining Upper Echelons’ Big Five Personality Traits from Twitter
- 2023-01-23 Patrick Paroubek (LISN/CNRS-Paris-Saclay) - Integrative approach for entities extraction
- 2022-12-11 Christophe Benavent - “Entendre du rap français: an interpretation”
- 2022-11-28 Mihai Calciu (University Lille) - Big Twitter Dataset - COVID-19 A Data-sourcing and ETL Exercice -
- 2022-11-21 Théo Delemazure (PSL Dauphine/Lamsade) From left or right ? playing with GPT3
- 2022-11-14 José Carlos Romero Moreno (PSL - ACSS) - Transformers !
- 2022-11-07 Christophe Benavent (Dauphine) - Playing with embeddings
- 2022-10-24 Mathilde Abel (Université Sorbonne Nouvelle) - More embeddings for forum data analysis
- 2022-10-10 Camille Lacan and Olga Gonsalvez (University of Perpignan) - CNNs to capture a smile