Mission IA

Documentation et ressources

Foire aux questions

  • IA : domaine global regroupant l’ensemble des approches pour reproduire ou simuler l’intelligence.

  • Machine Learning : apprentissage supervisé, non supervisé ou par renforcement à partir de données.

  • Deep Learning : sous-catégorie du ML exploitant des réseaux neuronaux profonds, particulièrement adaptée au traitement du langage et de la vision.

L’IA générative désigne une famille de modèles capables de produire de nouvelles données (texte, images, audio, vidéo, code) à partir d’un apprentissage sur des ensembles existants.

L’IA frugale désigne des méthodes et modèles optimisés pour réduire la consommation de ressources (données, énergie, puissance de calcul), tout en maintenant une performance satisfaisante.

Un LLM est un réseau de neurones de grande taille, entraîné sur des corpus massifs de textes, optimisé pour la modélisation du langage naturel. Il peut générer, résumer, traduire ou raisonner sur du texte en exploitant des représentations distribuées (vecteurs numériques).

Un modèle exécuté sur une infrastructure interne (GPU, cluster HPC, serveur universitaire), sans dépendre d’APIs externes. Cela permet :

  • Confidentialité des données sensibles (ex. données médicales, corpus propriétaires).

  • Contrôle sur l’architecture et les hyperparamètres.

  • Interopérabilité avec d’autres outils de recherche.

C’est la phase d’exploitation d’un modèle entraîné pour produire des sorties (génération de texte, classification, extraction d’information).

  • Entraînement complet : apprentissage du modèle depuis zéro sur un vaste corpus (coût computationnel très élevé).

  • Fine-tuning : réentraînement partiel d’un modèle préexistant pour l’adapter à une tâche spécifique.

  • LoRA (Low-Rank Adaptation) : méthode de fine-tuning légère qui insère des matrices de faible rang dans certaines couches du réseau, réduisant drastiquement les besoins en ressources.

Un prompt est l’entrée textuelle donnée au modèle.
L’ingénierie de prompt est l’art de concevoir des formulations optimales pour guider le modèle vers une sortie pertinente, sans modifier ses paramètres internes.

Une hallucination est une sortie incorrecte ou inventée produite par un modèle de langage.
Le modèle génère une réponse qui semble plausible sur le plan linguistique mais qui est factuellement fausse ou inexistante.

  • Sécurité des données : conformité avec les régulations (RGPD, éthique de la recherche).

  • Flexibilité : intégration dans des pipelines spécifiques (NLP, fouille de textes, bibliométrie).

  • Reproductibilité : contrôle total sur la version du modèle, les paramètres et les données d’entrée.

  • Coût computationnel (Serveur/GPU, mémoire, énergie).

  • Opacité des modèles (boîte noire, difficulté d’interprétation).

  • Biais hérités des corpus d’entraînement.

  • Manque de véracité (hallucinations, absence de raisonnement logique formel).

Après une première réponse, il est souvent utile d’affiner votre demande. Indiquez clairement à l’IA ce qui vous convient ou non : cela l’aidera à ajuster sa réponse et à mieux correspondre à vos attentes.

On parle alors d’« hallucination » de l’IA : elle invente des informations en toute bonne foi.
Ne faites jamais confiance aveuglément à ses réponses, surtout sur des sujets sensibles comme la santé, la sécurité ou l’actualité.

Les IA génératives sont alimentées par les informations disponibles en ligne et par celles fournies par les utilisateurs dans leurs requêtes. Toutes ces données, mêmes les plus confidentielles, courent le risque d’être divulguées.

 

  • Respecter les règles de propriété intellectuelle.

  • Soyez conscient des biais possibles dans les réponses générées.

  • Considérez l’IA comme un assistant, pas un auteur.

  • Suivre la charte académique de l’université.

En IA générative, un prompt est une consigne en langage naturel adressée à un modèle pour produire un contenu (texte, image, code, etc.).

Une formulation trop vague ou trop longue peut altérer la cohérence du contenu généré. Il est donc essentiel d’évaluer et de valider soigneusement les informations produites par l’IA.

Certaines pratiques permettent d’améliorer significativement ses prompts (tout en gardant à l’esprit que chaque outil réagit différemment et ne donne pas toujours les mêmes résultats).  Des plateformes comme Compar:IA ou LMArena offrent par exemple la possibilité de comparer, en parallèle, la manière dont plusieurs modèles répondent à une même instruction, ce qui aide à identifier les forces et limites de chacun.

Un prompt efficace s’articule souvent autour de quatre éléments simples : Rôle, Tâche, Format, Contrainte.

  • Rôle : indiquer la posture ou l’expertise que l’IA doit adopter.

    • Exemple : « Tu es un journaliste spécialisé en économie », « Agis comme un coach sportif », « Joue le rôle d’un traducteur professionnel ».

  • Tâche : définir clairement ce que tu attends de l’IA.

    • Exemple : « Rédige un article », « Prépare un plan d’entraînement », « Traduis ce texte en anglais ».

  • Format : préciser la forme attendue du résultat.

    • Exemple : « en 3 parties », « sous forme de tableau », « en 10 bullet points », « résumé en 200 mots ».

  • Contrainte : établir les règles ou limites à respecter.

    • Exemple : « style académique », « vocabulaire simple pour enfants », « pas plus de 100 mots », « sans utiliser de jargon technique ».

Si le résultat obtenu ne correspond pas pleinement aux attentes, on peut dialoguer avec le modèle pour l’ajuster et l’améliorer.

Exemple :
Rôle : Tu es un enseignant‑chercheur en [DISCIPLINE].
Tâche : Élaborer le plan détaillé d’un cours de 3 h sur [THÈME].
Format : Tableau avec colonnes « Séquence», « Objectif (Bloom)», « Contenu», « Méthode pédagogique».
Contraintes :  Chaque séquence ≤ 20 min.  Inclure au moins une activité d’évaluation formative.  Niveau licence 2.
Pour aller plus loin 

Il existe de multiples méthodes pour adapter les prompts en fonction de l’usage et l’objectif :

Méthode
Description
Exemple
Zero-shot (Ponctuel)
La forme la plus basique, simple prompt demandant une réponse au LLM basée uniquement sur ses données d’entraînement.
« Écrire un article sur l’IA générative »
Few-shot (Exemples)
Guider le LLM en fournissant un ou plusieurs exemples sur lesquels il peut s’appuyer pour générer sa réponse.
« Voici quelques exemples d’activités pédagogiques en [domaine] :
– [Exemple 1 : Sujet / Activité]
– [Exemple 2 : Sujet / Activité]
Maintenant, propose 10 nouvelles activités pédagogiques sur ce modèle »
Chain-of-thought (Chaîne de pensée)
Indiquer au LLM comment décomposer un problème en une série d’étapes.
« Pour résoudre ce problème, d’abord multiplie ces nombres, puis […], ensuite […] »
Self-refine (Affinage)
Critiquer la réponse initiale du LLM et à lui demander de l’améliorer.
« Reprendre ta réponse et améliorer [sujet]. Ajouter des éléments factuels à partir du fichier joint. »
Least-to-most (Simple à complexe)
Prompts simples à plus complexe. Cela aide le modèle à comprendre la tâche de manière plus détaillée et nuancée.
« Expliquer ce qu’est le [sujet]. Ensuite, décrire comment [sous-sujet] va impacter [sous-sujet] »
Expert Role-Playing (Jeu de rôle)
Faire se comporter l’IA comme un expert dans un domaine spécifique.
« Vous êtes [rôle] expérimenté. Rédigez un article de 1000 mots sur [sujet] en utilisant les meilleures pratiques actuelles »
Ressources complémentaires