course documentation
Résumé du chapitre
0. Configuration
1. Les transformers
IntroductionTraitement du langage naturelQue peuvent faire les transformers ?Comment fonctionnent les transformers ?Les modèles basés sur l'encodeurLes modèles basés sur le décodeurLes modèles de séquence-à-séquenceBiais et limitationsRésuméQuiz de fin de chapitre
2. Utilisation de 🤗 Transformers
IntroductionDerrière le pipelineModèlesTokenizersManipulation de plusieurs séquencesTout assemblerUtilisation de base terminée !Quiz de fin de chapitre
3. Finetuner un modèle pré-entraîné
IntroductionPréparer les donnéesFinetuner un modèle avec l'API Trainer API ou KerasUn entraînement completFinetuning, coché !Quiz de fin de chapitre
4. Partager des modèles et des tokenizers
Le Hub d'Hugging FaceUtilisation de modèles pré-entraînésPartager des modèles pré-entraînésCréer une carte de modèlePartie 1 terminée !Quiz de fin de chapitre
5. La bibliothèque 🤗 Datasets
IntroductionQue faire si mon jeu de données n'est pas sur le Hub ?Il est temps de trancher et de découperDonnées massives ? 🤗 Datasets à la rescousse !Création de votre propre jeu de donnéesRecherche sémantique avec FAISS🤗 Datasets, coché !Quiz de fin de chapitre
6. La bibliothèque 🤗 Tokenizer
IntroductionEntraîner un nouveau tokenizer à partir d'un ancienLes pouvoirs spéciaux des tokenizers rapidesLes tokenizers rapides dans le pipeline de QANormalisation et prétokénisationLe tokenizer Byte-Pair EncodingLe tokenizer WordPieceLe tokenizer UnigramConstruction d'un tokenizer bloc par bloc🤗 Tokenizers, coché !Quiz de fin de chapitre
7. Les principales tâches en NLP
IntroductionClassification de tokensFinetuner un modèle de langage masquéTraductionRésumé de textesEntraîner un modèle de langage causal à partir de zéroRéponse aux questionsMaîtriser le NLPQuiz de fin de chapitre
8. Comment demander de l'aide
IntroductionQue faire lorsque vous obtenez une erreurDemander de l'aide sur les forumsDébogage du pipeline d'entraînementComment rédiger une bonne issuePartie 2 terminée !Quiz de fin de chapitre
9. Construire et partager des démos
Introduction à GradioConstruire votre première démoComprendre la classe InterfacePartager ses démos avec les autresIntégrations avec le Hub et SpacesFonctionnalités avancées d'InterfaceIntroduction aux Blocks🤗 Gradio, coché !Quiz de fin de chapitre
Evènements liés au cours
Glossaire
Résumé du chapitre
Au cours de ce chapitre, vous avez vu comment approcher différents problèmes de NLP en utilisant la fonction pipeline() de la bibliothèque 🤗 Transformers. Vous avez également vu comment rechercher et utiliser des modèles dans le Hub ainsi que comment utiliser l’API d’inférence pour tester les modèles directement dans votre navigateur.
Nous avons pu aborder le fonctionnement des transformers de façon générale et parler de l’importance de l’apprentissage par transfert et du finetuning. Un point important est que vous pouvez utiliser l’architecture complète ou seulement l’encodeur ou le décodeur, selon le type de tâche que vous souhaitez résoudre. Le tableau suivant résume ceci :
| Modèle | Exemples | Tâches |
|---|---|---|
| Encodeur | ALBERT, BERT, DistilBERT, ELECTRA, RoBERTa | Classification de phrase, reconnaissance d’entités nommées, extraction de question-réponse |
| Décodeur | CTRL, GPT, GPT-2, Transformer XL | Génération de texte |
| Encodeur-décodeur | BART, T5, Marian, mBART | Résumé, traduction, génération de question-réponse |