course documentation
Resumen
0. Setup
1. Modelos de Transformadores
IntroducciónProcesamiento de Lenguaje NaturalTransformadores, ¿qué pueden hacer?¿Cómo funcionan los Transformadores?Modelos de codificadoresModelos de decodificadoresModelos secuencia a secuenciaSesgos y limitacionesResumenQuiz de final de capítulo
2. Usando Transformers 🤗
TokenizadoresManejando Secuencias MúltiplesPoniendo todo junto¡Haz completado el uso básico!Quiz de final de capítulo
3. Ajuste (fine-tuning) de un modelo preentrenado
IntroducciónProcesamiento de los datosAjuste de un modelo con la API TrainerAjuste de un modelo con KerasEntrenamiento completoAjuste de modelos, ¡hecho!Quiz de final de capítulo
5. La librería 🤗 Datasets
Introducción¿Y si mi dataset no está en el Hub?Es momento de subdividir¿Big data? 🤗 ¡Datasets al rescate!Crea tu propio datasetBúsqueda semántica con FAISS🤗 Datasets, ¡listo!Quiz de final de capítulo
6. La librería 🤗 Tokenizers
IntroducciónEntrenar un nuevo tokenizador a partir de uno existenteLos poderes especiales de los Tokenizadores Rápidos (Fast tokenizers)Tokenizadores Rápidos en un Pipeline de Question-AnsweringNormalización y pre-tokenizaciónTokenización por Codificación Byte-PairTokenización WordPieceTokenización UnigramConstruir un tokenizador, bloque por bloqueTokenizadores, listo!Quiz de final de capítulo
8. ¿Cómo solicitar ayuda?
Glosario
Resumen
En este capítulo viste cómo abordar diferentes tareas de PLN usando la función de alto nivel pipeline() de 🤗 Transformers. También viste como buscar modelos en el Hub, así como usar la API de Inferencia para probar los modelos directamente en tu navegador.
Discutimos brevemente el funcionamiento de los Transformadores y hablamos sobre la importancia de la transferencia de aprendizaje y el ajuste. Un aspecto clave es que puedes usar la arquitectura completa o sólo el codificador o decodificador, dependiendo de qué tipo de tarea quieres resolver. La siguiente tabla resume lo anterior:
| Modelo | Ejemplos | Tareas |
|---|---|---|
| Codificador | ALBERT, BERT, DistilBERT, ELECTRA, RoBERTa | Clasificación de oraciones, reconocimiento de entidades nombradas, respuesta extractiva a preguntas |
| Decodificador | CTRL, GPT, GPT-2, Transformer XL | Generación de texto |
| Codificador-decodificador | BART, T5, Marian, mBART | Resumen, traducción, respuesta generativa a preguntas |