course documentation
Итоги
0. Установка
1. Трансформеры
ВведениеОбработка естественного языкаТрансформеры: на что они способны?Как работают трансформеры?Модели-кодировщикиМодели-декодировщикиМодели "seq2seq"Предвзятости и ограниченияИтогиТест в конце главы
2. Использование 🤗 Transformers
ВведениеЗа конвейеромМоделиТокенизаторыОбработка множественных последовательностейСобираем все воединоБазовое использование завершено!Тест в конце главы
3. Fine-tuning предобученной модели
ВведениеПредобработка данныхFine-tuning модели с использованием Trainer APIПолное обучение моделиFine-tuning, итоги!Тест в конце главы
4. Hugging Face Hub
Hugging Face HubИспользование предобученных моделейПубликация предобученных моделей в общий доступСоздание карточки моделиПервая часть завершена!Тест в конце главы
5. Библиотека 🤗 Datasets
ВведениеЧто делать, если моего датасета на нет на Hub?Препарируем 🤗 DatasetsBig data? 🤗 Datasets спешат на помощь!Семантический поиск с помощью FAISS🤗 Datasets, итоги!Тест в конце главы
6. Бибилиотека 🤗 Tokenizers
ВведениеОбучение нового токенизатора на основе старогоОсобые возможности быстрых токенизаторовБыстрые токенизаторы в QA конвейереНормализация и предварительная токенизацияТокенизация Byte-Pair EncodingТокенизация WordPieceТокенизация UnigramСоздание токенизатора, блок за блокомТокенизаторы, проверка!Тест в конце главы
7. Основные задачи NLP
ВведениеКлассификация токеновДообучение модели маскированного языкового моделированияПереводСуммаризацияОбучение каузальной языковой модели с нуляОтветы на вопросыОсвоение NLPТест в конце главы
8. Как попросить о помощи
ВведениеЧто делать, если возникла ошибкаОбращение за помощью на форумахОтладка обученияОтладка обученияКак написать хорошее сообщение об ошибке (issue)Часть 2 завершена!Тест в конце главы
9. Создание и распространение демо
Введение в GradioСоздание вашего первого демоПонимание класса InterfaceДелимся демонстрациями с другимиИнтеграция с Hugging Face HubРасширенные возможности InterfaceВведение в Gradio BlocksGradio, проверка!Тест в конце главы
События курса
Глоссарий
Итоги
В этой главе вы увидели, как подходить к различным задачам NLP, используя высокоуровневую функцию pipeline() из библиотеки 🤗 Transformers. Вы также увидели, как искать и использовать модели в Hub, а также как использовать Inference API для тестирования моделей прямо в браузере.
Мы обсудили, как трансформеры работают на высоком уровне, и поговорили о важности трансферного обучения и дообучения. Ключевым аспектом является то, что вы можете использовать всю архитектуру или только кодировщик или декодировщик, в зависимости от того, какую задачу вы хотите решить. Следующая таблица резюмирует это:
| Модель | Примеры | Задачи |
|---|---|---|
| Кодировщик | ALBERT, BERT, DistilBERT, ELECTRA, RoBERTa | Классификация предложений, распознавание именованных сущностей, выделительные вопросно-ответные системы |
| Декодировщик | CTRL, GPT, GPT-2, Transformer XL | Генерация текста |
| Кодировщик-декодировщик | BART, T5, Marian, mBART | Автоматическое реферирование, перевод, генеративные вопросно-ответные системы |