course documentation
「解碼器」模型
0. 安裝
1. Transformer 模型
2. 使用 🤗 Transformers
3. 微調一個預訓練模型
4. 分享你的模型和標記器
5. 🤗 Datasets庫
6. 🤗 Tokenizers庫
本章簡介根據已有的 tokenizer 訓練新的 tokenizer快速標記器的特殊能力QA 管道中的快速標記器標準化和預標記化字節對編碼標記化WordPiece 標記化Unigram 標記化逐塊地構建標記器標記器,回顧!章末小測驗
7. 主要的 NLP 任務
8. 如何尋求幫助
9. 構建並分享你的模型
課程活動
「解碼器」模型
「解碼器」模型通常指僅使用解碼器的 Transformer 模型。在每個階段,對於給定的單詞,注意力層只能獲取到句子中位於將要預測單詞前面的單詞。這些模型通常被稱爲自迴歸模型。
「解碼器」模型的預訓練通常圍繞預測句子中的下一個單詞進行。
這些模型最適合於涉及文本生成的任務。
該系列模型的典型代表有:
Update on GitHub