course documentation
Modelli decoder
0. Installazione
1. Modelli Transformer
IntroduzioneNatural Language ProcessingCosa fanno i Transformer?Come funzionano i Transformer?Modelli encoderModelli decoderModelli sequence-to-sequenceBias e limitiRiassuntoQuiz di fine capitolo
2. Usare i 🤗 Transformers
IntroduzioneDietro la pipelineModelliTokenizersGestione di sequenze multipleMettiamo insieme i pezziUso di base completato!
3. Affinamento di un modello pre-addestrato
IntroduzioneProcessare i datiAffinare il modello con la Trainer APIUn addestramento completoAffinamento, Fatto!Quiz di fine capitolo
4. Condividere modelli e tokenizers
L'Hub di Hugging FaceUsare modelli pre-addestratiCondividere modelli pre-addestratiScrivere un cartellino del modelloFine della parte 1!Quiz di fine capitolo
5. La libreria 🤗 Datasets
IntroduzioneE se il mio dataset non è sull'Hub?È arrivato il momento di tagliuzzareBig data? Ci pensa 🤗 Datasets!Creare il proprio datasetRicerca semantica con FAISS🤗 Datasets, check!Quiz di fine capitolo
8. Come chiedere un aiuto
IntroduzioneCosa fare quando si riceve un erroreChiedere aiuto sui forumFare il debug della training pipelineCome scrivere un issue correttamenteParte 2 completata!Quiz di fine capitolo
9. Creare e condividere demo
Modelli decoder
I modelli decoder utilizzano solo il decoder di un modello Transformer. Ad ogni passaggio e per una data parola, gli attention layer hanno accesso solo alle parole che la precedono nella frase. Questi modelli sono spesso detti auto-regressive models.
Il pre-addestramento dei modelli decoder ha spesso a che fare con la previsione della parola successiva in un contesto frasale.
Questi modelli sono particolarmente adatti a compiti di generazione testuale.
Alcuni rappresentanti di questa famiglia includono:
Update on GitHub