course documentation
จบพาร์ทที่ 1!
0. ติดตั้งโปรแกรม
1. โมเดล Transformer
บทนำการประมวลผลภาษาธรรมชาติTransformers ชื่อนี้มีดียังไง?Transformers ทำงานยังไง?โมเดล Encoderโมเดล Decoderโมเดล sequence-to-sequenceข้อจำกัดจากอคติของข้อมูลสรุปคำถามท้ายบท
2. การใช้งาน 🤗 Transformers
บทนำเบื้องหลังของ pipelineโมเดลTokenizersการจัดการกับหลายๆประโยค(multiple sequences)ประกอบทุกอย่างเข้าด้วยกันการใช้งานเบื้องต้นสำเร็จแล้ว!แบบทดสอบท้ายบท
3. การ fine-tune โมเดลที่ผ่านการเทรนมาแล้ว (pretrained model)
บทนำการประมวลผลข้อมูลการ Fine-tune โมเดลด้วย Trainer API หรือ Kerasการเทรนโมเดลฉบับสมบูรณ์Fine-tune โมเดลสำเร็จแล้ว!คำถามท้ายบท
4. การแบ่งปันโมเดลและ tokenizers
The Hugging Face Hubการใช้งานโมเดลที่ผ่านการเทรนมาแล้ว (pretrained models)การแบ่งปันโมเดลที่ผ่านการเทรนมาแล้ว (pretrained models)การสร้างการ์ดโมเดล (model card)จบพาร์ทที่ 1!คำถามท้ายบท
6. ตัวตัดคำจาก 🤗 Tokenizers library
บทนำการเทรน tokenizer จาก tokenizer ที่มีอยู่แล้วความสามารถพิเศษของตัวตัดคำแบบเร็ว (fast tokenizers)การใช้งานตัวตัดคำแบบเร็ว (Fast tokenizers) ใน QA pipelineNormalization และ pre-tokenizationByte-Pair Encoding tokenizationWordPiece tokenizationUnigram tokenizationการสร้าง tokenizer ทีละขั้นตอนเรียนจบเรื่อง tokenizer แล้ว!คำถามท้ายบท
จบพาร์ทที่ 1!
นี่คือจุดจบของพาร์ทแรกในคอร์สนี้! พาร์ทที่ 2 จะถูกปล่อยในวันที่ 15 พฤศจิกายน พร้อมกับงานอีเว้นท์ชุมชนใหญ่ ดูรายละเอียดเพิ่มเติม ที่นี่
ตอนนี้คุณควรจะสามารถทำ fine-tune โมเดลที่ผ่านการเทรนมาแล้ว (pretrained model) กับปัญหาการจำแนกประเภทตัวหนังสือ (text classification) (แบบประโยคเดี่ยวหรือคู่ประโยค) และอัพโหลดผลลัพธ์ขึ้นสู่ Model Hub ได้ เพื่อที่จะทำให้มั่นใจว่าคุณเชี่ยวชาญส่วนแรกนี้แล้วจริงๆ คุณควรจะฝึกทำแบบนี้เป๊ะๆกับปัญหาที่คุณสนใจ (และไม่จำเป็นจะต้องเป็นภาษาอังกฤษถ้าคุณพูดภาษาอื่น)! คุณสามารถหาความช่วยเหลือได้ใน Hugging Face forums และแบ่งปันโปรเจคของคุณได้ใน หัวข้อนี้ เมื่อคุณทำเสร็จ
เรารอไม่ไหวแล้วที่จะได้เห็นว่าคุณจะสร้างอะไรได้บ้างจากความรู้นี้!
Update on GitHub