course documentation
အခန်းပြီးဆုံးခြင်း စစ်ဆေးမှု
0. စတင်ပြင်ဆင်ခြင်း
1. Transformer models များ
နိဒါန်းNatural Language Processing နှင့် Large Language Models များTransformers တွေက ဘာတွေလုပ်နိုင်လဲ။Transformers တွေက ဘယ်လိုအလုပ်လုပ်လဲ။🤗 Transformers တွေက လုပ်ငန်းတာဝန်တွေကို ဘယ်လိုဖြေရှင်းပေးလဲ။Transformer Architectures များအမြန်ဉာဏ်စမ်းLLMs များဖြင့် မှန်းဆတွက်ချက်ခြင်း။ဘက်လိုက်မှုနှင့် ကန့်သတ်ချက်များအနှစ်ချုပ်အသိအမှတ်ပြု စာမေးပွဲ
2. 🤗 Transformers ကို အသုံးပြုခြင်း
နိဒါန်းPipeline နောက်ကွယ်မှ အကြောင်းအရာများModelsTokenizersSequence များစွာကို ကိုင်တွယ်ခြင်းအားလုံးကို ပေါင်းစပ်ခြင်းအခြေခံ အသုံးပြုမှု ပြီးဆုံးပါပြီ!Optimization လုပ်ထားသော Inference Deploymentအခန်းပြီးဆုံးခြင်း စစ်ဆေးမှု
3. Pretrained Model တစ်ခုကို Fine-tuning လုပ်ခြင်း
နိဒါန်းဒေတာများကို စီမံဆောင်ရွက်ခြင်းTrainer API ဖြင့် မော်ဒယ်တစ်ခုကို Fine-tuning လုပ်ခြင်းပြည့်စုံသော Training Loop တစ်ခုLearning Curves များကို နားလည်ခြင်းFine-tuning လုပ်ငန်း ပြီးစီးပြီ!အခန်းပြီးဆုံးခြင်း အသိအမှတ်ပြု လက်မှတ်
4. Models နှင့် Tokenizers များကို မျှဝေခြင်း
Hugging Face HubPretrained Models များကို အသုံးပြုခြင်းPretrained Models များကို မျှဝေခြင်းModel Card တစ်ခု တည်ဆောက်ခြင်းအပိုင်း ၁ ပြီးဆုံးပါပြီ!အခန်း (၄) ဆိုင်ရာ မေးခွန်းများ
5. The 🤗 Datasets library
နိဒါန်းကျွန်ုပ်၏ Dataset သည် Hub တွင် မရှိလျှင် ဘာလုပ်ရမလဲ။Slice and Dice လုပ်ဖို့ အချိန်တန်ပြီ။Big Data လား။ 🤗 Datasets က ကူညီပါလိမ့်မယ်။ကိုယ်ပိုင် Dataset တစ်ခု ဖန်တီးခြင်းFAISS ဖြင့် Semantic Search ပြုလုပ်ခြင်း🤗 Datasets၊ အဆင်သင့်ဖြစ်ပါပြီ!အခန်း (၅) ဆိုင်ရာ မေးခွန်းများ
6. The 🤗 Tokenizers library
နိဒါန်းOld Tokenizer တစ်ခုမှ New Tokenizer တစ်ခုကို Training လုပ်ခြင်းFast Tokenizers များ၏ ထူးခြားသော စွမ်းအားများQA Pipeline ရှိ Fast Tokenizers များNormalization နှင့် Pre-tokenizationByte-Pair Encoding TokenizationWordPiece TokenizationUnigram TokenizationTokenizer တစ်ခုကို Block အလိုက် တည်ဆောက်ခြင်းTokenizers၊ အဆင်သင့်ဖြစ်ပါပြီ!အခန်း (၆) ဆိုင်ရာ မေးခွန်းများ
7. Classical NLP Tasks များ
နိဒါန်းToken ClassificationMasked Language Model တစ်ခုကို Fine-tuning လုပ်ခြင်းဘာသာပြန်ခြင်းအနှစ်ချုပ်ဖော်ပြခြင်းCausal Language Model တစ်ခုကို အစကနေ Train လုပ်ခြင်းမေးခွန်းဖြေဆိုခြင်းLLM များကို ကျွမ်းကျင်ခြင်းအခန်း (၇) ဆိုင်ရာ မေးခွန်းများ
8. အကူအညီတောင်းခံနည်း
နိဒါန်းError တစ်ခုကြုံတွေ့ရတဲ့အခါ ဘာလုပ်ရမလဲForums များတွင် အကူအညီတောင်းခံခြင်းTraining Pipeline ကို Debugging လုပ်ခြင်းကောင်းမွန်သော Issue တစ်ခု ရေးသားနည်းအပိုင်း ၂ ပြီးဆုံးပါပြီ!အခန်း (၈) ဆိုင်ရာ မေးခွန်းများ
9. Demos များ တည်ဆောက်ခြင်းနှင့် မျှဝေခြင်း
Gradio နိဒါန်းသင့်ရဲ့ ပထမဆုံး Demo ကို တည်ဆောက်ခြင်းInterface Class ကို နားလည်ခြင်းDemos များကို တခြားသူများနှင့် မျှဝေခြင်းHugging Face Hub နှင့် ပေါင်းစပ်မှုများAdvanced Interface Features များBlocks နိဒါန်းGradio၊ အဆင်သင့်ဖြစ်ပါပြီ!အခန်း (၉) ဆိုင်ရာ မေးခွန်းများ
10. အရည်အသွေးမြင့် Datasets များကို စုစည်းခြင်း
Argilla နိဒါန်းသင့် Argilla Instance ကို တည်ဆောက်ခြင်းသင့် Dataset ကို Argilla သို့ Load လုပ်ခြင်းသင့် Dataset ကို Annotation လုပ်ခြင်းသင့် Annotation လုပ်ထားသော Dataset ကို အသုံးပြုခြင်းArgilla၊ အဆင်သင့်ဖြစ်ပါပြီ!အခန်း (၁၀) ဆိုင်ရာ မေးခွန်းများ
11. Large Language Models များကို Fine-tune လုပ်ခြင်း
နိဒါန်းChat Templates များSFTTrainer ဖြင့် Fine-Tuning လုပ်ခြင်းLoRA (Low-Rank Adaptation)အကဲဖြတ်ခြင်း (Evaluation)နိဂုံးချုပ်စာမေးပွဲ အချိန်!
12. Reasoning Models များ တည်ဆောက်ခြင်း new
နိဒါန်းLLMs များပေါ်တွင် Reinforcement LearningDeepSeek R1 Paper ထဲက Aha MomentDeepSeekMath ရှိ GRPO ကို အဆင့်မြင့် နားလည်ခြင်းTRL တွင် GRPO ကို အကောင်အထည်ဖော်ခြင်းGRPO ဖြင့် Model တစ်ခုကို Fine-tune လုပ်ရန် လက်တွေ့ လေ့ကျင့်ခန်းUnsloth ဖြင့် လက်တွေ့ လေ့ကျင့်ခန်းမကြာမီ လာမည်...
သင်တန်း ဆိုင်ရာ အခမ်းအနားများ
အခန်းပြီးဆုံးခြင်း စစ်ဆေးမှု
1. Language modeling pipeline ၏ အစီအစဉ်က ဘာလဲ။
2. Base Transformer model က ထုတ်ပေးတဲ့ tensor မှာ dimension ဘယ်နှစ်ခုရှိပြီး၊ ဘာတွေလဲ။
3. အောက်ပါတို့ထဲမှ မည်သည့်အရာက subword tokenization ဥပမာတစ်ခုလဲ။
4. Model head ဆိုတာ ဘာလဲ။
5. AutoModel ဆိုတာ ဘာလဲ။
6. အရှည်မတူညီသော sequences များကို အတူတကွ batch လုပ်သည့်အခါ မည်သည့်နည်းလမ်းများကို သိရှိထားသင့်သလဲ။
7. sequence classification model က ထုတ်ပေးတဲ့ logits တွေပေါ်မှာ SoftMax function ကို အသုံးပြုရခြင်းရဲ့ ရည်ရွယ်ချက်က ဘာလဲ။
8. tokenizer API ရဲ့ အများစုက ဘယ် method ပေါ်မှာ အခြေခံထားလဲ။
9. ဒီ code sample မှာ result variable က ဘာတွေ ပါဝင်သလဲ။
from transformers import AutoTokenizer
tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
result = tokenizer.tokenize("Hello!")10. အောက်ပါ code မှာ တစ်ခုခု မှားနေတာ ရှိပါသလား။
from transformers import AutoTokenizer, AutoModel
tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
model = AutoModel.from_pretrained("gpt2")
encoded = tokenizer("Hey!", return_tensors="pt")
result = model(**encoded)