course documentation
အမှတ်မပေးသော Quiz
0. စတင်ပြင်ဆင်ခြင်း
1. Transformer models များ
နိဒါန်းNatural Language Processing နှင့် Large Language Models များTransformers တွေက ဘာတွေလုပ်နိုင်လဲ။Transformers တွေက ဘယ်လိုအလုပ်လုပ်လဲ။🤗 Transformers တွေက လုပ်ငန်းတာဝန်တွေကို ဘယ်လိုဖြေရှင်းပေးလဲ။Transformer Architectures များအမြန်ဉာဏ်စမ်းLLMs များဖြင့် မှန်းဆတွက်ချက်ခြင်း။ဘက်လိုက်မှုနှင့် ကန့်သတ်ချက်များအနှစ်ချုပ်အသိအမှတ်ပြု စာမေးပွဲ
2. 🤗 Transformers ကို အသုံးပြုခြင်း
နိဒါန်းPipeline နောက်ကွယ်မှ အကြောင်းအရာများModelsTokenizersSequence များစွာကို ကိုင်တွယ်ခြင်းအားလုံးကို ပေါင်းစပ်ခြင်းအခြေခံ အသုံးပြုမှု ပြီးဆုံးပါပြီ!Optimization လုပ်ထားသော Inference Deploymentအခန်းပြီးဆုံးခြင်း စစ်ဆေးမှု
3. Pretrained Model တစ်ခုကို Fine-tuning လုပ်ခြင်း
နိဒါန်းဒေတာများကို စီမံဆောင်ရွက်ခြင်းTrainer API ဖြင့် မော်ဒယ်တစ်ခုကို Fine-tuning လုပ်ခြင်းပြည့်စုံသော Training Loop တစ်ခုLearning Curves များကို နားလည်ခြင်းFine-tuning လုပ်ငန်း ပြီးစီးပြီ!အခန်းပြီးဆုံးခြင်း အသိအမှတ်ပြု လက်မှတ်
4. Models နှင့် Tokenizers များကို မျှဝေခြင်း
Hugging Face HubPretrained Models များကို အသုံးပြုခြင်းPretrained Models များကို မျှဝေခြင်းModel Card တစ်ခု တည်ဆောက်ခြင်းအပိုင်း ၁ ပြီးဆုံးပါပြီ!အခန်း (၄) ဆိုင်ရာ မေးခွန်းများ
5. The 🤗 Datasets library
နိဒါန်းကျွန်ုပ်၏ Dataset သည် Hub တွင် မရှိလျှင် ဘာလုပ်ရမလဲ။Slice and Dice လုပ်ဖို့ အချိန်တန်ပြီ။Big Data လား။ 🤗 Datasets က ကူညီပါလိမ့်မယ်။ကိုယ်ပိုင် Dataset တစ်ခု ဖန်တီးခြင်းFAISS ဖြင့် Semantic Search ပြုလုပ်ခြင်း🤗 Datasets၊ အဆင်သင့်ဖြစ်ပါပြီ!အခန်း (၅) ဆိုင်ရာ မေးခွန်းများ
6. The 🤗 Tokenizers library
နိဒါန်းOld Tokenizer တစ်ခုမှ New Tokenizer တစ်ခုကို Training လုပ်ခြင်းFast Tokenizers များ၏ ထူးခြားသော စွမ်းအားများQA Pipeline ရှိ Fast Tokenizers များNormalization နှင့် Pre-tokenizationByte-Pair Encoding TokenizationWordPiece TokenizationUnigram TokenizationTokenizer တစ်ခုကို Block အလိုက် တည်ဆောက်ခြင်းTokenizers၊ အဆင်သင့်ဖြစ်ပါပြီ!အခန်း (၆) ဆိုင်ရာ မေးခွန်းများ
7. Classical NLP Tasks များ
နိဒါန်းToken ClassificationMasked Language Model တစ်ခုကို Fine-tuning လုပ်ခြင်းဘာသာပြန်ခြင်းအနှစ်ချုပ်ဖော်ပြခြင်းCausal Language Model တစ်ခုကို အစကနေ Train လုပ်ခြင်းမေးခွန်းဖြေဆိုခြင်းLLM များကို ကျွမ်းကျင်ခြင်းအခန်း (၇) ဆိုင်ရာ မေးခွန်းများ
8. အကူအညီတောင်းခံနည်း
နိဒါန်းError တစ်ခုကြုံတွေ့ရတဲ့အခါ ဘာလုပ်ရမလဲForums များတွင် အကူအညီတောင်းခံခြင်းTraining Pipeline ကို Debugging လုပ်ခြင်းကောင်းမွန်သော Issue တစ်ခု ရေးသားနည်းအပိုင်း ၂ ပြီးဆုံးပါပြီ!အခန်း (၈) ဆိုင်ရာ မေးခွန်းများ
9. Demos များ တည်ဆောက်ခြင်းနှင့် မျှဝေခြင်း
Gradio နိဒါန်းသင့်ရဲ့ ပထမဆုံး Demo ကို တည်ဆောက်ခြင်းInterface Class ကို နားလည်ခြင်းDemos များကို တခြားသူများနှင့် မျှဝေခြင်းHugging Face Hub နှင့် ပေါင်းစပ်မှုများAdvanced Interface Features များBlocks နိဒါန်းGradio၊ အဆင်သင့်ဖြစ်ပါပြီ!အခန်း (၉) ဆိုင်ရာ မေးခွန်းများ
10. အရည်အသွေးမြင့် Datasets များကို စုစည်းခြင်း
Argilla နိဒါန်းသင့် Argilla Instance ကို တည်ဆောက်ခြင်းသင့် Dataset ကို Argilla သို့ Load လုပ်ခြင်းသင့် Dataset ကို Annotation လုပ်ခြင်းသင့် Annotation လုပ်ထားသော Dataset ကို အသုံးပြုခြင်းArgilla၊ အဆင်သင့်ဖြစ်ပါပြီ!အခန်း (၁၀) ဆိုင်ရာ မေးခွန်းများ
11. Large Language Models များကို Fine-tune လုပ်ခြင်း
နိဒါန်းChat Templates များSFTTrainer ဖြင့် Fine-Tuning လုပ်ခြင်းLoRA (Low-Rank Adaptation)အကဲဖြတ်ခြင်း (Evaluation)နိဂုံးချုပ်စာမေးပွဲ အချိန်!
12. Reasoning Models များ တည်ဆောက်ခြင်း new
နိဒါန်းLLMs များပေါ်တွင် Reinforcement LearningDeepSeek R1 Paper ထဲက Aha MomentDeepSeekMath ရှိ GRPO ကို အဆင့်မြင့် နားလည်ခြင်းTRL တွင် GRPO ကို အကောင်အထည်ဖော်ခြင်းGRPO ဖြင့် Model တစ်ခုကို Fine-tune လုပ်ရန် လက်တွေ့ လေ့ကျင့်ခန်းUnsloth ဖြင့် လက်တွေ့ လေ့ကျင့်ခန်းမကြာမီ လာမည်...
သင်တန်း ဆိုင်ရာ အခမ်းအနားများ
အမှတ်မပေးသော Quiz
ဒီအခန်းက သင်ကြားရမယ့် အကြောင်းအရာတွေ အများကြီးကို ဖော်ပြခဲ့ပြီးပါပြီ။ အသေးစိတ် အချက်အလက်အားလုံးကို နားမလည်သေးရင်လည်း စိတ်မပူပါနဲ့။ ဒါပေမယ့် ဒီ quiz နဲ့ သင် သင်ယူခဲ့တာတွေကို ပြန်လည်သုံးသပ်ကြည့်ရအောင်။
ဒီ quiz က အမှတ်မပေးတဲ့အတွက် သင်နှစ်သက်သလောက် အကြိမ်ကြိမ် ကြိုးစားဖြေဆိုနိုင်ပါတယ်။ မေးခွန်းအချို့နဲ့ ရုန်းကန်ရရင် အကြံပြုချက်တွေကို လိုက်နာပြီး သင်ခန်းစာတွေကို ပြန်လည်လေ့လာပါ။ ဒီအကြောင်းအရာတွေကို အသိအမှတ်ပြု စာမေးပွဲမှာ ထပ်မံဖြေဆိုရမှာ ဖြစ်ပါတယ်။
1. Hub ကို ရှာဖွေပြီး roberta-large-mnli checkpoint ကို ရှာပါ။ ၎င်းသည် မည်သည့်လုပ်ငန်းကို လုပ်ဆောင်ပါသနည်း။
2. အောက်ပါ code သည် မည်သည့်အရာကို ပြန်ပေးမည်နည်း။
from transformers import pipeline
ner = pipeline("ner", grouped_entities=True)
ner("My name is Sylvain and I work at Hugging Face in Brooklyn.")3. ဤ code နမူနာတွင် … နေရာ၌ မည်သည့်အရာကို အစားထိုးသင့်သနည်း။
from transformers import pipeline
filler = pipeline("fill-mask", model="bert-base-cased")
result = filler("...")4. ဤ code သည် အဘယ်ကြောင့် အလုပ်မလုပ်နိုင်သနည်း။
from transformers import pipeline
classifier = pipeline("zero-shot-classification")
result = classifier("This is a course about the Transformers library")5. “Transfer learning” ဆိုတာ ဘာကိုဆိုလိုတာလဲ။
6. မှန်လား မှားလား။ Language Model တစ်ခုသည် ၎င်း၏ pretraining အတွက် အညွှန်းများ (labels) မလိုအပ်ပါ။
7. “model”၊ “architecture” နှင့် “weights” ဟူသော ဝေါဟာရများကို အကောင်းဆုံး ဖော်ပြသည့် စာကြောင်းကို ရွေးပါ။
8. ဖန်တီးထားသော စာသားများဖြင့် prompts များကို ဖြည့်စွက်ရန်အတွက် မည်သည့်မော်ဒယ်အမျိုးအစားများကို အသုံးပြုမည်နည်း။
9. စာသားများကို အကျဉ်းချုပ်ရန်အတွက် မည်သည့်မော်ဒယ်အမျိုးအစားများကို အသုံးပြုမည်နည်း။
10. သတ်မှတ်ထားသော အညွှန်းများ (labels) အတိုင်း စာသား inputs များကို အမျိုးအစားခွဲခြားရန်အတွက် မည်သည့်မော်ဒယ်အမျိုးအစားများကို အသုံးပြုမည်နည်း။
11. မော်ဒယ်တစ်ခုတွင် တွေ့ရသော ဘက်လိုက်မှု (bias) သည် မည်သည့်ရင်းမြစ်မှ ဖြစ်ပေါ်လာနိုင်သနည်း။
ဝေါဟာရ ရှင်းလင်းချက် (Glossary)
- Quiz: သင်ယူခဲ့သည့် အကြောင်းအရာများကို ပြန်လည်စစ်ဆေးရန် မေးခွန်းများ။
- Transformer Models: Natural Language Processing (NLP) မှာ အောင်မြင်မှုများစွာရရှိခဲ့တဲ့ deep learning architecture တစ်မျိုးပါ။ ၎င်းတို့ဟာ စာသားတွေထဲက စကားလုံးတွေရဲ့ ဆက်နွယ်မှုတွေကို “attention mechanism” သုံးပြီး နားလည်အောင် သင်ကြားပေးပါတယ်။
- Hugging Face Hub: AI မော်ဒယ်တွေ၊ datasets တွေနဲ့ demo တွေကို အခြားသူတွေနဲ့ မျှဝေဖို့၊ ရှာဖွေဖို့နဲ့ ပြန်လည်အသုံးပြုဖို့အတွက် အွန်လိုင်း platform တစ်ခု ဖြစ်ပါတယ်။
- Checkpoint: မော်ဒယ်တစ်ခုကို လေ့ကျင့်နေစဉ်အတွင်း အချိန်အတန်ကြာပြီးနောက် အခြေအနေတစ်ခုကို သိမ်းဆည်းထားသော အမှတ်။
- Task: AI မော်ဒယ်တစ်ခုက လုပ်ဆောင်ရန် လေ့ကျင့်ထားသော သီးခြားလုပ်ငန်း (ဥပမာ- စာသားခွဲခြားသတ်မှတ်ခြင်း၊ စာသားထုတ်လုပ်ခြင်း)။
- Summarization: စာသားတစ်ခုကို အဓိကအချက်အလက်များ မပျောက်ပျက်စေဘဲ ပိုမိုတိုတောင်းသော ပုံစံဖြင့် အကျဉ်းချုပ်ခြင်း။
- Text Classification: စာသားတစ်ခုကို ကြိုတင်သတ်မှတ်ထားသော အမျိုးအစားများ သို့မဟုတ် အညွှန်းများထဲသို့ ခွဲခြားသတ်မှတ်ခြင်း။
- Natural Language Inference (NLI): စာကြောင်းနှစ်ကြောင်းကြားရှိ ယုတ္တိဆိုင်ရာ ဆက်နွယ်မှုကို ဆုံးဖြတ်သည့် လုပ်ငန်း။ (ဥပမာ- contradiction, neutral, entailment)
- Text Generation: AI မော်ဒယ်များကို အသုံးပြု၍ လူသားကဲ့သို့သော စာသားအသစ်များ ဖန်တီးခြင်း။
pipeline()function: Hugging Face Transformers library မှာ ပါဝင်တဲ့ လုပ်ဆောင်ချက်တစ်ခုဖြစ်ပြီး မော်ဒယ်တွေကို သီးခြားလုပ်ငန်းတာဝန်များ (ဥပမာ- စာသားခွဲခြားသတ်မှတ်ခြင်း၊ စာသားထုတ်လုပ်ခြင်း) အတွက် အသုံးပြုရလွယ်ကူအောင် ပြုလုပ်ပေးပါတယ်။ner(Named Entity Recognition): စာသားထဲက လူအမည်၊ နေရာအမည်၊ အဖွဲ့အစည်းအမည် စတဲ့ သီးခြားအမည်တွေကို ရှာဖွေဖော်ထုတ်ခြင်း။grouped_entities=True:nerpipeline တွင် အသုံးပြုသည့် parameter တစ်ခုဖြစ်ပြီး တူညီသော entity နှင့် သက်ဆိုင်သည့် စကားလုံးများကို အုပ်စုဖွဲ့ပေးသည်။sentiment-analysispipeline: စာသားတစ်ခု၏ စိတ်ခံစားမှု (အပြုသဘော၊ အနုတ်သဘော) ကို ခွဲခြမ်းစိတ်ဖြာရန် အသုံးပြုသော pipeline။text-generationpipeline: input prompt အပေါ် အခြေခံ၍ စာသားအသစ်များကို ဖန်တီးရန် အသုံးပြုသော pipeline။fill-maskpipeline: စာသားတစ်ခုရှိ ဝှက်ထားသော စကားလုံးများ (mask tokens) ကို ဖြည့်ဆည်းပေးရန် အသုံးပြုသော pipeline။bert-base-cased: BERT (Bidirectional Encoder Representations from Transformers) မော်ဒယ်၏ ဗားရှင်းတစ်ခုဖြစ်ပြီး အင်္ဂလိပ်စာလုံးအကြီးအသေးကို ခွဲခြားသိမြင်သည်။ ၎င်း၏ mask token သည်[MASK]ဖြစ်သည်။zero-shot-classificationpipeline: လေ့ကျင့်မှုဒေတာတွင် မမြင်ဖူးသေးသော အညွှန်းများဖြင့် စာသားများကို အမျိုးအစားခွဲခြားနိုင်သော pipeline။candidate_labels:zero-shot-classificationpipeline တွင် အသုံးပြုသည့် parameter တစ်ခုဖြစ်ပြီး စာသားကို ခွဲခြားသတ်မှတ်ရန်အတွက် ဖြစ်နိုင်ခြေရှိသော အညွှန်းများ (labels) စာရင်းကို ပေးပို့သည်။- Transfer Learning: ကြိုတင်လေ့ကျင့်ထားသော မော်ဒယ်တစ်ခု၏ အသိပညာကို အခြားလုပ်ငန်းတစ်ခု (new task) အတွက် မော်ဒယ်အသစ်သို့ လွှဲပြောင်းပေးခြင်း။
- Pretrained Model: ကြီးမားသော ဒေတာအစုအဝေးများဖြင့် အစောပိုင်းကတည်းက လေ့ကျင့်ထားသော မော်ဒယ်။
- Fine-tuned Model: ကြိုတင်လေ့ကျင့်ထားသော မော်ဒယ်တစ်ခုကို သီးခြားလုပ်ငန်းတစ်ခု (specific task) အတွက် အနည်းငယ်သော ဒေတာနှင့် ထပ်မံလေ့ကျင့်ပေးထားသော မော်ဒယ်။
- Weights: Machine Learning မော်ဒယ်တစ်ခု၏ သင်ယူနိုင်သော အစိတ်အပိုင်းများ။ ၎င်းတို့သည် လေ့ကျင့်နေစဉ်အတွင်း ဒေတာများမှ ပုံစံများကို သင်ယူကာ ချိန်ညှိပေးသည်။
- Architecture: Machine Learning မော်ဒယ်တစ်ခု၏ တည်ဆောက်ပုံ သို့မဟုတ် ဒီဇိုင်း။ ၎င်းသည် သင်္ချာဆိုင်ရာ functions များ၏ အစီအစဉ်နှင့် ၎င်းတို့ မည်သို့ချိတ်ဆက်ထားသည်ကို သတ်မှတ်သည်။
- Self-supervised Learning: အညွှန်းများ (labels) ကို inputs များမှ အလိုအလျောက် ထုတ်လုပ်နိုင်သည့် သင်ယူမှုပုံစံတစ်မျိုး။
- Encoder Model: Transformer Architecture ၏ အစိတ်အပိုင်းတစ်ခုဖြစ်ပြီး input data (ဥပမာ- စာသား) ကို နားလည်ပြီး ကိုယ်စားပြုတဲ့ အချက်အလက် (representation) အဖြစ် ပြောင်းလဲပေးကာ classification ကဲ့သို့သော လုပ်ငန်းများအတွက် သင့်လျော်သည်။
- Decoder Model: Transformer Architecture ၏ အစိတ်အပိုင်းတစ်ခုဖြစ်ပြီး encoder ကနေ ရရှိတဲ့ အချက်အလက် (representation) ကို အသုံးပြုပြီး output data (ဥပမာ- ဘာသာပြန်ထားတဲ့ စာသား သို့မဟုတ် စာသားထုတ်လုပ်ခြင်း) ကို ထုတ်ပေးသည်။
- Sequence-to-sequence Model: Encoder နှင့် Decoder နှစ်ခုစလုံး ပါဝင်သော Transformer architecture တစ်မျိုးဖြစ်ပြီး input sequence မှ output sequence တစ်ခုသို့ ပြောင်းလဲခြင်း (ဥပမာ- ဘာသာပြန်ခြင်း၊ အကျဉ်းချုပ်ခြင်း) လုပ်ငန်းများအတွက် အသုံးပြုပါတယ်။
- Bias: ဒေတာအစုအဝေး (dataset) သို့မဟုတ် မော်ဒယ်၏ လေ့ကျင့်မှုပုံစံကြောင့် ဖြစ်ပေါ်လာသော ဘက်လိုက်မှုများ။
- Metric: မော်ဒယ်တစ်ခု၏ စွမ်းဆောင်ရည်ကို တိုင်းတာရန် အသုံးပြုသော တိုင်းတာမှုစနစ်။