course documentation
🤗 Datasets, kiểm tra nào!
0. Cài đặt
1. Mô hình Transformer
Giới thiệuXử lý Ngôn Ngữ Tự nhiênTransformers có thể làm những gì?Cơ chế hoạt động của Transformer?Các mô hình mã hóaCác mô hình giải mãCác mô hình mã hoá-giải mãThiên kiến và hạn chếTổng kếtĐố vui cuối chương
2. Sử dụng 🤗 Transformers
Giới thiệuĐằng sau pipelineCác mô hìnhTokenizersXử lý đa chuỗiKết hợp lạiHoàn thành cách sử dụng cơ bản!Đố vui cuối chương
3. Tinh chỉnh một mô hình huấn luyện trước
Giới thiệuXử lý dữ liệuTinh chỉnh một mô hình với Trainer API hoặc KerasBản huấn luyện hoàn chỉnhTỉnh chỉnh, thử xem!Đố vui cuối chương
4. Chia sẻ các mô hình và tokenizer
Hugging Face HubSử dụng các mô hình huấn luyện trướcChia sẻ các mô hình huấn luyện trướcXây dựng các thẻ mô hìnhHoàn thành phần 1!Đố vui cuối chương
5. Thư viện 🤗 Datasets
Giới thiệuNếu như dữ liệu của ta không trên Hub thì sao?Sắp xếp dữ liệuDữ liệu lớn? 🤗 Bộ dữ liệu để giải cứu!Tạo tập dữ liệu của riêng bạnTìm kiếm ngữ nghĩa với FAISS🤗 Datasets, kiểm tra nào!Đố vui cuối chương
6. Thư viện 🤗 Tokenizers
Giới thiệuHuấn luyện một tokenizer mới từ cái cũSức mạnh đặc biệt của tokenizer nhanhTokenizer nhanh trong pipeline QAChuẩn hoá và tiền tokenizeByte-Pair Encoding tokenizationWordPiece tokenizationUnigram tokenizationXây dựng từng khối tokenizerTokenizers, kiểm tra nào!Đố vui cuối chương
7. Các tác vụ NLP chính
Giới thiệuPhân loại tokenTinh chỉnh một mô hình ngôn ngữ bị ẩn điDịch máyTóm tắtHuấn luyện một mô hình ngôn ngữ nhân quả từ đầuHỏi đápLàm chủ NLPĐố vui cuối chương
8. Làm thế nào để yêu cầu giúp đỡ
Giới thiệuPhải làm gì khi bạn gặp lỗiYêu cầu trợ giúp trên diễn đànGỡ lỗi quy trình huấn luyệnLàm thế nào để viết một vấn đề hayPhần 2 đã hoàn thành!Đố vui cuối chương
9. Xây dựng và chia sẻ các demo
Giới thiệu về GradioXây dựng bản demo đầu tiên của bạnHiểu lớp InterfaceChia sẻ các bản demo với người khácTích hợp với Hugging Face HubCác tính năng nâng cao của InterfaceGiới thiệu về Gradio BlocksGradio, kiểm tra nào!Đố vui cuối chương
Sự kiện Khoá học
🤗 Datasets, kiểm tra nào!
Chà, đó là một chuyến tham quan khá thú vị qua thư viện 🤗 Datasets - chúc mừng bạn đã đi được xa như vậy! Với kiến thức bạn đã thu được từ chương này, bạn sẽ có thể:
- Tải bộ dữ liệu từ bất kỳ đâu, có thể là Hugging Face Hub, máy tính xách tay của bạn hoặc máy chủ từ xa tại công ty của bạn.
- Xoá dữ liệu của bạn bằng cách sử dụng kết hợp các hàm
Dataset.map()vàDataset.filter(). - Chuyển đổi nhanh chóng giữa các định dạng dữ liệu như Pandas và NumPy bằng cách sử dụng
Dataset.set_format(). - Tạo tập dữ liệu của riêng bạn và đẩy nó vào Hugging Face Hub.
- Nhúng tài liệu của bạn bằng mô hình Transformer và xây dựng công cụ tìm kiếm ngữ nghĩa bằng FAISS.
Trong Chương 7, chúng ta sẽ sử dụng tốt tất cả những điều này khi ta đi sâu vào các tác vụ NLP cốt lõi mà các mô hình Transformer rất phù hợp. Tuy nhiên, trước khi vượt lên phía trước, hãy đưa kiến thức của bạn về 🤗 Datasets vào một bài kiểm tra nhanh!
Update on GitHub