Updated • 1.99k
• 180
Updated • 5.06k
• 498
nampdn-ai/tiny-strange-textbooks
Viewer
• Updated • 1M • 45
• 92
Viewer
• Updated • 61.6M • 170k
• 1.25k
Viewer
• Updated • 2.94M • 21.8k
• 1.55k
Updated • 108k
• 631
Viewer
• Updated • 420k • 635
• 179
togethercomputer/RedPajama-Data-V2
Updated • 5.4k
• 403
nampdn-ai/tiny-math-textbooks
Viewer
• Updated • 635k • 108
• 32
Viewer
• Updated • 44.8k • 310
• 54
Viewer
• Updated • 10.4B • 835k
• 593
Updated • 14.8k
• 355
Updated • 6.68k
• 153
Viewer
• Updated • 720k • 3.55k
• 32
Viewer
• Updated • 7.18B • 20k
• 638
Viewer
• Updated • 1.01M • 5.39k
• 146
Viewer
• Updated • 20k • 76
• 24
nampdn-ai/tiny-bridgedict
Viewer
• Updated • 17.6k • 10
• 18
nampdn-ai/tiny-orca-textbooks
Viewer
• Updated • 147k • 26
• 43
Preview
• Updated • 276
• 194
Viewer
• Updated • 7.89M • 7.91k
• 185
Viewer
• Updated • 1.63M • 1.27k
• 288
Updated • 10.5k
• 196
Viewer
• Updated • 1.91M • 14
• 10
Viewer
• Updated • 31.1M • 17.1k
• 718
CausalLM/Refined-Anime-Text
Viewer
• Updated • 1.02M • 24
• 270
Updated • 106k
• 140
Viewer
• Updated • 8.01M • 71.7k
• 518
Locutusque/UltraTextbooks-2.0
Viewer
• Updated • 3.22M • 191
• 51
Viewer
• Updated • 654k • 748
• 191
Updated • 4.21k
• 1.04k
Viewer
• Updated • 5.86M • 503
• 56
Viewer
• Updated • 221k • 11
• 7
Viewer
• Updated • 2.2M • 111
• 3
YeungNLP/firefly-pretrain-dataset
Viewer
• Updated • 2.46M • 511
• 42
Viewer
• Updated • 1.8k • 390
• 95
Viewer
• Updated • 933 • 18
• 3
Viewer
• Updated • 968M • 11.8k
• 924
Viewer
• Updated • 636M • 288
• 18
Viewer
• Updated • 1.77B • 9.62k
• 81
Updated • 25.8k
• 225
open-web-math/open-web-math
Viewer
• Updated • 6.32M • 35.9k
• 346
Viewer
• Updated • 291M • 293
• 25
Viewer
• Updated • 52.5B • 447k
• 2.88k
HuggingFaceTB/smollm-corpus
Viewer
• Updated • 237M • 46k
• 462
Viewer
• Updated • 1.06M • 204
• 38
Viewer
• Updated • 2.14M • 87.8k
• 1.02k
Viewer
• Updated • 6.43B • 8.21k
• 174
Viewer
• Updated • 219k • 232
• 38
opencsg/chinese-cosmopedia
Preview
• Updated • 1.26k
• 79
Updated • 2.03k
• 38
Viewer
• Updated • 54.8M • 3.02k
• 59
Viewer
• Updated • 826M • 3.59k
• 70
Hieuman/wikitext-103-filtered
Viewer
• Updated • 717k • 10
• 2
Viewer
• Updated • 3.71M • 1.33M
• 711
iohadrubin/wikitext-103-raw-v1
Viewer
• Updated • 29.7k • 1.61k
• 9
Viewer
• Updated • 100k • 597
• 8
ashaba1in/small_openwebtext
Viewer
• Updated • 1M • 74
• 1
Viewer
• Updated • 1.04M • 16
• 6
TigerResearch/pretrain_zh
Viewer
• Updated • 16.9M • 1.35k
• 122
erhwenkuo/pretrain-chinese-zhtw
Viewer
• Updated • 11.5M • 1.89k
• 4
karpathy/tiny_shakespeare
Updated • 7.4k
• 79
Viewer
• Updated • 69.9k • 128k
• 401
Viewer
• Updated • 621M • 31.2k
• 88
Viewer
• Updated • 170M • 10.3k
• 96
institutional/institutional-books-1.0
Viewer
• Updated • 983k • 19.1k
• 278
EssentialAI/essential-web-v1.0
Preview
• Updated • 300k
• 226
PrimeIntellect/SYNTHETIC-2-Base
Viewer
• Updated • 465k • 117
• 9
shajiu/TibetanGeneral_corpus
Viewer
• Updated • 259k • 32
• 5
Viewer
• Updated • 476M • 78k
• 877
xTimeCrystal/TinyCorpus-v2
Viewer
• Updated • 12.9M • 50
• 5
karpathy/fineweb-edu-100b-shuffle
Viewer
• Updated • 97.2M • 13.6k
• 167
Updated • 35.5k
• 328