数据集
大规模高质量成品训练数据集,助力高效构建、训练和部署机器学习模型
公开数据集
精rag-bench-public-questions2026-01-06
能力评估检索增强Apache 2.0coffee_dou(为PPDE努力版) 0 411 0
精hermes-function-calling-v1-all2026-01-07
逻辑推理智能体Apache 2.0皮都坦率的法夏 0 47 0
精RULER-4_128k-7800-TrainingData2026-01-06
能力评估语言理解Apache 2.0coffee_dou(为PPDE努力版) 0 52 0
精SWE-Bench-plus-plus2026-01-06
能力评估逻辑推理编程代码Apache 2.0coffee_dou(为PPDE努力版) 0 34 0
精medical_qa2025-09-28
能力评估对齐人类偏好医疗coffee_dou(为PPDE努力版) 0 1814 0
精ImageRewardDB2025-09-28
能力评估多模态科技互联网ImageRewardDB 是一个全面的文本对图像对比数据集,专注于文本到图像的人类偏好。 它包含 13.7 万对专家对比,基于文本提示和 DiffusionDB 对应的模型输出。 为了构建 ImageRewadDB,我们设计了专门的流程,确立了定量评估的标准, 注释员培训,优化标签体验
coffee_dou(为PPDE努力版) 0 345 0
精SEED-Bench-2-plus2025-09-27
能力评估多模态互联网coffee_dou(为PPDE努力版) 0 212 0
预习作业2022-03-28
分类CC0预习作业
三世非遐 142 23 0
精II-Bench2025-09-27
能力评估语言理解图像理解互联网Apache 2.0皮都坦率的法夏 0 1940 0
精GAOKAO-Bench2025-09-27
能力评估逻辑推理互联网教育Apache 2.0皮都坦率的法夏 0 432 0