数据集
大规模高质量成品训练数据集,助力高效构建、训练和部署机器学习模型
公开数据集
头盔数据集2021-09-28
目标检测CC0数据集,按照昆虫数据集格式整理,并划分训练集测试集
xuexi 20 5 0
精all-skills-from-skills-sh2026-02-28
检索增强逻辑推理Apache 2.0来源于 skills.sh 网站,通过抓取获得的所有skill
超级大只老咪 0 938 0
精YodaLingua-preview2026-02-27
语音识别语音合成互联网Apache 2.0YodaLingua 是一个高质量的语音数据集,专为训练文本转语音 (TTS) 系统、ASR 模型以及任何需要干净、对齐良好的音频-文本对的应用而设计。
超级大只老咪 0 97 0
精Cybersecurity-Dataset2026-02-27
能力评估互联网Apache 2.0首个由新疆幻城网安科技有限公司开源的超大规模网络安全数据集 整合全网所有主流开源网络安全数据源 + 自研高质量样本,经严格去重、清洗与标注,专为训练本地化 AI 安全大模型(如 DeepSeek-14B、Qwen-Code-30B MOE)而设计
超级大只老咪 0 128 0
精delicate_medical_r1_data2026-02-26
微调医疗Apache 2.0基于华佗开源的高质量语料库
超级大只老咪 0 81 0
精SA1B-Dense-Caption2026-02-26
多模态科技互联网Apache 2.0长文本图文描述
超级大只老咪 0 72 0
精SKYLENAGE-ReasoningMATH2026-02-26
微调能力评估检索增强逻辑推理科技Apache 2.0覆盖从基础算术到高等数学的多层次推理任务,涵盖逻辑推导、代数变换、几何分析、概率统计等多个维度,旨在评估模型在结构化数学问题中的理解、推理与解答能力。数据集设计注重问题难度分级与认知层次划分,支持细粒度的能力评估。
超级大只老咪 0 56 0
精rag-bench-public-questions2026-01-06
能力评估检索增强Apache 2.0coffee_dou(为PPDE努力版) 0 2268 1
精hermes-function-calling-v1-all2026-01-07
逻辑推理智能体Apache 2.0皮都坦率的法夏 0 171 0
精RULER-4_128k-7800-TrainingData2026-01-06
能力评估语言理解Apache 2.0coffee_dou(为PPDE努力版) 0 221 0