开放数据集中心


专为致力于AI应用的团队精心打造



Image

成品数据集



我们的高质量数据集可帮助您快速启动AI项目


我们提供大量成品数据集,其中有250余个授权数据集,包括11,000多小时的音频、25,000多幅图像和超过870万字/词,涵盖80种语言和多种方言。我们成品数据集旨在有效提高准确性和整体性能,并为特定的AI项目需求快速提供大规模的高质量数据集。我们的产品涵盖多种数据类型的数据,包括图像、视频、语音、音频和文本。我们也在不断构建新的数据集,以满足我们全球客户群的需求。


了解成品数据集


Image Image




Image

开源数据集



我们的数据科学家为您的AI项目倾力推荐


机器学习和人工智能应用需要大量数据进行训练。在我们推荐的资源中,您可以搜索开放数据集,进行访问、修改、重用和共享。使用这些公开的数据集将对AI和机器学习应用的开发带来积极的影响。您可以利用这些数据集对方案进行基准测试,也可以利用这些数据集比较不同的算法,然后再处理实际的数据集。这些开放数据集是获取组织外数据的绝佳选择。



数据集发现工具



Image
Learn More
使用Kaggle查找数据集,探索和构建模型,并与其他数据科学家和机器学习工程师合作。探索和分析50,000多个公共数据集,涵盖从骨骼X光片到拳击比赛结果等多种类内容。
Image
通过一个可搜索的界面探索加州大学尔湾分校的500多个机器学习存储库数据集。数据集涵盖许多主题,包括的案例数从只有几个到超过4300万,属性从只有一两个到超过100万,规模各异。
Learn More


计算机视觉



计算机视觉通过模拟人类视觉系统的复杂性,使计算机能够像人一样识别和处理图像和视频中的对象。将机器学习应用于图像的应用很多,例如,自动驾驶汽车了解周围环境、面部识别应用、AR和VR、在医疗应用中自动完成发现X光片和MRI成像中症状的任务,等。



Image
VisualData 数据集包括不同的主题,有的识别物体,有的重建3D房间,有的在视频中找人,有的在照片中识别衬衫,不一而足。数据集可按发布日期或主题排序,用户可以通过关键词搜索,找到适合自己需要的图像。
Learn More
Image
Computer Vision Online提供用于面部识别、VR设施、目标识别等应用搭建的开放数据集。
Learn More
Image
Papers with Code Dataset包括3,000多个机器学习数据集。可以按任务和模式查找数据集,比较一段时间内的使用情况,浏览基准等。
Learn More
Image
roboflow是用于计算机视觉机器学习模型的开源数据集,涵盖领域广泛,包括动物、棋盘游戏、自动驾驶汽车、医学、热成像、空中无人机图像,甚至合成生成的数据。您可以免费下载各种格式的图片和标注:VOC XML、COCO JSON、YOLOv3平面文本文件,甚至TFR记录。
Learn More


语音语料库



通过录制和转录新的语音语料库创建声学模型和训练语音识别引擎不仅耗时,而且费用高昂。使用语音音频文件和文本转录的开放数据库,可快速、经济地构建转录语音语料库,其中包含众多说话者在各种声学条件下的话语。



Image
作为语音资源的中心,OpenSLR托管语音和语言资源,如语音识别训练语料库,以及与语音识别相关的软件。
Learn More

Candlewill


Candlewill是一个用于自动语音识别(ASR)和文本转语音(TTS)的语音语料库的集合。
Learn More

Edresson


Edresson语音数据库共有71,358个单词的语音数据,其中包括13,311个不同的单词,一位说话者大约10小时28分钟的语音,以48Khz的频率录制,总共3,632个Wave格式的音频文件。音频文件时长从0.67秒到50.08秒不等。
Learn More
Image
Kaggle旨在为语音知识的获取以及开发和评估自动语音识别系统提供语音数据。总共包含6,300个句子,来自美国8个主要方言区的630名说话者,每人说10个句子。
Learn More

VoxCeleb


VoxCeleb是由人类语言的短片组成的视听数据集,摘自上传到YouTube的采访视频。这个数据集包含7,000多个说话者,100万句以上、2,000多小时的音频和视频。
Learn More

VoxForge


VoxForge是用于英语语音识别引擎的转录语音;分类并提供所有音频文件和声学模型。
Learn More

homink


homink是一个约120小时的韩语阅读语音语料库,来自国家韩语研究所(NIKL)。
Learn More

siddiquelatif


URDU数据集包含从乌尔都语脱口秀节目中收集的、表达各种情绪的乌尔都语话语。它包含四种基本情绪的400句话:愤怒、快乐、中性和情绪化。有38名说话者(27名男性和11名女性)。
Learn More
Image
Common Voice数据集是一个开源语音数据集,目前包含60种语言的7000多个小时的验证数据,包括年龄、性别和口音等人口统计元数据,可以帮助训练语音识别引擎的准确性。该数据集中的每个条目都包含一个唯一的MP3和相应的文本文件。
Learn More
Image
这是个大型的句子和翻译数据库,在其中可查看在句子上下文中如何使用单词的示例。
Learn More
Image
该数据集由音频对话及其转录本组成,包含1,495个NIST球体格式(SPH)的音频对话、1,495个STM格式的转录本、带发音的词典(159,848个条目)以及用于语言建模的选定单语数据。
Learn More


Image

数据采集服务



如果您的特定用例需要更为定制化的数据集,我们的数据采集服务可单独提供,也可作为多个交付成果的一部分提供,例如ASR语音数据库,该数据库通常包括音频数据、转录、发音词典和特定语言的文档或带标注的图像数据集。我们的数据采集服务涵盖各种环境的各种数据类型和采集方法,将极大地满足您独特的数据需求。


了解数据采集服务


Image Image