成品数据集


我们的经授权许可的成品数据集将快速启动您的AI项目

查看数据集产品目录
获取数据集报价



Image

澳鹏成品数据集



成品数据集是帮助您构建高质量 AI/ML 模型训练数据的绝佳选择。这种成品训练数据集可为企业提供升级和快速运行模型所需的数据,而成本通常比自定义数据采集工作低得多。成品数据集可以运行许多 AI 试点项目,并用其他数据补充生产模型,从而提高整体性能和成本效益。无论企业规模如何,在时间和预算紧张时,成品数据集都是绝佳的解决方案。

澳鹏提供种类丰富的成品数据库,澳鹏提供600+个成品数据集,其中包括27600多小时的音频、490000多幅图像和超过一亿字/词的文本数据集,涵盖80种语言和多种方言。数据集特色如下:




Image

语音识别数据集


覆盖64种语言,总时长22,000小时

电话信道,手机麦克风,高保真麦克风等多种录音设备

单人朗读,自由说话,双人对话等多种场景

安静环境,办公室/居家环境,车载环境等多种录音环境

全部附带转写文本,部分附带发音词典


获取语音识别数据集目录

Image

文本数据集


发音词典覆盖98种语言,共523万词条

词性词典覆盖22种语言,共326万词条

命名实体库(NER)覆盖8种语言,超100万词条

词形分析器覆盖3种语言

阿拉伯语元音化词典


获取文本数据集目录
Image

图像数据集


黑人面部照片1000人13500张

OCR图片中文、泰语、芬兰语共12,000张

多标签图片数据库,2196张

多姿态多光线人像图片,680张


获取图像数据集目录
Image

视频数据集


手机拍摄中国人动作短视频2000段

中国人面部23种表情自拍视频500段

特种数据库

0-3岁婴幼儿啼哭音频100段,每段1分钟


获取视频数据集目录

Image

自驾数据集


丰富的舱内外视频数据及语音数据


获取自动驾驶数据集目录
Image

语音合成数据集


多种语言,400名声优,覆盖20+国家资深声优资源库


获取语音合成数据集目录




Image

数据集应用场景




Image

安全驾驶/自动驾驶



驾驶人危险行为识别数据库助力驾驶舱内检测驾驶位、驾驶员危险动作以及疲劳识别

乘客安全监测数据库,助力识别被遗留的小孩、宠物、危害物品等

车载语音数据库助力驾驶人实现语音导航、多元化智能驾驶体验

驾驶舱外数据库助力道路车道线、障碍物、停车位识别


了解相关数据集

Image

互联网虚拟人/智能客服



线上NLP多轮对话的数据集助力实现生成类AI聊天程序,实现线上客服智能化

TTS语音数据库对文本文件进行实时转换,把文本智能地转化为自然语音流,文本输出的语音音律流畅,使得听者在听取信息时感觉自然


了解相关数据集
Image

智慧金融



我们的金融 OCR 数据集可针对金融、保险的合同审核自动化,助力实现高效、精准的文本转写识别自动化

了解相关数据集
Image

智能家居



语音识别数据库,助力与家居例如空调等的功能提示、智能交互

障碍物图像数据库助力例如扫地机器人的智能识别和障碍物跨越


了解相关数据集
Image

智能终端



人脸识别,语音识别等数据集可以助您部署智能终端

了解相关数据集
Image

智能安防



人脸识别,危险动作追踪等数据集可助您搭建智能安防人工智能

了解相关数据集



数据集名称 产品类型 常见应用场景 录音设备 单元
数据库名称 产品类型 常见使用案例 录音设备 单元
103
2人-3人商务/日常对话录音
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 JAP_ASR002_CN NA 对话录音 日语 日本 语音分析 8.5小时 手机 低背景噪音(家庭/办公室) NA 16/48 R
474
DMS视频采集
视频 添加到咨询列表 DMS001_CN NA 人像视频 N/A 中国 NA TBD NA NA NA NA D
1
LLM 双人中文对话语料 (日常/科技/体育/医疗)
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 LLM_corpus_CN NA NA 中文 中国 对话式AI LLM NA 200000对 NA NA NA NA L
83
LLM 双人中文对话语料 (日常/科技/体育/医疗)
文本 LLMD大语言模型训练 LLMD大语言模型训练 添加到咨询列表 LLM_corpus_CN N/A 多轮对话 普通话 中国 语言建模 N/A 200000对 N/A N/A N/A N/A L
228
Sorani(库尔德语)对话式的电话录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 SOR_ASR001 7 924 对话录音 库尔德语 伊朗 语音分析 170 5小时 移动电话和固定电话 低背景噪音 可根据要求提供 8 K
399
上海方言(中国)多人对话式录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 SHANGHAI_ASR001_CN NA 对话录音 上海方言 中国 语音分析 51 21小时 录音笔/麦克风 低背景噪音(家庭/办公室) NA 16 Z
400
上海方言(中国)多人对话式录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 SHANGHAI_ASR002_CN NA 对话录音 上海方言 中国 语音分析 14 4.5 小时 移动电话 低背景噪音(家庭/办公室) NA 8 Z
421
上海语音数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 SHANGHAI_ASR003_CN NA 语料朗读 上海 中国 语音分析 8 4.1小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 Z
401
东北方言(中国)多人对话式录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 DONGBEI_ASR001_CN NA 对话录音 东北方言 中国 语音分析 268 84.6小时 录音笔/麦克风 低背景噪音(家庭/办公室) NA 16 Z
402
东北方言(中国)多人对话式录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 DONGBEI_ASR002_CN NA 对话录音 东北方言 中国 语音分析 185 75.2小时 移动电话 低背景噪音(家庭/办公室) NA 8 Z
420
东北语音数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 DONGBEI_ASR003_CN NA 语料朗读 东北 中国 语音分析 8 2.72小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 Z
479
中文女声(客服类)
音频 添加到咨询列表 CHN_TTS001_CN NA TTS 中文 中国 1 6.64 小时 专业录音棚 专业录音棚 NA NA Z
57
中文泰语
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 Chinese_Thai_corpus_CN NA 平行语料 中文泰语 N/A 对话式AI NA 50000对 NA NA NA NA Z
6
中英平行语料​
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 CE_corpus001_CN NA NA 中文 中国 对话式AI LLM NA 200000对 NA NA NA NA Z
9
中韩双语语对
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 CHN_KOR_corpus_CN NA NA 印尼语 中国 对话式AI NA TBD NA NA NA NA Z
303
丹麦(丹麦)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 dan_DNK_PHON 107 000 发音词典 丹麦语 丹麦 语言建模 N/A 107,000个单词 N/A N/A N/A N/A D
230
丹麦(丹麦)有定稿的麦克风录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 Speecon Danish 可根据要求提供 有定稿的录音 丹麦语 丹麦 聊天机器人 600(550个成年语料提供者及50个儿童语料提供者) 53小时 麦克风 混合(办公室/娱乐场所/车内/公共场所) 170 000 16 D
304
丹麦(丹麦)词性词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 dan_DNK_POS 100 000 词性词典 丹麦语 丹麦 语言建模 N/A 100,000个单词 N/A N/A N/A N/A D
391
乌克兰语(乌克兰)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 ukr_UKR_PHON 5 000 发音词典 乌克兰语 乌克兰 语言建模 N/A 5,000个单词 N/A N/A N/A N/A W
464
乌兹别克自由说短语流数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 UZB_AKD_ASR001_CN NA 自由说 乌兹别克 乌兹别克 语音分析 1500+ 182.68小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 W
94
乌尔都语NER新闻文本
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 URD_NER001 NA 乌尔都语 巴基斯坦 对话式AI 20,634 句 W
277
乌尔都语NER语料库
文本 NER, 内容分类, 搜索引擎 内容分类 NER 添加到咨询列表 URD_NER001 可根据要求提供 NER 乌尔都语 巴基斯坦 搜索引擎 N/A 20,634个句子 N/A N/A 20 634 N/A W
463
乌尔都语自由说短语流数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 URD_AKD_ASR001_CN NA 自由说 乌尔都语 乌尔都语 语音分析 1500+ 431.04小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 W
245
乌尔都语(印度/巴基斯坦)对话式的电话录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 URD_ASR001 10 871 对话录音 乌尔都语 印度-巴基斯坦 语音分析 1 000 47小时 移动电话和固定电话 混合 可根据要求提供 8 W
392
乌尔都语(巴基斯坦)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 urd_PAK_PHON 40 000 发音词典 乌尔都语 巴基斯坦 语言建模 N/A 40,000个单词 N/A N/A N/A N/A W
393
乌尔都语(巴基斯坦)词性词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 urd_PAK_POS 12 000 词性词典 乌尔都语 巴基斯坦 语言建模 N/A 12,000个单词 N/A N/A N/A N/A W
451
亚美尼亚自由说短语流数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 ARM_AKD_ASR001_CN NA 自由说 亚美尼亚 亚美尼亚 语音分析 1500+ 176.74小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 Y
85
人体微小活动能源消耗数据采集
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 RTHD_CN N/A 文本数据 普通话 中国 对话式AI 语言建模 N/A 150 ID N/A N/A N/A N/A R
69
人像视频
视频 添加到咨询列表 VED_RX_CN NA 人像视频 N/A 中国 NA 17 H NA NA NA NA R
469
人像采集图片数据库
图像 图片标签识别训练 添加到咨询列表 IMG_SRX_CN NA 人脸 N/A 中国 NA 2538 张 手机/平板 多种光线 NA NA R
409
他加禄语语音数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 Tagalo_ASR001_CN NA 语料朗读 他加禄语 菲律宾 语音分析 84 68.25小时 电话录音 低背景噪音(家庭/办公室) NA 16 T
492
代码-指令集
文本 添加到咨询列表 ZLCDM_corpus_CN N/A 指令集 中文 中国 N/A 10000条 N/A N/A N/A N/A D
338
伊博语(尼日利亚)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 ibo_NGA_PHON 30 000 发音词典 伊博语 奈及利亚 语言建模 N/A 30,000个单词 N/A N/A N/A N/A Y
322
伊朗波斯语(伊朗)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 pes_IRN_PHON 80 000 发音词典 波斯语 伊朗 语言建模 N/A 80,000个单词 N/A N/A N/A N/A Y
323
伊朗波斯语(伊朗)词性词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 pes_IRN_POS 1 400 000 词性词典 波斯语 伊朗 语言建模 N/A 1,400,000个单词 N/A N/A N/A N/A Y
368
俄罗斯(Russia)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 rus_RUS_PHON 115 000 发音词典 俄语 俄国 语言建模 N/A 115,000个单词 N/A N/A N/A N/A E
222
俄罗斯(Russia)对话式的电话录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 RUS_ASR001 28 284 对话录音 俄语 俄国 语音分析 200 37小时 移动电话和固定电话 低背景噪音 可根据要求提供 8 E
224
俄罗斯(Russia)有定稿的电话录音语料库
音频 ASR, 呼叫中心, 虚拟助手 呼叫中心 ASR 添加到咨询列表 Russian SpeechDat(E) Database 可根据要求提供 有定稿的录音 俄语 俄国 虚拟助手 2 500 180小时 仅固定电话 低背景噪音 112 000 8 E
223
俄罗斯(Russia)有定稿的麦克风录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 RUS_ASR002 可根据要求提供 有定稿的录音 俄语 俄国 聊天机器人 115 31小时 麦克风 低背景噪音(家庭/办公室) 12 205 16 E
236
俄罗斯(Russia)有定稿的麦克风录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 Speecon Russian Database 可根据要求提供 有定稿的录音 俄语 俄国 聊天机器人 600(550个成年语料提供者及50个儿童语料提供者) 46小时 麦克风 混合(办公室/娱乐场所/车内/公共场所) 170 000 16 E
369
俄罗斯(Russia)词性词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 rus_RUS_POS 100 000 词性词典 俄语 俄国 语言建模 N/A 100,000个单词 N/A N/A N/A N/A E
90
俄语NER新闻文本
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 RUS_NER001 NA 俄语 俄国 对话式AI 29,888 句 E
273
俄语NER语料库
文本 NER, 内容分类, 搜索引擎 内容分类 NER 添加到咨询列表 RUS_NER001 可根据要求提供 NER 俄语 俄国 搜索引擎 N/A 29,888个句子 N/A N/A 29 888 N/A E
143
俄语德语女声TTS
音频 添加到咨询列表 ED_TTS001_CN NA TTS 俄语 俄国 NA 2 小时 NA NA NA NA E
413
俄语(俄国)自由说语音数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 RUS_ASR003_CN NA 自由说 俄语(俄国) 俄国 语音分析 32 30.89小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 E
295
保加利亚语(保加利亚)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 bul_BGR_PHON 55 000 发音词典 保加利亚语 保加利亚 语言建模 N/A 55,000个单词 N/A N/A N/A N/A B
150
保加利亚语(保加利亚)对话式的电话录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 BUL_ASR001 22 342 对话录音 保加利亚语 保加利亚 语音分析 217 38小时 移动电话和固定电话 低背景噪音(家庭/办公室) 可根据要求提供 8 B
251
保加利亚语(保加利亚)有定稿的麦克风录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 BUL_ASR002 可根据要求提供 有定稿的录音 保加利亚语 保加利亚 聊天机器人 77 22小时 麦克风 低背景噪音(家庭/办公室) 8 674 16 B
301
克罗地亚语(克罗地亚)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 hrv_HRV_PHON 20 000 发音词典 克罗地亚语 克罗地亚 语言建模 N/A 20,000个单词 N/A N/A N/A N/A K
152
克罗地亚语(克罗地亚)对话式的电话录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 CRO_ASR001 23 919 对话录音 克罗地亚语 克罗地亚 语音分析 200 39小时 移动电话和固定电话 低背景噪音(家庭/办公室) 可根据要求提供 8 K
256
克罗地亚语(克罗地亚)有定稿的智能手机录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 CRO_ASR003_CN 136 140 有定稿的录音 克罗地亚语 克罗地亚 聊天机器人 243 263小时 移动电话 低背景噪音(家庭/办公室) 73 467 16 K
153
克罗地亚语(克罗地亚)有定稿的麦克风录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 CRO_ASR002 可根据要求提供 有定稿的录音 克罗地亚语 克罗地亚 聊天机器人 94 11小时 麦克风 低背景噪音(家庭/办公室) 4 499 16 K
48
公开财务报表采集图片数据
图像 图片标签识别训练 教辅&文档 图片标签识别训练 添加到咨询列表 IMG_OCR_Public financial statements_CN NA OCR 中文 中国 NA 985张 手机/照相机 多种光线 NA NA G
107
兰州方言(含标注)
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 LZ_ASR002_CN NA 有定稿的录音 方言 中国 语音分析 1小时 手机 低背景噪音(家庭/办公室) NA 8 L
405
内蒙古方言(中国)双人对话式录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 NMG_ASR001_CN NA 对话录音 内蒙古族语 中国 语音分析 200 100小时 移动电话 低背景噪音(家庭/办公室) NA 16 Z
46
初中化学采集图片数据
图像 图片标签识别训练 教辅&文档 图片标签识别训练 添加到咨询列表 IMG_OCR_Junior high school chemistry_CN NA OCR 中文 中国 NA 5200张 手机/照相机 多种光线 NA NA C
36
初中物理采集图片数据
图像 图片标签识别训练 教辅&文档 图片标签识别训练 添加到咨询列表 IMG_OCR_Middle School Physics_CN NA OCR 中文 中国 NA 911张 手机/照相机 多种光线 NA NA C
47
初中生物采集图片数据
图像 图片标签识别训练 教辅&文档 图片标签识别训练 添加到咨询列表 IMG_OCR_junior biology_CN NA OCR 中文 中国 NA 6506张 手机/照相机 多种光线 NA NA C
481
初高中化学题
文本 添加到咨询列表 CZHX001_CN N/A 题库 中文 中国 N/A 163804题 N/A N/A N/A N/A C
482
初高中历史题
文本 添加到咨询列表 CZLS001_CN N/A 题库 中文 中国 N/A 84556题 N/A N/A N/A N/A C
485
初高中地理题
文本 添加到咨询列表 GZDL001_CN N/A 题库 中文 中国 N/A 13491题 N/A N/A N/A N/A C
487
初高中政治题
文本 添加到咨询列表 GZZZ001_CN N/A 题库 中文 中国 N/A 66100题 N/A N/A N/A N/A C
484
初高中物理题
文本 添加到咨询列表 CZWL001_CN N/A 题库 中文 中国 N/A 169914题 N/A N/A N/A N/A C
486
初高中物理题
文本 添加到咨询列表 GZWL001_CN N/A 题库 中文 中国 N/A 63572题 N/A N/A N/A N/A C
483
初高中生物题
文本 添加到咨询列表 CZSW001_CN N/A 题库 中文 中国 N/A 86713题 N/A N/A N/A N/A C
480
初高中语文题
文本 添加到咨询列表 CZYW001_CN N/A 题库 中文 中国 N/A 172426题 N/A N/A N/A N/A C
299
加泰罗尼亚语(西班牙)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 cat_ESP_PHON 10 000 发音词典 加泰罗尼亚语 西班牙 语言建模 N/A 10,000个单词 N/A N/A N/A N/A J
455
匈牙利自由说短语流数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 HUN_AKD_ASR001_CN NA 自由说 匈牙利 匈牙利 语音分析 1500+ 66.49小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 X
337
匈牙利语(匈牙利)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 hun_HUN_PHON 500 发音词典 匈牙利语 匈牙利 语言建模 N/A 500个单词 N/A N/A N/A N/A X
259
匈牙利语(匈牙利)有定稿的智能手机录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 HUN_ASR001_CN 201 921 有定稿的录音 匈牙利语 匈牙利 聊天机器人 254 286小时 移动电话 低背景噪音(家庭/办公室) 94 031 16 X
189
匈牙利语(匈牙利)有定稿的电话录音语料库
音频 ASR, 呼叫中心, 虚拟助手 呼叫中心 ASR 添加到咨询列表 Hungarian SpeechDat(E) 可根据要求提供 有定稿的录音 匈牙利语 匈牙利 虚拟助手 1 000 65小时 仅固定电话 低背景噪音 48 000 8 X
5
医疗文本数据库
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 MED_Corpus002_CN NA NA 中文 中国 对话式AI LLM NA 20000对 NA NA NA NA Y
4
医疗问答
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 LLM_YLWD_CN NA NA 中文 中国 对话式AI LLM NA 226000对 NA NA NA NA Y
142
单人录音棚普有定稿的通话
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 LYP_ASR001_CN NA 有定稿的录音 普通话 中国 语音分析 NA 220小时 高保真麦克风 专业录音棚 NA NA D
112
南京方言(含标注)
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 NJ_ASR001_CN NA 有定稿的录音 方言 中国 语音分析 1小时 手机 低背景噪音(家庭/办公室) NA 8 N
124
南昌方言(含标注)
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 NC_ASR002_CN NA 有定稿的录音 方言 中国 语音分析 1小时 手机 低背景噪音(家庭/办公室) NA 8 N
344
卡纳达语(印度)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 kan_IND_PHON 35 000 发音词典 坎那达语 印度 语言建模 N/A 35,000个单词 N/A N/A N/A N/A K
198
卡纳达语(印度)对话式的电话录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 KAN_ASR001 15 660 对话录音 坎那达语 印度 语音分析 178 15小时 移动电话和固定电话 混合 可根据要求提供 8 K
249
卡纳达语(印度)对话式的电话录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 KAN_ASR001A 15 660 对话录音 坎那达语 印度 语音分析 1 000 57小时 移动电话和固定电话 混合 可根据要求提供 8 K
306
卢奥语(肯尼亚)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 luo_KEN_PHON 20 000 发音词典 卢奥语 肯尼亚 语言建模 N/A 20,000个单词 N/A N/A N/A N/A L
96
印地语反向文本规范化
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 HIN_ITN001 NA 印地语 印度 对话式AI 6924 test cases Y
428
印地语自由说语音数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 HINDI_ASR001_CN NA 自由说 印地语 印度 语音分析 6 2.65小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 Y
447
印地语自由说长语流数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 HIN_AKC_ASR001_CN NA 自由说 印地语 印地语 语音分析 400+ 800小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 Y
31
印地语采集图片数据
图像 图片标签识别训练 图片标签识别训练 添加到咨询列表 IMG_OCR_Hindi_CN NA OCR 印地语 印地 NA 467张 手机/照相机 多种光线 NA NA Y
336
印地语(印度)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 hin_IND_PHON 35 000 发音词典 印地语 印度 语言建模 N/A 35,000个单词 N/A N/A N/A N/A Y
188
印地语(印度)对话式的电话录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 HIN_ASR002 12 266 对话录音 印地语 印度 语音分析 996 32小时 移动电话和固定电话 混合 可根据要求提供 8 Y
187
印地语(印度)有定稿的电话录音语料库
音频 ASR, 呼叫中心, 虚拟助手 呼叫中心 ASR 添加到咨询列表 HIN_ASR001 9 853 有定稿的录音 印地语 印度 虚拟助手 1 920 224小时 移动电话 低背景噪音 96 000 8 Y
291
印尼文(印度尼西亚)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 ind_IDN_PHON 95 000 发音词典 印度尼西亚语 印度尼西亚 语言建模 N/A 95,000个单词 N/A N/A N/A N/A Y
292
印尼文(印度尼西亚)词性词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 ind_IDN_POS 10 000 词性词典 印度尼西亚语 印度尼西亚 语言建模 N/A 10,000个单词 N/A N/A N/A N/A Y
73
印尼朗读视频
视频 添加到咨询列表 VED_IND_READ_CN NA 人像视频 印尼语 印尼 NA 20分钟/人,15人 NA NA NA NA Y
456
印尼自由说短语流数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 IND_AKD_ASR001_CN NA 自由说 印尼语 印尼 语音分析 1500+ 83.37小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 Y
139
印尼语对话数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 IND_DH_ASR001_CN NA 对话 印尼语 印尼 语音分析 NA 250小时 手机 低背景噪音(家庭/办公室) NA NA Y
138
印尼语朗读数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 IND_LD_ASR001_CN NA 有定稿的录音 印尼语 印尼 语音分析 NA 250小时 手机 低背景噪音(家庭/办公室) NA NA Y
430
印尼语自由说语音数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 IND_ASR001_CN NA 自由说 印尼语 印尼 语音分析 7 3.77小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 Y
146
印尼语(印度尼西亚)对话式的电话录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 BAH_ASR001 11 480 对话录音 印度尼西亚语 印度尼西亚 语音分析 1 002 31小时 移动电话和固定电话 低背景噪音 可根据要求提供 8 Y
133
厦门方言(含标注)
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 XM_ASR002_CN NA 有定稿的录音 方言 中国 语音分析 10小时 手机 低背景噪音(家庭/办公室) NA 8 X
14
台湾有字幕视频
视频 NA 添加到咨询列表 TAIWAN_AUD001_CN NA 有字幕视频 台湾 台湾语 NA 23838小时 NA NA NA NA T
423
台湾自由说语音数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 TAIWAN_ASR001_CN NA 自由说 台湾 中国 语音分析 10 3.12小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 Z
113
合肥方言(含标注)
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 HF_ASR002_CN NA 有定稿的录音 方言 中国 语音分析 1小时 手机 低背景噪音(家庭/办公室) NA 8 H
395
吴语(中国)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 wuu_CHN_PHON 10 000 发音词典 吴语 中国 语言建模 N/A 10,000个单词 N/A N/A N/A N/A W
457
哈萨克斯坦自由说短语流数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 KAZ_AKD_ASR001_CN NA 自由说 哈萨克斯坦 哈萨克斯坦 语音分析 1500+ 139.46小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 H
345
哈萨克语(哈萨克斯坦)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 kaz_KAZ_PHON 30 000 发音词典 哈萨克语 哈萨克斯坦 语言建模 N/A 30,000个单词 N/A N/A N/A N/A H
17
商务印刷文本OCR
图像 图片标签识别训练 图片标签识别训练 添加到咨询列表 IMG_OCR_B2B NA OCR N/A 多国 NA 5,832 documents 手机/照相机 多种光线 NA NA S
18
商务客户印刷文本OCR
图像 图片标签识别训练 图片标签识别训练 添加到咨询列表 IMG_OCR_B2C_Other NA OCR N/A 多国 NA 22,626 documents 手机/照相机 多种光线 NA NA S
50
商品标签,商品清单采集图片数据
图像 图片标签识别训练 教辅&文档 图片标签识别训练 添加到咨询列表 IMG_OCR_Product label_CN NA OCR 中文 中国 NA 5352张 手机/照相机 多种光线 NA NA S
79
商用版权 艺术照
图像 图片标签识别训练 图片标签识别训练 添加到咨询列表 IMG_YSZ_CN NA NA 中文 中国 NA TBD 照相机 多种光线 NA NA S
75
喉结视频采集
视频 添加到咨询列表 VED_HJ_CN NA 人像视频 NA NA NA 200ID,2500S NA NA NA NA H
125
嘉兴方言(含标注)
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 JX_ASR002_CN NA 有定稿的录音 方言 中国 语音分析 1小时 手机 低背景噪音(家庭/办公室) NA 8 J
137
四川方言短语
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 SCYF_ASR001_CN NA 有定稿的录音 方言 中国 语音分析 80000 scripts 手机 低背景噪音(家庭/办公室) 80000 scripts 16 S
427
四川语音数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 SICHUAN_ASR001_CN NA 语料朗读 四川 中国 语音分析 8 3.86小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 Z
495
回复安全性的文本-指令集
文本 添加到咨询列表 ZLCAQ_corpus_CN N/A 指令集 中文 中国 N/A 10000条 N/A N/A N/A N/A H
389
土耳其语(土耳其)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 tur_TUR_PHON 255 000 发音词典 土耳其语 土耳其 语言建模 N/A 255,000个单词 N/A N/A N/A N/A T
242
土耳其语(土耳其)对话式的电话录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 TUR_ASR001 32 386 对话录音 土耳其语 土耳其 语音分析 200 41小时 移动电话和固定电话 低背景噪音 可根据要求提供 8 T
261
土耳其语(土耳其)有定稿的智能手机录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 TUR_ASR003_CN 215 135 有定稿的录音 土耳其语 土耳其 聊天机器人 664 739小时 移动电话 低背景噪音(家庭/办公室) 185 706 16 T
209
土耳其语(土耳其)电话录音语料库
音频 ASR, 呼叫中心, 虚拟助手 呼叫中心 ASR 添加到咨询列表 OrienTel Turkish Database 可根据要求提供 有定稿的录音 土耳其语 土耳其 虚拟助手 1 700 118小时 移动电话和固定电话 低背景噪音 76 500 8 T
390
土耳其语(土耳其)词性词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 tur_TUR_POS 257 000 词性词典 土耳其语 土耳其 语言建模 N/A 257,000个单词 N/A N/A N/A N/A T
243
土耳其语(土耳其)麦克风录音数据库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 TUR_ASR002 可根据要求提供 有定稿的录音 土耳其语 土耳其 聊天机器人 100 17小时 麦克风 低背景噪音(家庭/办公室) 6 950 16 T
384
塔加洛语(菲律宾)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 tgl_PHL_PHON 30 000 发音词典 塔加拉族语 菲律宾 语言建模 N/A 30,000个单词 N/A N/A N/A N/A T
370
塞尔维亚语(塞尔维亚)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 srp_SRB_PHON 15 000 发音词典 塞尔维亚语 塞尔维亚 语言建模 N/A 15,000个单词 N/A N/A N/A N/A S
383
塞海蒂语(孟加拉国-印度)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 syl_BGD -IND_PHON 22 000 发音词典 塞海蒂语 孟加拉国-印度 语言建模 N/A 22,000个单词 N/A N/A N/A N/A S
408
外国人说中文语音数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 FOREIGNER_ASR001_CN NA 有定稿的录音 中文(外国人) 多国 语音分析 200 200小时 移动电话 低背景噪音(家庭/办公室) NA 16 Z
410
多姿态多光线人像图片数据库
图像 图片标签识别训练 图片标签识别训练 添加到咨询列表 IMG_BODY_POSE_CN NA 物体图片 N/A 多国 NA 680张 手机/照相机 多种光线 NA NA Z
407
多标签图片数据库
图像 图片标签识别训练 图片标签识别训练 添加到咨询列表 IMG_TAG_CN NA 物体图片 N/A NA 2196 张 手机/照相机 多种光线 NA NA Z
68
多模态(3D 人脸)
视频 添加到咨询列表 VED_3D Face_CN NA 人像视频 N/A 中国 NA 50 ID NA NA NA NA D
28
多种车牌处理
图像 图片标签识别训练 图片标签识别训练 添加到咨询列表 IMG_CAR_License plate processing NA 中文 中国 NA 5754张 手机/照相机 多种光线 NA NA D
490
多轮对话-指令集
文本 添加到咨询列表 ZLCDH_corpus_CN N/A 指令集 中文 中国 N/A 40000条 N/A N/A N/A N/A D
86
多音字数据库​
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 DYZ_corpus001_CN NA 中文 中国 对话式AI 2000000 words 59字 D
472
大模型文本成品数据集
文本 ASR, TTS, 语言建模 添加到咨询列表 DMXWB_corpus_CN N/A NA 普通话 中国 N/A 20000条 N/A N/A N/A N/A D
109
天津方言(含标注)
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 TJ_ASR002_CN NA 有定稿的录音 方言 中国 语音分析 1小时 手机 低背景噪音(家庭/办公室) NA 8 T
135
太原方言(含标注)
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 TY_ASR002_CN NA 有定稿的录音 方言 中国 语音分析 1小时 手机 低背景噪音(家庭/办公室) NA 8 T
493
头脑风暴-指令集
文本 添加到咨询列表 ZLCTN_corpus_CN N/A 指令集 中文 中国 N/A 10000条 N/A N/A N/A N/A T
359
奥里雅语(印度)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 ori_IND_PHON 15 000 发音词典 奥里雅语 印度 语言建模 N/A 15,000个单词 N/A N/A N/A N/A A
11
婴儿哭声数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 BABY_CRYING_ASR001_CN NA 自由说 中国 中国 语音分析 566 70小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 Y
264
婴幼儿啼哭语料库
音频 婴儿监控器, 安全及其他消费者应用程序 安全及其他消费者应用程序 婴儿监控器 添加到咨询列表 CRY_ASR001 NA 人声 N/A 中国 100 3小时 移动电话 低背景噪音(家庭/办公室) NA 16 Z
453
孟加拉自由说短语流数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 BAN_AKD_ASR001_CN NA 自由说 孟加拉 孟加拉 语音分析 1500+ 265.26小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 M
294
孟加拉语(印度)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 ben_IND_PHON 29 000 发音词典 孟加拉语 印度 语言建模 N/A 29,000个单词 N/A N/A N/A N/A M
149
孟加拉语(孟加拉国)对话式的电话录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 BEN_ASR001 17 922 对话录音 孟加拉语 孟加拉国 语音分析 1 000 47小时 移动电话和固定电话 混合(车内/路边/家庭/办公室) 可根据要求提供 8 M
44
学术论文采集图片数据
图像 图片标签识别训练 教辅&文档 图片标签识别训练 添加到咨询列表 IMG_OCR_Academic papers_CN NA OCR 中文 中国 NA 434张 手机/照相机 多种光线 NA NA X
126
宁波方言(含标注)
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 NB_ASR002_CN NA 有定稿的录音 方言 中国 语音分析 1小时 手机 低背景噪音(家庭/办公室) NA 8 N
21
宠物图片
图像 图片标签识别训练 图片标签识别训练 添加到咨询列表 IMG_OCR_pet_CN NA 中文 中国 NA 42764 张 手机/照相机 多种光线 NA NA C
10
宠物婴儿双模OMS数据库
视频 添加到咨询列表 VED_P&B_CN NA 人像视频 N/A 中国 NA 120 ID NA NA NA NA C
25
宠物婴儿双模图像数据库
图像 图片标签识别训练 图片标签识别训练 添加到咨询列表 IMG_Pets&Babies_CN NA 中文 多国 NA 120ID 手机/照相机 多种光线 NA NA C
114
宿迁方言(含标注)
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 SQ_ASR002_CN NA 有定稿的录音 方言 中国 语音分析 1小时 手机 低背景噪音(家庭/办公室) NA 8 S
300
宿雾语(菲律宾)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 ceb_PHL_PHON 20 000 发音词典 宿雾语 菲律宾 语言建模 N/A 20,000个单词 N/A N/A N/A N/A S
42
小学中文作文采集图片数据
图像 图片标签识别训练 教辅&文档 图片标签识别训练 添加到咨询列表 IMG_OCR_Elementary school Chinese composition_CN NA OCR 中文 中国 NA 453张 手机/照相机 多种光线 NA NA X
37
小学数学采集图片数据
图像 图片标签识别训练 教辅&文档 图片标签识别训练 添加到咨询列表 IMG_OCR_Elementary Mathematics_CN NA OCR 中文 中国 NA 2651张 手机/照相机 多种光线 NA NA X
41
小学英语作文采集图片数据
图像 图片标签识别训练 教辅&文档 图片标签识别训练 添加到咨询列表 IMG_OCR_Elementary school English composition_CN NA OCR 中文 中国 NA 717张 手机/照相机 多种光线 NA NA X
52
小学英语辅导采集图片数据
图像 图片标签识别训练 教辅&文档 图片标签识别训练 添加到咨询列表 IMG_OCR_English Tutoring_CN NA OCR 中文 中国 NA 1333张 手机/照相机 多种光线 NA NA X
53
小学语文辅导采集图片数据
图像 图片标签识别训练 教辅&文档 图片标签识别训练 添加到咨询列表 IMG_OCR_Chinese tutoring_CN NA OCR 中文 中国 NA 4082张 手机/照相机 多种光线 NA NA X
51
小学速算采集图片数据
图像 图片标签识别训练 教辅&文档 图片标签识别训练 添加到咨询列表 IMG_OCR_quick calculation_CN NA OCR 中文 中国 NA 16331张 手机/照相机 多种光线 NA NA X
460
尼泊尔自由说短语流数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 NEP_AKD_ASR001_CN NA 自由说 尼泊尔 尼泊尔 语音分析 1500+ 164.28小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 N
293
巴斯克(西班牙)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 eus_ESP_PHON 10 000 发音词典 巴斯克语 西班牙 语言建模 N/A 10,000个单词 N/A N/A N/A N/A B
335
希伯来语(以色列)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 heb_ISR_PHON 31 000 发音词典 希伯来语 以色列 语言建模 N/A 31,000个单词 N/A N/A N/A N/A X
186
希伯来语(以色列)对话式的电话录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 HEB_ASR001 19 250 对话录音 希伯来语 以色列 语音分析 200 34小时 移动电话和固定电话 低背景噪音 可根据要求提供 8 X
331
希腊语(希腊)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 ell_GRC_PHON 5 000 发音词典 希腊语 希腊 语言建模 N/A 5,000个单词 N/A N/A N/A N/A X
258
希腊语(希腊)有定稿的智能手机录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 GRE_ASR001_CN 68 271 有定稿的录音 希腊语 希腊 聊天机器人 287 191小时 移动电话 低背景噪音(家庭/办公室) 54 113 16 X
127
常州方言(含标注)
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 CHANGZHOU_ASR002_CN NA 有定稿的录音 方言 中国 语音分析 1小时 手机 低背景噪音(家庭/办公室) NA 8 C
296
广东话(中国)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 yue_CHN_PHON 37 000 发音词典 广东话 (粤语) 中国 语言建模 N/A 37,000个单词 N/A N/A N/A N/A G
297
广东话(中国)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 yue_CHN_PHON 40 000 发音词典 广东话 (粤语) 中国 语言建模 N/A 40,000个单词 N/A N/A N/A N/A G
298
广东话(中国)词性词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 yue_HKG_POS 10 000 词性词典 广东话 (粤语) 中国 语言建模 N/A 10,000个单词 N/A N/A N/A N/A G
422
广东语音数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 GUANGDONG_ASR001_CN NA 语料朗读 广东 中国 语音分析 8 4.06小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 Z
123
广州方言(含标注)
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 GZ_ASR002_CN NA 有定稿的录音 方言 中国 语音分析 10小时 手机 低背景噪音(家庭/办公室) NA 8 G
348
库尔曼吉(土耳其)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 kur_TUR_PHON 60 000 发音词典 库尔德语 土耳其 语言建模 N/A 60,000个单词 N/A N/A N/A N/A K
76
开源数据爬取(parquet文件)
图像 图片标签识别训练 图片标签识别训练 添加到咨询列表 IMG_PARQUET_CN NA NA 中文 中国 LLM NA 100000+ NA NA NA NA K
411
德语 (德国)自由说语音数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 DEU_ASR004_CN NA 自由说 德语 (德国) 德国 语音分析 80 20.19小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 D
97
德语反向文本规范化
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 DEU_ITN001 NA 德语 德国 对话式AI 8001 test cases D
12
德语有字幕视频
视频 NA 添加到咨询列表 ESP_AUD001_CN NA 有字幕视频 西班牙 西班牙 NA 10261 小时 NA NA NA NA D
30
德语语采集图片数据
图像 图片标签识别训练 图片标签识别训练 添加到咨询列表 IMG_OCR_Germany_CN NA OCR 德语 德国 NA 636张 手机/照相机 多种光线 NA NA D
201
德语(卢森堡)电话录音语料库
音频 ASR, 呼叫中心, 虚拟助手 呼叫中心 ASR 添加到咨询列表 Luxembourgish German SpeechDat(II) FDB-500 (FIXED1LG) 可根据要求提供 有定稿的录音 德语 卢森堡 虚拟助手 500 33小时 仅固定电话 低背景噪音 26 500 8 D
208
德语(土耳其)电话录音语料库
音频 ASR, 呼叫中心, 虚拟助手 呼叫中心 ASR 添加到咨询列表 OrienTel German Spoken by Turkish 可根据要求提供 有定稿的录音 德语 土耳其 虚拟助手 300 31小时 移动电话和固定电话 低背景噪音 15 600 8 D
329
德语(德国)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 deu_DEU_PHON 146 000 发音词典 德语 德国 语言建模 N/A 146,000个单词 N/A N/A N/A N/A D
438
德语(德国)对话式智能手机
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 DEU_ASR004 NA 对话 德语 德国 语音分析 NA 100 小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 D
158
德语(德国)有定稿的麦克风录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 DEU_ASR001 6 826 有定稿的录音 德语 德国 聊天机器人 127 16小时 麦克风 低背景噪音(录音棚) 12 700 16 D
159
德语(德国)有定稿的麦克风录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 DEU_ASR003 可根据要求提供 有定稿的录音 德语 德国 聊天机器人 77 25小时 麦克风 低背景噪音(家庭/办公室) 10 085 16 D
182
德语(德国)电话录音语料库
音频 ASR, 呼叫中心, 虚拟助手 呼叫中心 ASR 添加到咨询列表 German SpeechDat (II) FDB-1000 可根据要求提供 有定稿的录音 德语 德国 虚拟助手 988 31小时 仅固定电话 低背景噪音(家庭/办公室) 43 000 8 D
183
德语(德国)电话录音语料库
音频 ASR, 呼叫中心, 虚拟助手 呼叫中心 ASR 添加到咨询列表 German SpeechDat(II) FDB-4000 可根据要求提供 有定稿的录音 德语 德国 虚拟助手 4 000 268小时 仅固定电话 低背景噪音(家庭/办公室) 160 000 8 D
330
德语(瑞士)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 deu_CHE_PHON 15 000 发音词典 德语 瑞士 语言建模 N/A 15,000个单词 N/A N/A N/A N/A D
234
德语(瑞士)有定稿的麦克风录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 Speecon German (Switzerland) database 可根据要求提供 有定稿的录音 德语 瑞士 聊天机器人 600(550个成年语料提供者及50个儿童语料提供者) 53小时 麦克风 混合(办公室/娱乐场所/车内/公共场所) 170 000 16 D
440
意大利会话智能手机
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 ITA_ASR005 NA 对话 意大利 意大利 语音分析 NA 250 小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 Y
339
意大利文(意大利)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 ita_ITA_PHON 197 000 发音词典 意大利语 意大利 语言建模 N/A 197,000个单词 N/A N/A N/A N/A Y
192
意大利文(意大利)对话式的电话录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 ITA_ASR003 18 974 对话录音 意大利语 意大利 语音分析 200 36小时 移动电话和固定电话 低背景噪音 可根据要求提供 8 Y
190
意大利文(意大利)有定稿的麦克风录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 ITA_ASR001 7 316 有定稿的录音 意大利语 意大利 聊天机器人 200 44小时 麦克风 混合 40 000 22 Y
191
意大利文(意大利)有定稿的麦克风录音语料库
音频 ASR, 虚拟助手, 车载HMI及娱乐设备 虚拟助手 ASR 添加到咨询列表 ITA_ASR002 10 366 有定稿的录音 意大利语 意大利 车载HMI及娱乐设备 103 47小时 麦克风 混合(车内) 35 875 48 Y
193
意大利文(意大利)有定稿的麦克风录音语料库
音频 TTS TTS 添加到咨询列表 ITA_TTS001 可根据要求提供 有定稿的录音 意大利语 意大利 1 3小时 麦克风 低背景噪音(录音棚) 3 300 22 Y
194
意大利文(意大利)电话录音语料库
音频 ASR, 呼叫中心, 虚拟助手 呼叫中心 ASR 添加到咨询列表 Italian Fixed Network Speech SpeechDat(M) Corpus 可根据要求提供 有定稿的录音 意大利语 意大利 虚拟助手 1 000 38小时 仅固定电话 低背景噪音(家庭/办公室) 39 000 8 Y
195
意大利文(意大利)电话录音语料库
音频 ASR, 呼叫中心, 虚拟助手 呼叫中心 ASR 添加到咨询列表 Italian SpeechDat(II) FDB-3000 可根据要求提供 有定稿的录音 意大利语 意大利 虚拟助手 3 040 228小时 仅固定电话 低背景噪音(家庭/办公室) 134 000 8 Y
196
意大利文(意大利)电话录音语料库
音频 ASR, 呼叫中心, 虚拟助手 呼叫中心 ASR 添加到咨询列表 Italian SpeechDat(II) MDB-250 可根据要求提供 有定稿的录音 意大利语 意大利 虚拟助手 375 103小时 移动电话 低背景噪音(家庭/办公室) 19 000 8 Y
229
意大利文(意大利)电话录音语料库
音频 ASR, 呼叫中心, 虚拟助手 呼叫中心 ASR 添加到咨询列表 SpeechDat(M) Italian Mobile Network Speech Database 可根据要求提供 有定稿的录音 意大利语 意大利 虚拟助手 342 13小时 移动电话 低背景噪音(家庭/办公室) 13 500 8 Y
340
意大利文(意大利)词性词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 ita_ITA_POS 147 000 词性词典 意大利语 意大利 语言建模 N/A 147,000个单词 N/A N/A N/A N/A Y
434
意大利自由说语语音数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 ITA_ASR001_CN NA 自由说 意大利语 意大利 语音分析 6 3.8小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 Y
119
成都方言(含标注)
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 CD_ASR002_CN NA 有定稿的录音 方言 中国 语音分析 10小时 手机 低背景噪音(家庭/办公室) NA 8 C
81
户型图
图像 图片标签识别训练 图片标签识别训练 添加到咨询列表 IMG_HXT_CN NA NA N/A 中国 NA 10000张 NA NA NA NA H
19
手写体
图像 图片标签识别训练 图片标签识别训练 添加到咨询列表 IMG_OCR_Handwritten NA OCR N/A 多国 NA 964 张 手机/照相机 多种光线 NA NA S
388
托皮辛(巴布亚新几内亚)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 tpi_PNG_PHON 10 000 发音词典 托克皮辛语 巴布亚新几内亚 语言建模 N/A 10,000个单词 N/A N/A N/A N/A T
102
拉丁美洲西班牙语反向文本规范化
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 SPA_ITN001 NA 西班牙语 西班牙 对话式AI 3795 test cases L
458
拉脱维亚自由说短语流数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 LAT_AKD_ASR001_CN NA 自由说 拉脱维亚 拉脱维亚 语音分析 1500+ 30.1小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 L
357
挪威语(挪威)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 nor_NOR_PHON 115 000 发音词典 挪威语 挪威 语言建模 N/A 115,000个单词 N/A N/A N/A N/A N
358
挪威语(挪威)词性词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 nor_NOR_POS 3 000 词性词典 挪威语 挪威 语言建模 N/A 3,000个单词 N/A N/A N/A N/A N
302
捷克文(捷克共和国)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 ces_CZE_PHON 50 000 发音词典 捷克语 捷克共和国 语言建模 N/A 50,000个单词 N/A N/A N/A N/A J
155
捷克文(捷克共和国)有定稿的电话录音语料库
音频 ASR, 呼叫中心, 虚拟助手 呼叫中心 ASR 添加到咨询列表 Czech SpeechDat(E) Dataset 可根据要求提供 有定稿的录音 捷克语 捷克共和国 虚拟助手 1 000 93小时 仅固定电话 低背景噪音 52 000 8 J
154
捷克文(捷克共和国)有定稿的麦克风录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 CZE_ASR001 可根据要求提供 有定稿的录音 捷克语 捷克共和国 聊天机器人 102 31小时 麦克风 低背景噪音(家庭/办公室) 12 425 16 J
54
政法相关采集图片数据
图像 图片标签识别训练 教辅&文档 图片标签识别训练 添加到咨询列表 IMG_OCR_politics and law_CN NA OCR 中文 中国 NA 106张 手机/照相机 多种光线 NA NA Z
45
教育教辅采集图片数据
图像 图片标签识别训练 教辅&文档 图片标签识别训练 添加到咨询列表 IMG_OCR_Educational aids_CN NA OCR 中文 中国 NA 12940张 手机/照相机 多种光线 NA NA J
473
数学题库(小学1484份试卷;初中1082份试卷;高中份338试卷)
文本 ASR, TTS, 语言建模 添加到咨询列表 SXTK_json_CN N/A NA 普通话 中国 N/A 2904份 N/A N/A N/A N/A S
494
文本改写-指令集
文本 添加到咨询列表 ZLCGX_corpus_CN N/A 指令集 中文 中国 N/A 10000条 N/A N/A N/A N/A W
496
文本生成-指令集
文本 添加到咨询列表 ZLCWB_corpus_CN N/A 指令集 中文 中国 N/A 20000条 N/A N/A N/A N/A W
225
斯洛伐克(Slovakia)有定稿的电话录音语料库
音频 ASR, 呼叫中心, 虚拟助手 呼叫中心 ASR 添加到咨询列表 Slovak SpeechDat(E) Database 可根据要求提供 有定稿的录音 斯洛伐克语 斯洛伐克 虚拟助手 1 000 65小时 仅固定电话 低背景噪音 48 000 8 S
226
斯洛文尼亚语(Slovenian)电话录音语料库
音频 ASR, 呼叫中心, 虚拟助手 呼叫中心 ASR 添加到咨询列表 Slovenian SpeechDat(II) FDB-1000 可根据要求提供 有定稿的录音 斯洛维尼亚语 斯洛文尼亚 虚拟助手 1 000 76小时 仅固定电话 低背景噪音(家庭/办公室) 40 000 8 S
380
斯瓦希里语(肯尼亚)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 swa_KEN_PHON 66 000 发音词典 斯瓦西里语 肯尼亚 语言建模 N/A 66,000个单词 N/A N/A N/A N/A S
220
旁遮普语(巴基斯坦)对话式的电话录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 PAP_ASR001 7 298 对话录音 旁遮普语 巴基斯坦 语音分析 205 20小时 移动电话和固定电话 低背景噪音 可根据要求提供 8 P
128
无锡方言(含标注)
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 WX_ASR002_CN NA 有定稿的录音 方言 中国 语音分析 1小时 手机 低背景噪音(家庭/办公室) NA 8 W
93
日语NER新闻文本
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 JPY_NER001 NA 日语 日本 对话式AI 20,629 句 R
276
日语NER语料库
文本 NER, 内容分类, 搜索引擎 内容分类 NER 添加到咨询列表 JPY_NER001 可根据要求提供 NER 日语 日本 搜索引擎 N/A 20,629个句子 N/A N/A 20 629 N/A R
27
日语OCR发票数据库
图像 图片标签识别训练 图片标签识别训练 添加到咨询列表 IMG_JP OCR Invoices_CN NA OCR 日本 日本 NA 1000张 手机/照相机 多种光线 NA NA R
100
日语反向文本规范化
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 JPN_ITN001 NA 日语 日本 对话式AI 5363 test cases R
429
日语自由说语音数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 JAP_ASR001_CN NA 自由说 日语 日本 语音分析 6 3.38小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 R
341
日语(日本)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 jpn_JPN_PHON 262 000 发音词典 日语 日本 语言建模 N/A 262,000个单词 N/A N/A N/A N/A R
197
日语(日本)有定稿的麦克风录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 JPN_ASR001 可根据要求提供 有定稿的录音 日语 日本 聊天机器人 144 33小时 麦克风 低背景噪音(家庭/办公室) 13 067 16 R
235
日语(日本)有定稿的麦克风录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 Speecon Japanese 可根据要求提供 有定稿的录音 日语 日本 聊天机器人 600(550个成年语料提供者及50个儿童语料提供者) 57小时 麦克风 混合(办公室/娱乐场所/车内/公共场所) 170 000 16 R
342
日语(日本)词性词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 jpn_JPN_POS 265 000 词性词典 日语 日本 语言建模 N/A 265,000个单词 N/A N/A N/A N/A R
120
昆明方言(含标注)
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 KM_ASR002_CN NA 有定稿的录音 方言 中国 语音分析 1小时 手机 低背景噪音(家庭/办公室) NA 8 K
425
昆明语音数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 KUNMING_ASR001_CN NA 语料朗读 昆明 中国 语音分析 8 2.53小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 Z
360
普什图(阿富汗)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 pus_AFG_PHON 65 000 发音词典 普什图语 阿富汗 语言建模 N/A 65,000个单词 N/A N/A N/A N/A P
212
普什图(阿富汗)对话式的电话录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 PAS_ASR001 13 633 对话录音 普什图语 阿富汗 语音分析 967 55小时 移动电话和固定电话 低背景噪音 可根据要求提供 8 P
213
普什图(阿富汗)对话式麦克风录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 PAS_ASR002 9 480 对话录音 普什图语 阿富汗 语音分析 40 39小时 麦克风 低背景噪音 可根据要求提供 16 P
214
普什图(阿富汗)广播录音数据库
音频 ASR, 自动字幕, 关键字检索 自动字幕 ASR 添加到咨询列表 PAS_BRC001 可根据要求提供 广播录音 普什图语 阿富汗 关键字检索 N/A 51小时 麦克风 低背景噪音(录音棚) 可根据要求提供 N/A P
101
普通话-汉语逆文本规范化
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 CMN_ITN001 NA 中文 中国 对话式AI 4230 test cases P
91
普通话NER新闻文本
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 MAC_NER001 NA 中文 中国 对话式AI 17,313 句 P
274
普通话NER语料库
文本 NER, 内容分类, 搜索引擎 内容分类 NER 添加到咨询列表 MAC_NER001 可根据要求提供 NER 普通话 中国 搜索引擎 N/A 17,313个句子 N/A N/A 17 313 N/A P
202
普通话(中国)有定稿的电话录音语料库
音频 ASR, 呼叫中心, 虚拟助手 呼叫中心 ASR 添加到咨询列表 MAC_ASR001 7 145 有定稿的录音 普通话 中国 虚拟助手 2 000 323小时 移动电话和固定电话 混合 200 000 8 P
203
普通话(中国)有定稿的麦克风录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 MAC_ASR002 可根据要求提供 有定稿的录音 普通话 中国 聊天机器人 132 26小时 麦克风 低背景噪音(家庭/办公室) 10 225 16 P
108
普通话(含标注)
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 PTH_ASR002_CN NA 有定稿的录音 方言 中国 语音分析 10小时 手机 低背景噪音(家庭/办公室) NA 8 P
353
普通话(简体)(中国)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 zho_CHN_PHON 35 000 发音词典 中文(简体) 中国 语言建模 N/A 35,000个单词 N/A N/A N/A N/A P
354
普通话(繁体)(台湾)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 zho_TWN_PHON 50 000 发音词典 中文(繁体) 台湾 语言建模 N/A 50,000个单词 N/A N/A N/A N/A P
417
杭州方言语音数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 HANGZHOU_ASR001_CN NA 语料朗读 杭州方言 中国 语音分析 10 2.49小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 Z
129
杭州方言(含标注)
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 HZ_ASRNN2_CN NA 有定稿的录音 方言 中国 语音分析 10小时 手机 低背景噪音(家庭/办公室) NA 8 H
134
梅州方言(含标注)
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 MZ_ASR002_CN NA 有定稿的录音 方言 中国 语音分析 1小时 手机 低背景噪音(家庭/办公室) NA 8 M
403
武汉方言(中国)多人对话式录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 WUHAN_ASR001_CN NA 对话录音 武汉方言 中国 语音分析 135 42.7小时 录音笔/麦克风 低背景噪音(家庭/办公室) NA 16 Z
404
武汉方言(中国)多人对话式录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 WUHAN_ASR002_CN NA 对话录音 武汉方言 中国 语音分析 180 58.1小时 移动电话 低背景噪音(家庭/办公室) NA 8 Z
424
武汉语音数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 WUHAN_ASR003_CN NA 语料朗读 武汉 中国 语音分析 8 3.19小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 Z
419
河南语音数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 HENAN_ASR001_CN NA 语料朗读 河南 中国 语音分析 7 2.9小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 Z
3
法律问答
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 LLM_FLWD_CN NA NA 中文 中国 对话式AI LLM NA 26000对 NA NA NA NA F
412
法语 (法国)自由说语音数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 FRA_ASR004_CN NA 自由说 法语 (法国) 法国 语音分析 96 16.6小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 F
99
法语反向文本规范化
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 FRA_ITN001 NA 法语 法国 对话式AI 3274 test cases F
29
法语语采集图片数据
图像 图片标签识别训练 图片标签识别训练 添加到咨询列表 IMG_OCR_French_CN NA OCR 法语 法国 NA 1135张 手机/照相机 多种光线 NA NA F
326
法语(加拿大)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 fra_CAN_PHON 67 000 发音词典 法语 加拿大 语言建模 N/A 67,000个单词 N/A N/A N/A N/A F
176
法语(加拿大)对话式的电话录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 FRC_ASR003 6 022 对话录音 法语 加拿大 语音分析 68 9小时 移动电话和固定电话 混合 可根据要求提供 8 F
174
法语(加拿大)有定稿的电话录音语料库
音频 ASR, 呼叫中心, 虚拟助手 呼叫中心 ASR 添加到咨询列表 FRC_ASR001 11 697 有定稿的录音 法语 加拿大 虚拟助手 1 000 131小时 移动电话 混合 100 000 8 F
175
法语(加拿大)有定稿的麦克风录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 FRC_ASR002 10 755 有定稿的录音 法语 加拿大 聊天机器人 150 46小时 麦克风 低背景噪音(家庭/办公室) 22 500 16 F
200
法语(卢森堡)电话录音语料库
音频 ASR, 呼叫中心, 虚拟助手 呼叫中心 ASR 添加到咨询列表 Luxembourgish French SpeechDat(II) FDB-500 (FIXED1LF) 可根据要求提供 有定稿的录音 法语 卢森堡 虚拟助手 614 45小时 仅固定电话 低背景噪音 32 000 8 F
148
法语(比利时)有定稿的电话录音语料库
音频 ASR, 呼叫中心, 虚拟助手 呼叫中心 ASR 添加到咨询列表 Belgian French SpeechDat(II) FDB-1000 (FIXED1BF) 可根据要求提供 有定稿的录音 法语 比利时 虚拟助手 1 000 76小时 仅固定电话 低背景噪音 53 000 8 F
439
法语(法国)会话智能手机
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 FRF_ASR004 NA 对话 法语 法国 语音分析 NA 150 小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 F
327
法语(法国)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 fra_FRA_PHON 112 000 发音词典 法语 法国 语言建模 N/A 112,000个单词 N/A N/A N/A N/A F
180
法语(法国)对话式的电话录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 FRF_ASR001 11 922 对话录音 法语 法国 语音分析 563 25小时 移动电话和固定电话 低背景噪音 可根据要求提供 8 F
177
法语(法国)有定稿的电话录音语料库
音频 ASR, 呼叫中心, 虚拟助手 呼叫中心 ASR 添加到咨询列表 French SpeechDat(II) FDB-1000 可根据要求提供 有定稿的录音 法语 法国 虚拟助手 1 017 41小时 仅固定电话 低背景噪音(家庭/办公室) 48 000 8 F
178
法语(法国)有定稿的电话录音语料库
音频 ASR, 呼叫中心, 虚拟助手 呼叫中心 ASR 添加到咨询列表 French SpeechDat(II) FDB-5000 可根据要求提供 有定稿的录音 法语 法国 虚拟助手 5 040 305小时 仅固定电话 低背景噪音 237 000 8 F
181
法语(法国)有定稿的麦克风录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 FRF_ASR003 可根据要求提供 有定稿的录音 法语 法国 聊天机器人 98 26小时 麦克风 低背景噪音(家庭/办公室) 10 273 16 F
328
法语(法国)词性词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 fra_FRA_POS 95 000 词性词典 法语 法国 语言建模 N/A 95,000个单词 N/A N/A N/A N/A F
179
法语(法国)车内录音语料库
音频 ASR, 虚拟助手, 车载HMI及娱乐设备 虚拟助手 ASR 添加到咨询列表 French SpeechDat-Car 可根据要求提供 有定稿的录音 法语 法国 车载HMI及娱乐设备 300 麦克风和移动电话 混合(车内) 37 500 16和8 F
285
法语(阿尔及利亚)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 fra_DZA_PHON 4 000 发音词典 法语 阿尔及利亚 语言建模 N/A 4,000个单词 N/A N/A N/A N/A F
361
波兰语(波兰)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 pol_POL_PHON 40 000 发音词典 波兰语 波兰 语言建模 N/A 40,000个单词 N/A N/A N/A N/A B
260
波兰语(波兰)有定稿的智能手机录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 POL_ASR002_CN 168 544 有定稿的录音 波兰语 波兰 聊天机器人 353 293小时 移动电话 低背景噪音(家庭/办公室) 106 674 16 B
216
波兰语(波兰)有定稿的电话录音语料库
音频 ASR, 呼叫中心, 虚拟助手 呼叫中心 ASR 添加到咨询列表 Polish SpeechDat(E) Database 可根据要求提供 有定稿的录音 波兰语 波兰 虚拟助手 1 000 78小时 仅固定电话 低背景噪音 48 000 8 B
215
波兰语(波兰)有定稿的麦克风录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 POL_ASR001 可根据要求提供 有定稿的录音 波兰语 波兰 聊天机器人 99 25小时 麦克风 低背景噪音(家庭/办公室) 10 130 16 B
362
波兰语(波兰)词性词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 pol_POL_POS 4 000 词性词典 波兰语 波兰 语言建模 N/A 4,000个单词 N/A N/A N/A N/A B
461
波斯自由说短语流数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 PER_AKD_ASR001_CN NA 自由说 波斯 波斯 语音分析 1500+ 64.32小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 B
92
波斯语/波斯语NER新闻文本
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 FAR_NER001 NA 波斯语 伊朗 对话式AI 19,584 句 B
275
波斯语NER语料库
文本 NER, 内容分类, 搜索引擎 内容分类 NER 添加到咨询列表 FAR_NER001 可根据要求提供 NER 波斯语 伊朗 搜索引擎 N/A 19,584个句子 N/A N/A 19 584 N/A B
172
波斯语(伊朗)对话式的电话录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 FAR_ASR002 12 358 对话录音 波斯语 伊朗 语音分析 1 000 30小时 移动电话和固定电话 混合 可根据要求提供 8 B
171
波斯语(伊朗)有定稿的电话录音语料库
音频 ASR, 呼叫中心, 虚拟助手 呼叫中心 ASR 添加到咨询列表 FAR_ASR001 8 716 有定稿的录音 波斯语 伊朗 虚拟助手 789 85小时 移动电话和固定电话 混合 38 400 8 B
385
泰卢固语(印度)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 tel_IND_PHON 50 000 发音词典 泰卢固语 印度 语言建模 N/A 50,000个单词 N/A N/A N/A N/A T
72
泰国朗读视频
视频 添加到咨询列表 VED_THA_READ_CN NA 人像视频 泰语 泰国 NA 20分钟/人,30人 NA NA NA NA T
115
泰州方言(含标注)
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 TZ_ASR002_CN NA 有定稿的录音 方言 中国 语音分析 1小时 手机 低背景噪音(家庭/办公室) NA 8 T
386
泰米尔文(印度)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 tam_IND_PHON 105 000 发音词典 泰米尔语 印度 语言建模 N/A 105,000个单词 N/A N/A N/A N/A T
462
泰米尔自由说短语流数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 TAM_AKD_ASR001_CN NA 自由说 泰米尔 泰米尔 语音分析 1500+ 91.41小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 T
23
泰语
图像 图片标签识别训练 图片标签识别训练 添加到咨询列表 IMG_OCR_THA002_CN NA OCR 泰国 泰国 NA 3250 张 手机/照相机 多种光线 NA NA T
13
泰语有字幕视频
视频 NA 添加到咨询列表 THA_AUD001_CN NA 有字幕视频 泰语 泰国 NA 7713 小时 NA NA NA NA T
415
泰语自由说语音数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 THA_ASR002_CN NA 自由说 泰语(泰国) 泰国 语音分析   2.95小时 手机麦克风 低背景噪音(家庭/办公室) NA 17 T
449
泰语自由说长语流数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 THA_AKC_ASR001_CN NA 自由说 泰语 泰语 语音分析 400+ 350小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 T
445
泰语语音数据库-电话信道
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 TH_ASR001 NA 电话信道 泰语 泰国 语音分析 NA 1000小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 T
267
泰语(泰国)印刷文本OCR
图像 文件处理, 文件搜索 文件搜索 文件处理 添加到咨询列表 IMG_OCR_THA_CN NA OCR 泰语 泰国 10 1219张图片 照相机 不同光线 NA NA T
387
泰语(泰国)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 tha_THA_PHON 30 000 发音词典 泰语 泰国 语言建模 N/A 30,000个单词 N/A N/A N/A N/A T
241
泰语(泰国)麦克风录音数据库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 THA_ASR001 可根据要求提供 有定稿的录音 泰语 泰国 聊天机器人 98 28小时 麦克风 低背景噪音(家庭/办公室) 14 039 16 T
110
济南方言(含标注)
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 JN_ASR002_CN NA 有定稿的录音 方言 中国 语音分析 1小时 手机 低背景噪音(家庭/办公室) NA 8 J
333
海地克里奥尔语(海地)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 hat_HTI_PHON 15 000 发音词典 海地克里奥尔语 海地 语言建模 N/A 15,000个单词 N/A N/A N/A N/A H
49
海报,宣传页采集图片数据
图像 图片标签识别训练 教辅&文档 图片标签识别训练 添加到咨询列表 IMG_OCR_leaflets_CN NA OCR 中文 中国 NA 1480张 手机/照相机 多种光线 NA NA H
147
温州方言(含标注)
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 WZ_ASR002_CN NA 有定稿的录音 方言 中国 语音分析 1小时 手机 低背景噪音(家庭/办公室) NA 8 W
141
港式粤语唤醒词(170个ID,每个ID 26句)
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 GSYY_ASR002_CN NA 有定稿的录音 广东话 (粤语) 中国 语音分析 NA 11小时左右 高保真麦克风 专业录音棚 NA NA G
140
港式粤语唤醒词(170个ID,每个ID 50句)
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 GSYY_ASR001_CN NA 有定稿的录音 广东话 (粤语) 中国 语音分析 NA 12小时左右 手机 低背景噪音(家庭/办公室) NA NA G
476
港澳OCR
图像 图片标签识别训练 添加到咨询列表 IMG_GA_OCR_CN NA OCR N/A 中国 NA 11028 张 多种光线 NA NA NA G
396
湘语(中国)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 hsn_CHN_PHON 10 000 发音词典 湘语 中国 语言建模 N/A 10,000个单词 N/A N/A N/A N/A X
116
滁州方言(含标注)
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 CZ_ASR002_CN NA 有定稿的录音 方言 中国 语音分析 1小时 手机 低背景噪音(家庭/办公室) NA 8 C
343
爪哇语(印度尼西亚)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 jav_IDN_PHON 20 000 发音词典 爪哇语 印度尼西亚 语言建模 N/A 20,000个单词 N/A N/A N/A N/A G
104
猫狗叫声(猫35H 狗35H)
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 PET_ASR001_CN NA NA NA 中国 语音分析 70小时 手机 低背景噪音(家庭/办公室) NA 16 M
381
瑞典文(瑞典)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 swe_SWE_PHON 100 000 发音词典 瑞典语 瑞典 语言建模 N/A 100,000个单词 N/A N/A N/A N/A R
382
瑞典文(瑞典)词性词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 swe_SWE_POS 105 000 词性词典 瑞典语 瑞典 语言建模 N/A 105,000个单词 N/A N/A N/A N/A R
238
瑞典(瑞典/芬兰)麦克风录音数据库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 SWE_ASR001 可根据要求提供 有定稿的录音 瑞典语 瑞典-芬兰 聊天机器人 98 30小时 麦克风 低背景噪音(家庭/办公室) 11 816 16 R
332
瓜拉尼语(巴拉圭)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 grn_PRY_PHON 35 000 发音词典 瓜拉尼语 巴拉圭 语言建模 N/A 35,000个单词 N/A N/A N/A N/A G
78
电梯间非机动车
图像 图片标签识别训练 图片标签识别训练 添加到咨询列表 IMG_DTFJDC_CN NA NA 中文 中国 NA 12000 张 电梯摄像头 室内灯光 NA NA D
488
电视多轮对话
文本 添加到咨询列表 DSDH_corpus_CN N/A 多轮对话 中文 中国 N/A 20000条 N/A N/A N/A N/A D
470
百万高颜值女博主URL集
图像 图片标签识别训练 添加到咨询列表 IMG_WLRX_CN NA URL集合 N/A 中国 NA 1002904 URL/128556 ID NA NA NA NA B
7
百科类文本语料
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 BK_corpus001_CN NA NA 中文 中国 对话式AI LLM NA 100000句 NA NA NA NA B
24
皮肤分割数据数据库
图像 图片标签识别训练 图片标签识别训练 添加到咨询列表 OMG_Skin segmentation_CN NA 中文 多国 NA 10000张 手机/照相机 多种光线 NA NA P
117
盐城方言(含标注)
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 YC_ASR002_CN NA 有定稿的录音 方言 中国 语音分析 1小时 手机 低背景噪音(家庭/办公室) NA 8 Y
26
监控/平拍车辆数据库
图像 图片标签识别训练 图片标签识别训练 添加到咨询列表 IMG_Monitoring/Mobile Camera Car_CN NA 中文 多国 NA 11万张 手机/照相机 多种光线 NA NA J
471
监控视角下的安防,危险驾驶,厨房检测,智慧城管场景图片
图像 图片标签识别训练 添加到咨询列表 IMG_DCJ_CN NA 物体图片 N/A 中国 NA 230000张 监控摄像头 NA NA NA J
2
知识类百科文本语料对
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 LLM_BK_CN NA NA 中文 中国 对话式AI LLM NA 50000对 NA NA NA NA Z
84
知识类百科文本语料对
文本 LLMD大语言模型训练 LLMD大语言模型训练 添加到咨询列表 LLM_BK_CN N/A 多轮对话 普通话 中国 语言建模 N/A 50000对 N/A N/A N/A N/A L
111
石家庄方言(含标注)
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 SJZ_ASR002_CN NA 有定稿的录音 方言 中国 语音分析 1小时 手机 低背景噪音(家庭/办公室) NA 8 S
397
祖鲁人(南非)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 zul_ZAF_PHON 75 000 发音词典 祖鲁语 南非 语言建模 N/A 75,000个单词 N/A N/A N/A N/A Z
132
福州方言(含标注)
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 FZ_ASR002_CN NA 有定稿的录音 方言 中国 语音分析 1小时 手机 低背景噪音(家庭/办公室) NA 8 F
350
立陶宛语(立陶宛)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 lit_LTU_PHON 60 000 发音词典 立陶宛语 立陶宛 语言建模 N/A 60,000个单词 N/A N/A N/A N/A L
266
简体中文印刷文本OCR
图像 文件处理, 文件搜索 文件搜索 文件处理 添加到咨询列表 IMG_OCR_MAC_CN NA OCR N/A 中国 30 200张图片 照相机 不同光线 NA NA Z
372
索拉尼(伊拉克)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 kur_IRQ_PHON 25 000 发音词典 索马里语 伊拉克 语言建模 N/A 25,000个单词 N/A N/A N/A N/A S
371
索马里(索马里)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 som_SOM_PHON 76 000 发音词典 索马里语 索马里 语言建模 N/A 76,000个单词 N/A N/A N/A N/A S
227
索马里(索马里)对话式的电话录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 SOM_ASR001 23 217 对话录音 索马里语 索马里 语音分析 1 000 50小时 移动电话和固定电话 低背景噪音 可根据要求提供 8 S
406
维吾尔方言(中国)双人对话式录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 WWE_ASR001_CN NA 对话录音 维吾尔族语 中国 语音分析 231 122小时 移动电话 低背景噪音(家庭/办公室) NA 16 Z
16
维藏采集图片数据
图像 图片标签识别训练 图片标签识别训练 添加到咨询列表 IMG_OCR_THA001_CN NA OCR 中文 维藏 NA 461张 手机/照相机 多种光线 NA NA W
468
维语OCR图片数据库
图像 图片标签识别训练 添加到咨询列表 IMG_WY_CN NA OCR N/A 中国 NA 4590张 手机/平板 多种光线 NA NA W
418
维语语音数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 WWE_ASR002_CN NA 语料朗读 维语 中国 语音分析 N/A 3.9小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 Z
367
罗马尼亚语(罗马尼亚)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 ron_ROU_PHON 15 000 发音词典 罗马尼亚语 罗马尼亚 语言建模 N/A 15,000个单词 N/A N/A N/A N/A L
221
罗马尼亚语(罗马尼亚)对话式的电话录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 ROM_ASR001 16 658 对话录音 罗马尼亚语 罗马尼亚 语音分析 200 37小时 移动电话和固定电话 低背景噪音 可根据要求提供 8 L
477
美语成熟性感女TTS
音频 添加到咨询列表 JS_TTS001_CN NA TTS 美语 美国 1 3小时 专业录音棚 专业录音棚 NA NA M
478
美语温柔文静女TTS
音频 添加到咨询列表 JS_TTS002_CN NA TTS 美语 美国 1 3小时 专业录音棚 专业录音棚 NA NA M
349
老挝(老挝)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 lao_LAO_PHON 9 000 发音词典 老挝语 老挝 语言建模 N/A 9,000个单词 N/A N/A N/A N/A L
268
芬兰语(芬兰)印刷文本OCR
图像 文件处理, 文件搜索 文件搜索 文件处理 添加到咨询列表 IMG_OCR_FIN_CN NA OCR 芬兰语 芬兰 4 7293张图片 照相机 不同光线 NA NA F
324
芬兰语(芬兰)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 fin_FIN_PHON 85 000 发音词典 芬兰语 芬兰 语言建模 N/A 85,000个单词 N/A N/A N/A N/A F
325
芬兰语(芬兰)词性词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 fin_FIN_POS 10 000 词性词典 芬兰语 芬兰 语言建模 N/A 10,000个单词 N/A N/A N/A N/A F
416
苏州方言语音数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 SUZHOU_ASR001_CN NA 语料朗读 苏州方言 中国 语音分析 8 2.84小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 Z
130
苏州方言(含标注)
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 SZ_ASR002_CN NA 有定稿的录音 方言 中国 语音分析 1小时 手机 低背景噪音(家庭/办公室) NA 8 S
310
英文(加拿大)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 eng_CAN_PHON 50 000 发音词典 英语 加拿大 语言建模 N/A 50,000个单词 N/A N/A N/A N/A Y
163
英文(加拿大)有定稿的电话录音语料库
音频 ASR, 呼叫中心, 虚拟助手 呼叫中心 ASR 添加到咨询列表 ENC_ASR001 12 483 有定稿的录音 英语 加拿大 虚拟助手 1 000 144小时 移动电话和固定电话 混合 99 000 8 Y
311
英文(加拿大)词性词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 eng_CAN_POS 3 000 词性词典 英语 加拿大 语言建模 N/A 3,000个单词 N/A N/A N/A N/A Y
314
英文(印度)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 eng_IND_PHON 60 000 发音词典 英语 印度 语言建模 N/A 60,000个单词 N/A N/A N/A N/A Y
166
英文(印度)对话式的电话录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 ENI_ASR002 11 646 对话录音 英语 印度 语音分析 540 67小时 移动电话和固定电话 低背景噪音 77 565 8 Y
165
英文(印度)有定稿的电话录音语料库
音频 ASR, 呼叫中心, 虚拟助手 呼叫中心 ASR 添加到咨询列表 ENI_ASR001 9 190 有定稿的录音 英语 印度 虚拟助手 2 358 217小时 移动电话和固定电话 混合 117 900 8 Y
315
英文(印度)词性词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 eng_IND_POS 13 000 词性词典 英语 印度 语言建模 N/A 13,000个单词 N/A N/A N/A N/A Y
312
英文(菲律宾)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 eng_PHL_PHON 5 000 发音词典 英语 菲律宾 语言建模 N/A 5,000个单词 N/A N/A N/A N/A Y
164
英文(菲律宾)对话式的电话录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 ENF_ASR001 7 272 对话录音 英语 菲律宾 语音分析 450 53小时 移动电话和固定电话 低背景噪音 41 602 8 Y
162
英文(阿拉伯文-黎凡特/埃及)对话式的电话录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 ENA_ASR001 5 619 对话录音 英语 埃及 语音分析 250 28小时 移动电话和固定电话 低背景噪音 可根据要求提供 8 Y
66
英语
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 ENG_SMS001A NA 会话短信-线程 英语 美国 对话式AI NA 100000 messages NA NA NA NA Y
67
英语
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 ENG_SMS001 NA 会话短信-线程 英语 美国 对话式AI NA 1 million messages NA NA NA NA Y
88
英语NER新闻文本
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 ENG_NER001 NA 英语 英国 对话式AI 22,768 句 Y
271
英语NER语料库
文本 NER, 内容分类, 搜索引擎 内容分类 NER 添加到咨询列表 ENG_NER001 可根据要求提供 NER 英语 N/A 搜索引擎 N/A 22,768个句子 N/A N/A 22 768 N/A Y
98
英语反向文本规范化
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 ENG_ITN001 NA 英语 英国 对话式AI 4454 test cases Y
64
英语泰米尔语
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 English_Tamil_corpus_CN NA 平行语料 英语泰米尔语 N/A 对话式AI NA 13000000对 NA NA NA NA Y
58
英语泰语
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 English_Thai_corpus_CN NA 平行语料 英语泰语 N/A 对话式AI NA 50000对 NA NA NA NA Y
61
英语缅甸语
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 English_Burmese_corpus_CN NA 平行语料 英语缅甸语 N/A 对话式AI NA 210000对 NA NA NA NA Y
63
英语菲律宾语
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 English_Filipino_corpus_CN NA 平行语料 英语菲律宾语 N/A 对话式AI NA 10180000对 NA NA NA NA Y
59
英语葡萄牙语
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 English_Portuguese_corpus_CN NA 平行语料 英语葡萄牙语 N/A 对话式AI NA 150000对 NA NA NA NA Y
60
英语西班牙语
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 English_Spanish_corpus_CN NA 平行语料 英语西班牙语 N/A 对话式AI NA 150000对 NA NA NA NA Y
56
英语越南语
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 eng_vie_corpus_CN NA 平行语料 英语越南语 N/A 对话式AI NA 520000 NA NA NA NA Y
65
英语越南语
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 English_Vienamses_corpus_CN NA 平行语料 英语越南语 N/A 对话式AI NA 5010000对 NA NA NA NA Y
55
英语马来语
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 eng_mal_corpus_CN NA 平行语料 英语马来语 N/A 对话式AI NA 105000000 NA NA NA NA Y
62
英语马来语
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 English_Malay_corpus_CN NA 平行语料 英语马来语 N/A 对话式AI NA 5000000对 NA NA NA NA Y
442
英语(印度)会话智能手机
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 ENI_ASR003 NA 对话 英语 印度 语音分析 2358 143 小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 Y
309
英语(澳大利亚)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 eng_AUS_PHON 157 000 发音词典 英语 澳大利亚 语言建模 N/A 157,000个单词 N/A N/A N/A N/A Y
144
英语(澳大利亚)有定稿的电话录音语料库
音频 ASR, 呼叫中心, 虚拟助手 呼叫中心 ASR 添加到咨询列表 AUS_ASR001 35 137 有定稿的录音 英语 澳大利亚 虚拟助手 500 92小时 移动电话和固定电话 低背景噪音(家庭/办公室) 82 500 8 E
145
英语(澳大利亚)有定稿的电话录音语料库
音频 ASR, 呼叫中心, 虚拟助手 呼叫中心 ASR 添加到咨询列表 AUS_ASR002 19 有定稿的录音 英语 澳大利亚 虚拟助手 1 000 118小时 移动电话和固定电话 混合 75 000 8 E
316
英语(爱尔兰)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 eng_IRL_PHON 12 000 发音词典 英语 爱尔兰 语言建模 N/A 12,000个单词 N/A N/A N/A N/A Y
317
英语(纽西兰)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 eng_NZL_PHON 50 000 发音词典 英语 纽西兰 语言建模 N/A 50,000个单词 N/A N/A N/A N/A Y
441
英语(美国-非裔美国人)会话智能手机
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 USE_ASR004 NA 对话 英语 英语 语音分析 NA 50 小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 M
320
英语(美国)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 eng_USA_PHON 330 000 发音词典 英语 美国 语言建模 N/A 330,000个单词 N/A N/A N/A N/A Y
95
英语(美国)对话WhatsApp-线程
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 ENG_SMS002 NA 英语 美国 对话式AI 351,826 messages Y
247
英语(美国)对话式的智能手机录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 USE_ASR003 52 586 对话录音 英语 美国 语音分析 2 000 1000小时 移动电话 低背景噪音 500 000 16 Y
233
英语(美国)有定稿的麦克风录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 Speecon English (USA) database 可根据要求提供 有定稿的录音 英语 美国 聊天机器人 600(550个成年语料提供者及50个儿童语料提供者) 53小时 麦克风 混合(办公室/娱乐场所/车内/公共场所) 170 000 16 Y
246
英语(美国)有定稿的麦克风录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 USE_ASR001 18 318 有定稿的录音 英语 美国 聊天机器人 200 62小时 麦克风 低背景噪音(录音棚) 80 000 48 Y
321
英语(美国)词性词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 eng_USA_POS 263 000 词性词典 英语 美国 语言建模 N/A 263,000个单词 N/A N/A N/A N/A Y
444
英语(美国)超高音量标注语音
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 USE_UHV001 NA 对话 英语 美国 语音分析 NA 1196 小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 Y
318
英语(英国)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 eng_GBR_PHON 195 000 发音词典 英语 英国 语言建模 N/A 195,000个单词 N/A N/A N/A N/A Y
398
英语(英国)对话式的电话录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 UKE_ASR001B 13 192 对话录音 英语 英国 语音分析 1 150 50小时 移动电话和固定电话 低背景噪音 可根据要求提供 8 Y
244
英语(英国)对话式的电话录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 UKE_ASR001 24 193 对话录音 英语 英国 语音分析 1 150 150小时 移动电话和固定电话 低背景噪音 298 562 8 Y
239
英语(英国)有定稿的麦克风录音语料库
音频 TTS TTS 添加到咨询列表 TC-STAR female baseline voice Laura 可根据要求提供 有定稿的录音 英语 英国 1 11小时 头戴式麦克风 低背景噪音(录音棚) 可根据要求提供 96 Y
240
英语(英国)有定稿的麦克风录音语料库
音频 TTS TTS 添加到咨询列表 TC-STAR male baseline voice Ian 可根据要求提供 有定稿的录音 英语 英国 1 7小时 头戴式麦克风 低背景噪音(录音棚) 可根据要求提供 96 Y
319
英语(英国)词性词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 eng_GBR_POS 155 000 词性词典 英语 英国 语言建模 N/A 155,000个单词 N/A N/A N/A N/A Y
308
英语(阿拉伯联合酋长国)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 eng_ARE_PHON 5 000 发音词典 英语 阿拉伯联合酋长国 语言建模 N/A 5,000个单词 N/A N/A N/A N/A Y
207
英语(阿拉伯联合酋长国)有定稿的电话录音语料库
音频 ASR, 呼叫中心, 虚拟助手 呼叫中心 ASR 添加到咨询列表 OrienTel English as spoken in the United Arab Emirates 可根据要求提供 有定稿的录音 英语 阿拉伯联合酋长国 虚拟助手 500 33小时 移动电话和固定电话 低背景噪音 25 500 8 Y
313
英语(香港)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 eng_HKG_PHON 18 000 发音词典 英语 香港 语言建模 N/A 18,000个单词 N/A N/A N/A N/A Y
173
荷兰语(比利时)有定稿的电话录音语料库
音频 ASR, 呼叫中心, 虚拟助手 呼叫中心 ASR 添加到咨询列表 Flemish SpeechDat(II) FDB-1000 (FIXED1FL) 可根据要求提供 有定稿的录音 荷兰语 比利时 虚拟助手 1 000 80小时 麦克风 低背景噪音 52 000 8 H
231
荷兰语(比利时)有定稿的麦克风录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 Speecon Dutch from Belgium 可根据要求提供 有定稿的录音 荷兰语 比利时 聊天机器人 600(550个成年语料提供者及50个儿童语料提供者) 47小时 麦克风 混合(办公室/娱乐场所/车内/公共场所) 170 000 16 H
160
荷兰语(荷兰和比利时)有定稿的车内录音语料库
音频 ASR, 虚拟助手, 车载HMI及娱乐设备 虚拟助手 ASR 添加到咨询列表 Dutch and Flemish SpeechDat-Car 可根据要求提供 有定稿的录音 荷兰语 荷兰-比利时 车载HMI及娱乐设备 302 27小时 麦克风和移动电话 混合(车内) 15 100 16和8 H
307
荷兰语(荷兰)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 nld_NLD_PHON 45 000 发音词典 荷兰语 荷兰 语言建模 N/A 45,000个单词 N/A N/A N/A N/A H
206
荷兰语(荷兰)对话式的电话录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 NLD_ASR001 14 964 对话录音 荷兰语 荷兰 语音分析 200 36小时 移动电话和固定电话 低背景噪音 可根据要求提供 8 H
232
荷兰语(荷兰)有定稿的麦克风录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 Speecon Dutch from the Netherlands 可根据要求提供 有定稿的录音 荷兰语 荷兰 聊天机器人 600(550个成年语料提供者及50个儿童语料提供者) 68小时 麦克风 混合(办公室/娱乐场所/车内/公共场所) 170 000 16 H
71
菲律宾朗读视频
视频 添加到咨询列表 VED_FIL_READ_CN NA 人像视频 菲律宾语 菲律宾 NA 20分钟/人,30人 NA NA NA NA F
454
菲律宾自由说短语流数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 PHI_AKD_ASR001_CN NA 自由说 菲律宾 菲律宾 语音分析 1500+ 137.76小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 F
435
葡萄牙语(欧洲)自由说语音数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 POR_EUR_ASR001_CN NA 自由说 葡萄牙语(欧洲) 葡萄牙 语音分析 8 2.88小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 P
32
葡萄牙语采集图片数据
图像 图片标签识别训练 图片标签识别训练 添加到咨询列表 IMG_OCR_Portuguese_CN NA OCR 葡萄牙语 葡萄牙 NA 684张 手机/照相机 多种光线 NA NA P
363
葡萄牙语(巴西)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 por_BRA_PHON 102 000 发音词典 葡萄牙语 巴西 语言建模 N/A 102,000个单词 N/A N/A N/A N/A P
218
葡萄牙语(巴西)对话式的电话录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 PTB_ASR002 11 287 对话录音 葡萄牙语 巴西 语音分析 200 33小时 移动电话和固定电话 低背景噪音 可根据要求提供 8 P
364
葡萄牙语(巴西)词性词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 por_BRA_POS 100 000 词性词典 葡萄牙语 巴西 语言建模 N/A 100,000个单词 N/A N/A N/A N/A P
217
葡萄牙语(巴西)麦克风录音数据库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 PTB_ASR001 可根据要求提供 有定稿的录音 葡萄牙语 巴西 聊天机器人 102 26小时 麦克风 低背景噪音(家庭/办公室) 10 417 16 P
365
葡萄牙语(葡萄牙)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 por_PRT_PHON 112 000 发音词典 葡萄牙语 葡萄牙 语言建模 N/A 112,000个单词 N/A N/A N/A N/A P
219
葡萄牙语(葡萄牙)对话式的电话录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 PTP_ASR001 16 339 对话录音 葡萄牙语 葡萄牙 语音分析 200 36小时 移动电话和固定电话 低背景噪音 可根据要求提供 8 P
366
葡萄牙语(葡萄牙)词性词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 por_PRT_POS 100 000 词性词典 葡萄牙语 葡萄牙 语言建模 N/A 100,000个单词 N/A N/A N/A N/A P
356
蒙古语(蒙古)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 mon_MNG_PHON 30 000 发音词典 蒙古语 蒙古 语言建模 N/A 30,000个单词 N/A N/A N/A N/A M
467
藏语OCR图片数据库
图像 图片标签识别训练 添加到咨询列表 IMG_ZY_CN NA OCR N/A 中国 NA 853张 手机/平板 多种光线 NA NA Z
43
行业书籍杂志采集图片数据
图像 图片标签识别训练 教辅&文档 图片标签识别训练 添加到咨询列表 IMG_OCR_Industry books and magazines_CN NA OCR 中文 中国 NA 7170张 手机/照相机 多种光线 NA NA H
105
西安方言(含标注)
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 XIAN_ASR002_CN NA 有定稿的录音 方言 中国 语音分析 1小时 手机 低背景噪音(家庭/办公室) NA 8 X
376
西班牙文(哥伦比亚)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 spa_COL_PHON 15 000 发音词典 西班牙语 哥伦比亚 语言建模 N/A 15,000个单词 N/A N/A N/A N/A X
379
西班牙文(委内瑞拉)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 spa_VEN_PHON 15 000 发音词典 西班牙语 委内瑞拉 语言建模 N/A 15,000个单词 N/A N/A N/A N/A X
375
西班牙文(智利)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 spa_CHL_PHON 15 000 发音词典 西班牙语 智利 语言建模 N/A 15,000个单词 N/A N/A N/A N/A X
374
西班牙文(西班牙)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 spa_ESP_PHON 100 000 发音词典 西班牙语 西班牙 语言建模 N/A 100,000个单词 N/A N/A N/A N/A X
257
西班牙文(西班牙)有定稿的智能手机录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 ESP_ASR002_CN 134 939 有定稿的录音 西班牙语 西班牙 聊天机器人 347 540小时 移动电话 低背景噪音(家庭/办公室) 258 395 16 X
169
西班牙文(西班牙)有定稿的麦克风录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 ESP_ASR001 6 367 有定稿的录音 西班牙语 西班牙 聊天机器人 200 39小时 麦克风 混合 40 000 22 X
170
西班牙文(西班牙)有定稿的麦克风录音语料库
音频 TTS TTS 添加到咨询列表 ESP_TTS001 3 614 有定稿的录音 西班牙语 西班牙 1 1 hour 麦克风 低背景噪音(录音棚) 1 787 22 X
237
西班牙文(西班牙)有定稿的麦克风录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 Speecon Spanish Database 可根据要求提供 有定稿的录音 西班牙语 西班牙 聊天机器人 600(550个成年语料提供者及50个儿童语料提供者) 46小时 麦克风 混合(办公室/娱乐场所/车内/公共场所) 170 000 16 X
414
西班牙语自由说语音数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 ESP_ASR002_CN NA 自由说 西班牙语 西班牙 语音分析 N/A 2小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 X
436
西班牙语自由说语音数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 ESP_ASR003_CN NA 自由说 西班牙语 西班牙 语音分析 NA 220 小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 X
448
西班牙语自由说长语流数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 SPA_AKC_ASR001_CN NA 自由说 西班牙语 西班牙语 语音分析 400+ 1200小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 X
33
西班牙语采集图片数据
图像 图片标签识别训练 图片标签识别训练 添加到咨询列表 IMG_OCR_Spanish_CN NA OCR 西班牙语 西班牙 NA 725张 手机/照相机 多种光线 NA NA X
168
西班牙语(拉丁美洲-智利和哥伦比亚)对话式的电话录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 ESL_ASR002 可根据要求提供 对话录音 西班牙语 智利-哥伦比亚 语音分析 84 22小时 移动电话和固定电话 混合 可根据要求提供 8 X
167
西班牙语(拉丁美洲)有定稿的麦克风录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 ESL_ASR001 可根据要求提供 有定稿的录音 西班牙语 哥斯达黎加 聊天机器人 100 17小时 麦克风 低背景噪音(家庭/办公室) 6 898 16 X
377
西班牙语(秘鲁)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 spa_PER_PHON 15 000 发音词典 西班牙语 秘鲁 语言建模 N/A 15,000个单词 N/A N/A N/A N/A X
378
西班牙语(美国)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 spa_USA_PHON 90 000 发音词典 西班牙语 美国 语言建模 N/A 90,000个单词 N/A N/A N/A N/A X
443
西班牙语(西班牙)会话智能手机
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 ESP_ASR003 NA 对话 西班牙语 西班牙 语音分析 NA 220 小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 X
373
西班牙语(阿根廷)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 spa_ARG_PHON 15 000 发音词典 西班牙语 阿根廷 语言建模 N/A 15,000个单词 N/A N/A N/A N/A X
498
角色扮演-指令集
文本 添加到咨询列表 ZLCJS_corpus_CN N/A 指令集 中文 中国 N/A 40000条 N/A N/A N/A N/A J
184
豪萨语有定稿的麦克风录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 HAU_ASR001 可根据要求提供 有定稿的录音 豪萨语 多国 聊天机器人 103 20小时 麦克风 低背景噪音(家庭/办公室) 7 895 16 H
334
豪萨(尼日利亚)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 hau_NGA_PHON 11 000 发音词典 豪萨语 奈及利亚 语言建模 N/A 11,000个单词 N/A N/A N/A N/A H
185
豪萨(尼日利亚)对话式的电话录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 HAU_ASR002 7 949 对话录音 豪萨语 奈及利亚 语音分析 200 33小时 移动电话 低背景噪音 可根据要求提供 8 H
82
购物车图片
图像 图片标签识别训练 图片标签识别训练 添加到咨询列表 IMG_GWC_CN NA NA N/A 中国 NA 1000张 NA 室内灯光 NA NA G
121
贵阳方言(含标注)
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 GY_ASR002_CN NA 有定稿的录音 方言 中国 语音分析 1小时 手机 低背景噪音(家庭/办公室) NA 8 G
70
越南朗读视频
视频 添加到咨询列表 VED_VIE_READ_CN NA 人像视频 越南 越南 NA 20分钟/人,30人 NA NA NA NA Y
22
越南语图片
图像 图片标签识别训练 图片标签识别训练 添加到咨询列表 IMG_OCR_VIE_CN NA OCR 越南 越南 NA 16557 张 手机/照相机 多种光线 NA NA Y
432
越南语自由说语音数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 VIE_ASR001_CN NA 自由说 越南语 越南 语音分析 7 2.61小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 Y
450
越南语自由说长语流数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 VIE_AKC_ASR001_CN NA 自由说 越南语 越南 语音分析 400+ 11.25小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 Y
394
越南(Vietnam)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 vie_VNM_PHON 8 000 发音词典 越南语 越南 语言建模 N/A 8,000个单词 N/A N/A N/A N/A Y
248
越南(Vietnam)麦克风录音数据库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 VIE_ASR001 可根据要求提供 有定稿的录音 越南语 越南 聊天机器人 129 47小时 麦克风 低背景噪音(家庭/办公室) 18 842 16 Y
269
身体移动视频库
视频 健身应用, 行为识别, 手势识别 行为识别 健身应用 添加到咨询列表 VED_HUMAN_BODY_CN NA 人体 N/A 中国 手势识别 1000 2,000 个视频 移动电话 不同背景及光线 NA NA Z
20
车牌
图像 图片标签识别训练 图片标签识别训练 添加到咨询列表 IMG_CAR_License_CN NA 中文 中国 NA 44523 张 手机/照相机 多种光线 NA NA C
80
车辆照片数据库
图像 图片标签识别训练 图片标签识别训练 添加到咨询列表 IMG_CLPZ_CN NA NA 中文 中国 NA 2400 张 手机/平板 多种光线 NA NA C
305
达里语(阿富汗)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 prs_AFG_PHON 30 000 发音词典 达里语 阿富汗 语言建模 N/A 30,000个单词 N/A N/A N/A N/A D
156
达里语(阿富汗)对话式的电话录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 DAR_ASR001 11 168 对话录音 达里语 阿富汗 语音分析 500 40小时 移动电话和固定电话 低背景噪音 可根据要求提供 8 D
157
达里语(阿富汗)广播录音数据库
音频 ASR, 自动字幕, 关键字检索 自动字幕 ASR 添加到咨询列表 DAR_BRC001 可根据要求提供 广播录音 达里语 阿富汗 关键字检索 N/A 51小时 麦克风 低背景噪音(录音棚) 可根据要求提供 N/A D
491
逻辑推理-指令集
文本 添加到咨询列表 ZLCLJ_corpus_CN N/A 指令集 中文 中国 N/A 20000条 N/A N/A N/A N/A L
106
郑州方言(含标注)
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 ZZ_ASR002_CN NA 有定稿的录音 方言 中国 语音分析 10小时 手机 低背景噪音(家庭/办公室) NA 8 Z
122
重庆方言(含标注)
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 CQ_ASR002_CN NA 有定稿的录音 方言 中国 语音分析 1小时 手机 低背景噪音(家庭/办公室) NA 8 C
131
金华方言(含标注)
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 JH_ASR002_CN NA 有定稿的录音 方言 中国 语音分析 1小时 手机 低背景噪音(家庭/办公室) NA 8 J
497
长文本-指令集
文本 添加到咨询列表 ZLCCWB_corpus_CN N/A 指令集 中文 中国 N/A 20000条 N/A N/A N/A N/A C
136
长沙方言(含标注)
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 CS_ASR002_CN NA 有定稿的录音 方言 中国 语音分析 10小时 手机 低背景噪音(家庭/办公室) NA 8 C
426
长沙语音数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 CHANGSHA_ASR001_CN NA 语料朗读 长沙 中国 语音分析 10 2.18小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 Z
489
问答类-指令集
文本 添加到咨询列表 ZLCWD_corpus_CN N/A 指令集 中文 中国 N/A 20000条 N/A N/A N/A N/A W
8
闽南语-汉语翻译语料成品
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 MNH_corpus001_CN NA NA 中文 中国 对话式AI LLM NA 50000 对 NA NA NA NA M
452
阿塞拜疆自由说短语流数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 AZE_AKD_ASR001_CN NA 自由说 阿塞拜疆 阿塞拜疆 语音分析 1500+ 177.12小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 A
279
阿姆哈拉语(埃塞俄比亚)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 amh_ETH_PHON 45 000 发音词典 阿姆哈拉语 埃塞俄比亚 语言建模 N/A 45,000个单词 N/A N/A N/A N/A A
278
阿尔巴尼亚语(阿尔巴尼亚)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 sqi_ALB_PHON 12 000 发音词典 阿尔巴尼亚语 阿尔巴尼亚 语言建模 N/A 12,000个单词 N/A N/A N/A N/A A
77
阿拉伯图片数据库(含标注)
图像 图片标签识别训练 图片标签识别训练 添加到咨询列表 IMG_OCR_ARU002_CN NA NA 中文 中国 NA 10000 手机/平板 多种光线 NA NA A
87
阿拉伯语NER新闻文本
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 ARA_NER001 NA 阿拉伯语 N/A 对话式AI 20,774 句 A
270
阿拉伯语NER语料库
文本 NER, 内容分类, 搜索引擎 内容分类 NER 添加到咨询列表 ARB_NER001 可根据要求提供 NER 阿拉伯语 N/A 搜索引擎 N/A 20,774个句子 N/A N/A 20 774 N/A A
287
阿拉伯语发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 arb_N/A_PHON 40 000 发音词典 阿拉伯语 N/A 语言建模 N/A 40,000个单词 N/A N/A N/A N/A A
446
阿拉伯语自由说长语流数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 ARA_AKC_ASR001_CN NA 自由说 阿拉伯语 阿拉伯语 语音分析 400+ 1500小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 A
34
阿拉伯语采集图片数据
图像 图片标签识别训练 图片标签识别训练 添加到咨询列表 IMG_OCR_Arabic001_CN NA OCR 阿拉伯语 阿拉伯 NA 8524张 手机/照相机 多种光线 NA NA A
281
阿拉伯语(伊拉克)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 ara_IRQ_PHON 15 000 发音词典 阿拉伯语 伊拉克 语言建模 N/A 15,000个单词 N/A N/A N/A N/A A
282
阿拉伯语(伊拉克)词性词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 ara_IRQ_POS 13 000 词性词典 阿拉伯语 伊拉克 语言建模 N/A 13,000个单词 N/A N/A N/A N/A A
283
阿拉伯语(利比亚)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 ara_LBY_PHON 48 000 发音词典 阿拉伯语 利比亚 语言建模 N/A 48,000个单词 N/A N/A N/A N/A A
280
阿拉伯语(埃及)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 ara_EGY_PHON 40 000 发音词典 阿拉伯语 埃及 语言建模 N/A 40,000个单词 N/A N/A N/A N/A A
254
阿拉伯语(埃及)有定稿的智能手机录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 ARE_ASR001_CN 207 576 有定稿的录音 阿拉伯语 埃及 聊天机器人 627 352小时 移动电话 低背景噪音(家庭/办公室) 128 908 16 A
286
阿拉伯语(摩洛哥)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 ara_MAR_PHON 60 000 发音词典 阿拉伯语 摩洛哥 语言建模 N/A 60,000个单词 N/A N/A N/A N/A A
253
阿拉伯语(摩洛哥)对话式的电话录音翻译
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 ARY_MT001 23 844 对话翻译 阿拉伯语 摩洛哥 对话式AI 180 80,544 个发音 N/A N/A 80 430 N/A A
252
阿拉伯语(摩洛哥)对话式的电话录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 ARY_ASR001 23 836 对话录音 阿拉伯语 摩洛哥 语音分析 180 33小时 移动电话和固定电话 低背景噪音 80 544 8 A
255
阿拉伯语(沙特阿拉伯)有定稿的智能手机录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 ARS_ASR001_CN 156 282 有定稿的录音 阿拉伯语 沙特阿拉伯 聊天机器人 227 322小时 移动电话 低背景噪音(家庭/办公室) 104 574 16 A
205
阿拉伯语(现代标准阿拉伯语)有定稿的麦克风录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 MSA_ASR001 可根据要求提供 有定稿的录音 阿拉伯语 突尼斯 聊天机器人 78 12小时 麦克风 低背景噪音(家庭/办公室) 4 908 16 A
289
阿拉伯语(苏丹)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 ara_SDN_PHON 17 000 发音词典 阿拉伯语 苏丹 语言建模 N/A 17,000个单词 N/A N/A N/A N/A A
161
阿拉伯语(阿尔及利亚东部)对话式的电话录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 EAR_ASR001 11 327 对话录音 阿拉伯语 阿尔及利亚 语音分析 496 29小时 移动电话和固定电话 低背景噪音(家庭/办公室) 可根据要求提供 8 A
284
阿拉伯语(阿尔及利亚)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 ara_DZA_PHON 11 000 发音词典 阿拉伯语 阿尔及利亚 语言建模 N/A 11,000个单词 N/A N/A N/A N/A A
151
阿拉伯语(阿拉伯联合酋长国/沙特阿拉伯)有定稿的麦克风录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 CGA_ASR001 19 245 有定稿的录音 阿拉伯语 阿拉伯联合酋长国-沙特阿拉伯 聊天机器人 150 86小时 麦克风 低背景噪音(家庭/办公室) 42 000 16 A
288
阿拉伯语(阿拉伯联合酋长国)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 ara_ARE_PHON 75 000 发音词典 阿拉伯语 阿拉伯联合酋长国 语言建模 N/A 75,000个单词 N/A N/A N/A N/A A
262
阿拉伯语(阿拉伯联合酋长国)有定稿的智能手机录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 ARU_ASR001_CN 85 775 有定稿的录音 阿拉伯语 阿拉伯联合酋长国 聊天机器人 133 170小时 移动电话 低背景噪音(家庭/办公室) 42 352 16 A
210
阿拉伯语(阿拉伯联合酋长国)有定稿的电话录音语料库
音频 ASR, 呼叫中心, 虚拟助手 呼叫中心 ASR 添加到咨询列表 OrienTel United Arab Emirates MCA (Modern Colloquial Arabic) 可根据要求提供 有定稿的录音 阿拉伯语 阿拉伯联合酋长国 虚拟助手 880 48小时 移动电话和固定电话 低背景噪音 43 000 8 A
211
阿拉伯语(阿拉伯联合酋长国)有定稿的电话录音语料库
音频 ASR, 呼叫中心, 虚拟助手 呼叫中心 ASR 添加到咨询列表 OrienTel United Arab Emirates MSA (Modern Standard Arabic) 可根据要求提供 有定稿的录音 阿拉伯语 阿拉伯联合酋长国 虚拟助手 500 31小时 移动电话和固定电话 低背景噪音 24 500 8 A
290
阿萨姆语(印度)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 asm_IND_PHON 40 000 发音词典 阿萨姆语 印度 语言建模 N/A 40,000个单词 N/A N/A N/A N/A A
118
青岛方言(含标注)
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 QD_ASR002_CN NA 有定稿的录音 方言 中国 语音分析 1小时 手机 低背景噪音(家庭/办公室) NA 8 Q
89
韩国NER新闻文本
文本 MT, 聊天机器人, 对话式AI 聊天机器人 MT 添加到咨询列表 KOR_NER001 NA 韩语 韩国 对话式AI 25,830 句 H
346
韩文(韩国)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 kor_KOR_PHON 100 000 发音词典 韩语 韩国 语言建模 N/A 100,000个单词 N/A N/A N/A N/A H
199
韩文(韩国)有定稿的麦克风录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 KOR_ASR001 可根据要求提供 有定稿的录音 韩语 韩国 聊天机器人 100 20小时 麦克风 低背景噪音(家庭/办公室) 8 107 16 H
347
韩文(韩国)词性词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 kor_KOR_POS 100 000 词性词典 韩语 韩国 语言建模 N/A 100,000个单词 N/A N/A N/A N/A H
272
韩语NER语料库
文本 NER, 内容分类, 搜索引擎 内容分类 NER 添加到咨询列表 KOR_NER001 可根据要求提供 NER 韩语 韩国 搜索引擎 N/A 25,830个句子 N/A N/A 25 830 N/A H
475
韩语OCR
图像 图片标签识别训练 添加到咨询列表 IMG_KOR_OCR_CN NA OCR N/A 韩国 NA 3902 张 手机/平板 多种光线 NA NA H
15
韩语有字幕视频
视频 NA 添加到咨询列表 KOR_AUD001_CN NA 有字幕视频 韩国 韩语 NA 6424 小时 NA NA NA NA H
433
韩语自由说语音数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 KOR_ASR001_CN NA 自由说 韩语 韩国 语音分析 4 3.35小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 H
437
韩语自由说语音数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 KOR_ASR002_CN NA 自由说 韩语 韩国 语音分析 NA 3.35小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 H
35
韩语采集图片数据
图像 图片标签识别训练 图片标签识别训练 添加到咨询列表 IMG_OCR_Korean_CN NA OCR 韩语 韩国 NA 359张 手机/照相机 多种光线 NA NA H
355
马拉地语(印度)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 mar_IND_PHON 30 000 发音词典 马拉地语 印度 语言建模 N/A 30,000个单词 N/A N/A N/A N/A M
204
马拉地语(印度)对话式的电话录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 MAR_ASR001 11 908 对话录音 马拉地语 印度 语音分析 180 15小时 移动电话和固定电话 混合 可根据要求提供 8 M
250
马拉地语(印度)对话式的电话录音语料库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 MAR_ASR001A 11 908 对话录音 马拉地语 印度 语音分析 1 000 52小时 移动电话和固定电话 混合 可根据要求提供 8 M
351
马拉雅拉姆语(印度)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 mal_IND_PHON 4 000 发音词典 玛拉雅拉姆语 印度 语言建模 N/A 4,000个单词 N/A N/A N/A N/A M
74
马来朗读视频
视频 添加到咨询列表 VED_MAL_READ_CN NA 人像视频 马来语 马来西亚 NA 20分钟/人,15人 NA NA NA NA M
352
马来西亚(马来西亚)发音词典
文本 ASR, TTS, 语言建模 TTS ASR 添加到咨询列表 msa_MYS_PHON 10 000 发音词典 马来语 马来西亚 语言建模 N/A 10,000个单词 N/A N/A N/A N/A M
459
马来语自由说短语流数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 MAL_AKD_ASR001_CN NA 自由说 马来语 马来语 语音分析 1500+ 149.31小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 M
431
马来语自由说语音数据库
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 MAL_ASR001_CN NA 自由说 马来语 马来西亚 语音分析 9 3.01小时 手机麦克风 低背景噪音(家庭/办公室) NA 16 M
38
高中化学采集图片数据
图像 图片标签识别训练 教辅&文档 图片标签识别训练 添加到咨询列表 IMG_OCR_High School Chemistry_CN NA OCR 中文 中国 NA 1640张 手机/照相机 多种光线 NA NA G
40
高中物理采集图片数据
图像 图片标签识别训练 教辅&文档 图片标签识别训练 添加到咨询列表 IMG_OCR_High School Physics_CN NA OCR 中文 中国 NA 1104张 手机/照相机 多种光线 NA NA G
39
高中生物采集图片数据
图像 图片标签识别训练 教辅&文档 图片标签识别训练 添加到咨询列表 IMG_OCR_Senior high school biology_CN NA OCR 中文 中国 NA 1255张 手机/照相机 多种光线 NA NA G
466
高保真儿童唤醒词-智能家居领域
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 GBZET_ASR002_CN NA 语料朗读 普通话 中国 语音分析 100 22.5小时 专业录音设备 专业录音棚 NA 48 G
465
高保真儿童唤醒词-车载领域
音频 ASR, 对话式AI, 语音分析 对话式AI ASR 添加到咨询列表 GBZET_ASR001_CN NA 语料朗读 普通话 中国 语音分析 100 22.5小时 专业录音设备 专业录音棚 NA 48 G
263
高棉语(柬埔寨)有定稿的智能手机录音语料库
音频 ASR, 虚拟助手, 聊天机器人 虚拟助手 ASR 添加到咨询列表 KHM_ASR001_CN 52 157 有定稿的录音 高棉语 柬埔寨 聊天机器人 94 90小时 移动电话 低背景噪音(家庭/办公室) 24 618 16 G
265
黑人(东非)脸部照片库
图像 面部识别 面部识别 添加到咨询列表 IMG_FACE_KEN_CN NA 人脸 N/A 肯尼亚 100 13,500张图片 照相机 不同背景及光线 NA NA K




澳鹏的数据集优势




澳鹏提供种类丰富的成品数据库,我们的数据产品目录包括400多个可授权的数据集。其中语音数据库涵盖80多种语言及方言,适用于各种常见的AI应用场景,例如: TTS,ASR等(参考下面目录表的筛选功能查询更多应用场景)。我们前后会提供更多服务,比如数据管理等。联系我们,为您一同构建适用于您的项目的数据产品。


Image

快速部署



直接获取数据库产品快速为您部署AI与机器学习项目


Image

低成本高效益



直接获取经授权的成品数据库比您定制数据采集服务更具成本效益。


Image

专家团队



您将拥有一支在数据采集领域耕耘20多年的专家团队支持


Image

支持所有数据类型



图像,视频,语音,音频,文本

Image

大规模



提供大量、高品质的数据高效地训练您的机器模型

Image

高质量



提高您的机器模型质量并减少数据偏见









数据采集标注定制


澳鹏同时提供数据定制采标服务,如您未找到适合您的AI的成品数据集,可联系我们为您进行定制。我们涵盖全数据类型、全球范围的服务能力可以为您快速高效大规模地创建数据集。

联系销售