
澳鹏成品数据集
成品数据集是帮助您构建高质量 AI/ML 模型训练数据的绝佳选择。这种成品训练数据集可为企业提供升级和快速运行模型所需的数据,而成本通常比自定义数据采集工作低得多。成品数据集可以运行许多 AI 试点项目,并用其他数据补充生产模型,从而提高整体性能和成本效益。无论企业规模如何,在时间和预算紧张时,成品数据集都是绝佳的解决方案。
澳鹏提供种类丰富的成品数据库,我们的数据产品目录包括400多个可授权的数据集。数据集特色如下:

语音识别数据集
覆盖64种语言,总时长22,000小时
电话信道,手机麦克风,高保真麦克风等多种录音设备
单人朗读,自由说话,双人对话等多种场景
安静环境,办公室/居家环境,车载环境等多种录音环境
全部附带转写文本,部分附带发音词典
获取语音识别数据集目录

文本数据集
发音词典覆盖98种语言,共523万词条
词性词典覆盖22种语言,共326万词条
命名实体库(NER)覆盖8种语言,超100万词条
词形分析器覆盖3种语言
阿拉伯语元音化词典
获取文本数据集目录

数据集应用场景
数据集名称 | 产品类型 | 常见应用场景 | 录音设备 | 单元 |
---|
数据库名称 | 产品类型 | 常见使用案例 | 录音设备 | 单元 | ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
84 | 对话录音 | 5小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | SOR_ASR001 | alaw或wav | 音频 | 库尔德语 | 伊朗 | 移动电话和固定电话 | 低背景噪音 | 8 | 170 | 可根据要求提供 | 7 924 | 2 | Appen Global | K | ||
256 | 对话录音 | 4.5 小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | SHANGHAI_ASR002_CN | wav | 音频 | 上海方言 | 中国 | 移动电话 | 低背景噪音(家庭/办公室) | 8 | 14 | NA | NA | 1 | Appen China | Z | ||
255 | 对话录音 | 21小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | SHANGHAI_ASR001_CN | wav | 音频 | 上海方言 | 中国 | 录音笔/麦克风 | 低背景噪音(家庭/办公室) | 16 | 51 | NA | NA | 1 | Appen China | Z | ||
277 | 语料朗读 | 4.1小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | SHANGHAI_ASR003_CN | wav | 音频 | 上海 | 中国 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | 8 | NA | NA | Appen China | Z | |||
257 | 对话录音 | 84.6小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | DONGBEI_ASR001_CN | wav | 音频 | 东北方言 | 中国 | 录音笔/麦克风 | 低背景噪音(家庭/办公室) | 16 | 268 | NA | NA | 1 | Appen China | Z | ||
258 | 对话录音 | 75.2小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | DONGBEI_ASR002_CN | wav | 音频 | 东北方言 | 中国 | 移动电话 | 低背景噪音(家庭/办公室) | 8 | 185 | NA | NA | 1 | Appen China | Z | ||
276 | 语料朗读 | 2.72小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | DONGBEI_ASR003_CN | wav | 音频 | 东北 | 中国 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | 8 | NA | NA | Appen China | Z | |||
367 | 平行语料 | 50000对 | MT|聊天机器人|对话式AI | 添加到咨询列表 | Chinese_Thai_corpus_CN | text | 文本 | 中文泰语 | N/A | NA | NA | NA | NA | NA | NA | NA | Appen China | Z | ||
159 | 发音词典 | 107,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | dan_DNK_PHON | text | 文本 | 丹麦语 | 丹麦 | N/A | N/A | N/A | N/A | N/A | 107 000 | N/A | Appen Global | D | ||
86 | 有定稿的录音 | 53小时 | ASR|虚拟助手|聊天机器人 | 添加到咨询列表 | Speecon Danish | alaw | 音频 | 丹麦语 | 丹麦 | 麦克风 | 混合(办公室/娱乐场所/车内/公共场所) | 16 | 600(550个成年语料提供者及50个儿童语料提供者) | 170 000 | 可根据要求提供 | 4 | Nuance | D | ||
160 | 词性词典 | 100,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | dan_DNK_POS | text | 文本 | 丹麦语 | 丹麦 | N/A | N/A | N/A | N/A | N/A | 100 000 | N/A | Appen Global | D | ||
247 | 发音词典 | 5,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | ukr_UKR_PHON | text | 文本 | 乌克兰语 | 乌克兰 | N/A | N/A | N/A | N/A | N/A | 5 000 | N/A | Appen Global | W | ||
320 | 自由说 | 182.68小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | UZB_AKD_ASR001_CN | wav | 音频 | 乌兹别克 | 乌兹别克 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | 1500+ | NA | NA | 1 | Appen China | W | ||
133 | NER | 20,634个句子 | NER|内容分类|搜索引擎 | 添加到咨询列表 | URD_NER001 | text | 文本 | 乌尔都语 | 巴基斯坦 | N/A | N/A | N/A | N/A | 20 634 | 可根据要求提供 | N/A | Appen Global | W | ||
319 | 自由说 | 431.04小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | URD_AKD_ASR001_CN | wav | 音频 | 乌尔都语 | 乌尔都语 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | 1500+ | NA | NA | 1 | Appen China | W | ||
101 | 对话录音 | 47小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | URD_ASR001 | wav | 音频 | 乌尔都语 | 印度-巴基斯坦 | 移动电话和固定电话 | 混合 | 8 | 1 000 | 可根据要求提供 | 10 871 | 2 | Appen Global | W | ||
248 | 发音词典 | 40,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | urd_PAK_PHON | text | 文本 | 乌尔都语 | 巴基斯坦 | N/A | N/A | N/A | N/A | N/A | 40 000 | N/A | Appen Global | W | ||
249 | 词性词典 | 12,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | urd_PAK_POS | text | 文本 | 乌尔都语 | 巴基斯坦 | N/A | N/A | N/A | N/A | N/A | 12 000 | N/A | Appen Global | W | ||
307 | 自由说 | 176.74小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | ARM_AKD_ASR001_CN | wav | 音频 | 亚美尼亚 | 亚美尼亚 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | 1500+ | NA | NA | 1 | Appen China | Y | ||
265 | 语料朗读 | 68.25小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | Tagalo_ASR001_CN | ulaw,alaw | 音频 | 他加禄语 | 菲律宾 | 电话录音 | 低背景噪音(家庭/办公室) | 16 | 84 | NA | NA | 1 | Appen China | T | ||
194 | 发音词典 | 30,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | ibo_NGA_PHON | text | 文本 | 伊博语 | 奈及利亚 | N/A | N/A | N/A | N/A | N/A | 30 000 | N/A | Appen Global | Y | ||
178 | 发音词典 | 80,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | pes_IRN_PHON | text | 文本 | 波斯语 | 伊朗 | N/A | N/A | N/A | N/A | N/A | 80 000 | N/A | Appen Global | Y | ||
179 | 词性词典 | 1,400,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | pes_IRN_POS | text | 文本 | 波斯语 | 伊朗 | N/A | N/A | N/A | N/A | N/A | 1 400 000 | N/A | Appen Global | Y | ||
224 | 发音词典 | 115,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | rus_RUS_PHON | text | 文本 | 俄语 | 俄国 | N/A | N/A | N/A | N/A | N/A | 115 000 | N/A | Appen Global | E | ||
78 | 对话录音 | 37小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | RUS_ASR001 | alaw或wav | 音频 | 俄语 | 俄国 | 移动电话和固定电话 | 低背景噪音 | 8 | 200 | 可根据要求提供 | 28 284 | 2 | Appen Global | E | ||
80 | 有定稿的录音 | 180小时 | ASR|呼叫中心|虚拟助手 | 添加到咨询列表 | Russian SpeechDat(E) Database | alaw | 音频 | 俄语 | 俄国 | 仅固定电话 | 低背景噪音 | 8 | 2 500 | 112 000 | 可根据要求提供 | 1 | Nuance | E | ||
79 | 有定稿的录音 | 31小时 | ASR|虚拟助手|聊天机器人 | 添加到咨询列表 | RUS_ASR002 | wav | 音频 | 俄语 | 俄国 | 麦克风 | 低背景噪音(家庭/办公室) | 16 | 115 | 12 205 | 可根据要求提供 | 1 | Global Phone | E | ||
92 | 有定稿的录音 | 46小时 | ASR|虚拟助手|聊天机器人 | 添加到咨询列表 | Speecon Russian Database | 可根据要求提供 | 音频 | 俄语 | 俄国 | 麦克风 | 混合(办公室/娱乐场所/车内/公共场所) | 16 | 600(550个成年语料提供者及50个儿童语料提供者) | 170 000 | 可根据要求提供 | 4 | Nuance | E | ||
225 | 词性词典 | 100,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | rus_RUS_POS | text | 文本 | 俄语 | 俄国 | N/A | N/A | N/A | N/A | N/A | 100 000 | N/A | Appen Global | E | ||
129 | NER | 29,888个句子 | NER|内容分类|搜索引擎 | 添加到咨询列表 | RUS_NER001 | text | 文本 | 俄语 | 俄国 | N/A | N/A | N/A | N/A | 29 888 | 可根据要求提供 | N/A | Appen Global | E | ||
269 | 自由说 | 30.89小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | RUS_ASR003_CN | wav | 音频 | 俄语(俄国) | 俄国 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | 32 | NA | NA | 1 | Appen China | E | ||
151 | 发音词典 | 55,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | bul_BGR_PHON | text | 文本 | 保加利亚语 | 保加利亚 | N/A | N/A | N/A | N/A | N/A | 55 000 | N/A | Appen Global | B | ||
6 | 对话录音 | 38小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | BUL_ASR001 | alaw | 音频 | 保加利亚语 | 保加利亚 | 移动电话和固定电话 | 低背景噪音(家庭/办公室) | 8 | 217 | 可根据要求提供 | 22 342 | 2 | Appen Global | B | ||
107 | 有定稿的录音 | 22小时 | ASR|虚拟助手|聊天机器人 | 添加到咨询列表 | BUL_ASR002 | wav | 音频 | 保加利亚语 | 保加利亚 | 麦克风 | 低背景噪音(家庭/办公室) | 16 | 77 | 8 674 | 可根据要求提供 | 1 | Global Phone | B | ||
157 | 发音词典 | 20,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | hrv_HRV_PHON | text | 文本 | 克罗地亚语 | 克罗地亚 | N/A | N/A | N/A | N/A | N/A | 20 000 | N/A | Appen Global | K | ||
8 | 对话录音 | 39小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | CRO_ASR001 | alaw | 音频 | 克罗地亚语 | 克罗地亚 | 移动电话和固定电话 | 低背景噪音(家庭/办公室) | 8 | 200 | 可根据要求提供 | 23 919 | 2 | Appen Global | K | ||
112 | 有定稿的录音 | 263小时 | ASR|虚拟助手|聊天机器人 | 添加到咨询列表 | CRO_ASR003_CN | wav | 音频 | 克罗地亚语 | 克罗地亚 | 移动电话 | 低背景噪音(家庭/办公室) | 16 | 243 | 73 467 | 136 140 | 1 | Appen China | K | ||
9 | 有定稿的录音 | 11小时 | ASR|虚拟助手|聊天机器人 | 添加到咨询列表 | CRO_ASR002 | wav | 音频 | 克罗地亚语 | 克罗地亚 | 麦克风 | 低背景噪音(家庭/办公室) | 16 | 94 | 4 499 | 可根据要求提供 | 1 | Global Phone | K | ||
358 | OCR | 985张 | 图片标签识别训练 | 添加到咨询列表 | IMG_OCR_Public financial statements_CN | jpg | 图像 | 中文 | 中国 | 手机/照相机 | 多种光线 | NA | NA | NA | NA | NA | Appen China | G | ||
261 | 对话录音 | 100小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | NMG_ASR001_CN | wav | 音频 | 内蒙古族语 | 中国 | 移动电话 | 低背景噪音(家庭/办公室) | 16 | 200 | NA | NA | 1 | Appen China | Z | ||
356 | OCR | 5200张 | 图片标签识别训练 | 添加到咨询列表 | IMG_OCR_Junior high school chemistry_CN | jpg | 图像 | 中文 | 中国 | 手机/照相机 | 多种光线 | NA | NA | NA | NA | NA | Appen China | C | ||
346 | OCR | 911张 | 图片标签识别训练 | 添加到咨询列表 | IMG_OCR_Middle School Physics_CN | jpg | 图像 | 中文 | 中国 | 手机/照相机 | 多种光线 | NA | NA | NA | NA | NA | Appen China | C | ||
357 | OCR | 6506张 | 图片标签识别训练 | 添加到咨询列表 | IMG_OCR_junior biology_CN | jpg | 图像 | 中文 | 中国 | 手机/照相机 | 多种光线 | NA | NA | NA | NA | NA | Appen China | C | ||
155 | 发音词典 | 10,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | cat_ESP_PHON | text | 文本 | 加泰罗尼亚语 | 西班牙 | N/A | N/A | N/A | N/A | N/A | 10 000 | N/A | Appen Global | J | ||
311 | 自由说 | 66.49小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | HUN_AKD_ASR001_CN | wav | 音频 | 匈牙利 | 匈牙利 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | 1500+ | NA | NA | 1 | Appen China | X | ||
193 | 发音词典 | 500个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | hun_HUN_PHON | text | 文本 | 匈牙利语 | 匈牙利 | N/A | N/A | N/A | N/A | N/A | 500 | N/A | Appen Global | X | ||
115 | 有定稿的录音 | 286小时 | ASR|虚拟助手|聊天机器人 | 添加到咨询列表 | HUN_ASR001_CN | wav | 音频 | 匈牙利语 | 匈牙利 | 移动电话 | 低背景噪音(家庭/办公室) | 16 | 254 | 94 031 | 201 921 | 1 | Appen China | X | ||
45 | 有定稿的录音 | 65小时 | ASR|呼叫中心|虚拟助手 | 添加到咨询列表 | Hungarian SpeechDat(E) | 可根据要求提供 | 音频 | 匈牙利语 | 匈牙利 | 仅固定电话 | 低背景噪音 | 8 | 1 000 | 48 000 | 可根据要求提供 | 1 | Nuance | X | ||
200 | 发音词典 | 35,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | kan_IND_PHON | text | 文本 | 坎那达语 | 印度 | N/A | N/A | N/A | N/A | N/A | 35 000 | N/A | Appen Global | K | ||
54 | 对话录音 | 15小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | KAN_ASR001 | alaw | 音频 | 坎那达语 | 印度 | 移动电话和固定电话 | 混合 | 8 | 178 | 可根据要求提供 | 15 660 | 2 | Appen Global | K | ||
105 | 对话录音 | 57小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | KAN_ASR001A | alaw | 音频 | 坎那达语 | 印度 | 移动电话和固定电话 | 混合 | 8 | 1 000 | 可根据要求提供 | 15 660 | 2 | Appen Global | K | ||
162 | 发音词典 | 20,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | luo_KEN_PHON | text | 文本 | 卢奥语 | 肯尼亚 | N/A | N/A | N/A | N/A | N/A | 20 000 | N/A | Appen Global | L | ||
284 | 自由说 | 2.65小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | HINDI_ASR001_CN | wav | 音频 | 印地语 | 印度 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | 6 | NA | NA | Appen China | Y | |||
303 | 自由说 | 800小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | HIN_AKC_ASR001_CN | wav | 音频 | 印地语 | 印地语 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | 400+ | NA | NA | 1 | Appen China | Y | ||
341 | OCR | 467张 | 图片标签识别训练 | 添加到咨询列表 | IMG_OCR_Hindi_CN | jpg | 图像 | 印地语 | 印地 | 手机/照相机 | 多种光线 | NA | NA | NA | NA | NA | Appen China | Y | ||
192 | 发音词典 | 35,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | hin_IND_PHON | text | 文本 | 印地语 | 印度 | N/A | N/A | N/A | N/A | N/A | 35 000 | N/A | Appen Global | Y | ||
44 | 对话录音 | 32小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | HIN_ASR002 | wav | 音频 | 印地语 | 印度 | 移动电话和固定电话 | 混合 | 8 | 996 | 可根据要求提供 | 12 266 | 2 | Appen Global | Y | ||
43 | 有定稿的录音 | 224小时 | ASR|呼叫中心|虚拟助手 | 添加到咨询列表 | HIN_ASR001 | alaw | 音频 | 印地语 | 印度 | 移动电话 | 低背景噪音 | 8 | 1 920 | 96 000 | 9 853 | 1 | Appen Global | Y | ||
147 | 发音词典 | 95,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | ind_IDN_PHON | text | 文本 | 印度尼西亚语 | 印度尼西亚 | N/A | N/A | N/A | N/A | N/A | 95 000 | N/A | Appen Global | Y | ||
148 | 词性词典 | 10,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | ind_IDN_POS | text | 文本 | 印度尼西亚语 | 印度尼西亚 | N/A | N/A | N/A | N/A | N/A | 10 000 | N/A | Appen Global | Y | ||
312 | 自由说 | 83.37小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | IND_AKD_ASR001_CN | wav | 音频 | 印尼 | 印尼 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | 1500+ | NA | NA | 1 | Appen China | Y | ||
286 | 自由说 | 3.77小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | IND_ASR001_CN | wav | 音频 | 印尼语 | 印尼 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | 7 | NA | NA | Appen China | Y | |||
3 | 对话录音 | 31小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | BAH_ASR001 | wav | 音频 | 印度尼西亚语 | 印度尼西亚 | 移动电话和固定电话 | 低背景噪音 | 8 | 1 002 | 可根据要求提供 | 11 480 | 2 | Appen Global | Y | ||
324 | 有字幕视频 | 23838小时 | NA | 添加到咨询列表 | TAIWAN_AUD001_CN | MP4 | 视频 | 台湾 | 台湾语 | NA | NA | NA | NA | NA | NA | NA | Appen China | T | ||
279 | 自由说 | 3.12小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | TAIWAN_ASR001_CN | wav | 音频 | 台湾 | 中国 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | 10 | NA | NA | Appen China | Z | |||
251 | 发音词典 | 10,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | wuu_CHN_PHON | text | 文本 | 吴语 | 中国 | N/A | N/A | N/A | N/A | N/A | 10 000 | N/A | Appen Global | W | ||
313 | 自由说 | 139.46小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | KAZ_AKD_ASR001_CN | wav | 音频 | 哈萨克斯坦 | 哈萨克斯坦 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | 1500+ | NA | NA | 1 | Appen China | H | ||
201 | 发音词典 | 30,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | kaz_KAZ_PHON | text | 文本 | 哈萨克语 | 哈萨克斯坦 | N/A | N/A | N/A | N/A | N/A | 30 000 | N/A | Appen Global | H | ||
327 | OCR | 5,832 documents | 图片标签识别训练 | 添加到咨询列表 | IMG_OCR_B2B | jpg | 图像 | N/A | 多国 | 手机/照相机 | 多种光线 | NA | NA | NA | NA | NA | Appen Global | S | ||
328 | OCR | 22,626 documents | 图片标签识别训练 | 添加到咨询列表 | IMG_OCR_B2C_Other | jpg | 图像 | N/A | 多国 | 手机/照相机 | 多种光线 | NA | NA | NA | NA | NA | Appen Global | S | ||
360 | OCR | 5352张 | 图片标签识别训练 | 添加到咨询列表 | IMG_OCR_Product label_CN | jpg | 图像 | 中文 | 中国 | 手机/照相机 | 多种光线 | NA | NA | NA | NA | NA | Appen China | S | ||
283 | 语料朗读 | 3.86小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | SICHUAN_ASR001_CN | wav | 音频 | 四川 | 中国 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | 8 | NA | NA | Appen China | Z | |||
245 | 发音词典 | 255,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | tur_TUR_PHON | text | 文本 | 土耳其语 | 土耳其 | N/A | N/A | N/A | N/A | N/A | 255 000 | N/A | Appen Global | T | ||
98 | 对话录音 | 41小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | TUR_ASR001 | alaw或wav | 音频 | 土耳其语 | 土耳其 | 移动电话和固定电话 | 低背景噪音 | 8 | 200 | 可根据要求提供 | 32 386 | 2 | Appen Global | T | ||
117 | 有定稿的录音 | 739小时 | ASR|虚拟助手|聊天机器人 | 添加到咨询列表 | TUR_ASR003_CN | wav | 音频 | 土耳其语 | 土耳其 | 移动电话 | 低背景噪音(家庭/办公室) | 16 | 664 | 185 706 | 215 135 | 1 | Appen China | T | ||
65 | 有定稿的录音 | 118小时 | ASR|呼叫中心|虚拟助手 | 添加到咨询列表 | OrienTel Turkish Database | 可根据要求提供 | 音频 | 土耳其语 | 土耳其 | 移动电话和固定电话 | 低背景噪音 | 8 | 1 700 | 76 500 | 可根据要求提供 | 1 | Nuance | T | ||
246 | 词性词典 | 257,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | tur_TUR_POS | text | 文本 | 土耳其语 | 土耳其 | N/A | N/A | N/A | N/A | N/A | 257 000 | N/A | Appen Global | T | ||
99 | 有定稿的录音 | 17小时 | ASR|虚拟助手|聊天机器人 | 添加到咨询列表 | TUR_ASR002 | wav | 音频 | 土耳其语 | 土耳其 | 麦克风 | 低背景噪音(家庭/办公室) | 16 | 100 | 6 950 | 可根据要求提供 | 1 | Global Phone | T | ||
240 | 发音词典 | 30,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | tgl_PHL_PHON | text | 文本 | 塔加拉族语 | 菲律宾 | N/A | N/A | N/A | N/A | N/A | 30 000 | N/A | Appen Global | T | ||
226 | 发音词典 | 15,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | srp_SRB_PHON | text | 文本 | 塞尔维亚语 | 塞尔维亚 | N/A | N/A | N/A | N/A | N/A | 15 000 | N/A | Appen Global | S | ||
239 | 发音词典 | 22,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | syl_BGD -IND_PHON | text | 文本 | 塞海蒂语 | 孟加拉国-印度 | N/A | N/A | N/A | N/A | N/A | 22 000 | N/A | Appen Global | S | ||
264 | 有定稿的录音 | 200小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | FOREIGNER_ASR001_CN | wav | 音频 | 中文(外国人) | 多国 | 移动电话 | 低背景噪音(家庭/办公室) | 16 | 200 | NA | NA | Appen China | Z | |||
266 | 物体图片 | 680张 | 图片标签识别训练 | 添加到咨询列表 | IMG_BODY_POSE_CN | jpg | 图像 | N/A | 多国 | 手机/照相机 | 多种光线 | NA | NA | NA | NA | NA | Appen China | Z | ||
263 | 物体图片 | 2196 张 | 图片标签识别训练 | 添加到咨询列表 | IMG_TAG_CN | jpg | 图像 | N/A | N/A | 手机/照相机 | 多种光线 | NA | NA | NA | NA | NA | Appen China | Z | ||
338 | OCR | 5754张 | 图片标签识别训练 | 添加到咨询列表 | IMG_CAR_License plate processing | jpg | 图像 | 中文 | 中国 | 手机/照相机 | 多种光线 | NA | NA | NA | NA | NA | Appen China | D | ||
215 | 发音词典 | 15,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | ori_IND_PHON | text | 文本 | 奥里雅语 | 印度 | N/A | N/A | N/A | N/A | N/A | 15 000 | N/A | Appen Global | A | ||
321 | 自由说 | 70小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | BABY_CRYING_ASR001_CN | wav | 音频 | 中国 | 中国 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | 566 | NA | NA | 1 | Appen China | Y | ||
120 | 人声 | 3小时 | 婴儿监控器|安全及其他消费者应用程序 | 添加到咨询列表 | CRY_ASR001 | wav | 音频 | N/A | 中国 | 移动电话 | 低背景噪音(家庭/办公室) | 16 | 100 | NA | NA | 1 | Appen China | Z | ||
309 | 自由说 | 265.26小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | BAN_AKD_ASR001_CN | wav | 音频 | 孟加拉 | 孟加拉 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | 1500+ | NA | NA | 1 | Appen China | M | ||
150 | 发音词典 | 29,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | ben_IND_PHON | text | 文本 | 孟加拉语 | 印度 | N/A | N/A | N/A | N/A | N/A | 29 000 | N/A | Appen Global | M | ||
5 | 对话录音 | 47小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | BEN_ASR001 | alaw | 音频 | 孟加拉语 | 孟加拉国 | 移动电话和固定电话 | 混合(车内/路边/家庭/办公室) | 8 | 1 000 | 可根据要求提供 | 17 922 | 2 | Appen Global | M | ||
354 | OCR | 434张 | 图片标签识别训练 | 添加到咨询列表 | IMG_OCR_Academic papers_CN | jpg | 图像 | 中文 | 中国 | 手机/照相机 | 多种光线 | NA | NA | NA | NA | NA | Appen China | X | ||
331 | OCR | 42764 张 | 图片标签识别训练 | 添加到咨询列表 | IMG_OCR_pet_CN | jpg | 图像 | 中国 | 中国 | 手机/照相机 | 多种光线 | NA | NA | NA | NA | NA | Appen China | C | ||
335 | OCR | 120ID | 图片标签识别训练 | 添加到咨询列表 | IMG_Pets&Babies_CN | jpg | 图像 | 中国 | 多国 | 手机/照相机 | 多种光线 | NA | NA | NA | NA | NA | Appen China | C | ||
156 | 发音词典 | 20,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | ceb_PHL_PHON | text | 文本 | 宿雾语 | 菲律宾 | N/A | N/A | N/A | N/A | N/A | 20 000 | N/A | Appen Global | S | ||
352 | OCR | 453张 | 图片标签识别训练 | 添加到咨询列表 | IMG_OCR_Elementary school Chinese composition_CN | jpg | 图像 | 中文 | 中国 | 手机/照相机 | 多种光线 | NA | NA | NA | NA | NA | Appen China | X | ||
347 | OCR | 2651张 | 图片标签识别训练 | 添加到咨询列表 | IMG_OCR_Elementary Mathematics_CN | jpg | 图像 | 中文 | 中国 | 手机/照相机 | 多种光线 | NA | NA | NA | NA | NA | Appen China | X | ||
351 | OCR | 717张 | 图片标签识别训练 | 添加到咨询列表 | IMG_OCR_Elementary school English composition_CN | jpg | 图像 | 中文 | 中国 | 手机/照相机 | 多种光线 | NA | NA | NA | NA | NA | Appen China | X | ||
362 | OCR | 1333张 | 图片标签识别训练 | 添加到咨询列表 | IMG_OCR_English Tutoring_CN | jpg | 图像 | 中文 | 中国 | 手机/照相机 | 多种光线 | NA | NA | NA | NA | NA | Appen China | X | ||
363 | OCR | 4082张 | 图片标签识别训练 | 添加到咨询列表 | IMG_OCR_Chinese tutoring_CN | jpg | 图像 | 中文 | 中国 | 手机/照相机 | 多种光线 | NA | NA | NA | NA | NA | Appen China | X | ||
361 | OCR | 16331张 | 图片标签识别训练 | 添加到咨询列表 | IMG_OCR_quick calculation_CN | jpg | 图像 | 中文 | 中国 | 手机/照相机 | 多种光线 | NA | NA | NA | NA | NA | Appen China | X | ||
316 | 自由说 | 164.28小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | NEP_AKD_ASR001_CN | wav | 音频 | 尼泊尔 | 尼泊尔 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | 1500+ | NA | NA | 1 | Appen China | N | ||
149 | 发音词典 | 10,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | eus_ESP_PHON | text | 文本 | 巴斯克语 | 西班牙 | N/A | N/A | N/A | N/A | N/A | 10 000 | N/A | Appen Global | B | ||
191 | 发音词典 | 31,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | heb_ISR_PHON | text | 文本 | 希伯来语 | 以色列 | N/A | N/A | N/A | N/A | N/A | 31 000 | N/A | Appen Global | X | ||
42 | 对话录音 | 34小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | HEB_ASR001 | alaw或wav | 音频 | 希伯来语 | 以色列 | 移动电话和固定电话 | 低背景噪音 | 8 | 200 | 可根据要求提供 | 19 250 | 2 | Appen Global | X | ||
187 | 发音词典 | 5,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | ell_GRC_PHON | text | 文本 | 希腊语 | 希腊 | N/A | N/A | N/A | N/A | N/A | 5 000 | N/A | Appen Global | X | ||
114 | 有定稿的录音 | 191小时 | ASR|虚拟助手|聊天机器人 | 添加到咨询列表 | GRE_ASR001_CN | wav | 音频 | 希腊语 | 希腊 | 移动电话 | 低背景噪音(家庭/办公室) | 16 | 287 | 54 113 | 68 271 | 1 | Appen China | X | ||
152 | 发音词典 | 37,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | yue_CHN_PHON | text | 文本 | 广东话 (粤语) | 中国 | N/A | N/A | N/A | N/A | N/A | 37 000 | N/A | Appen Global | G | ||
153 | 发音词典 | 40,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | yue_CHN_PHON | text | 文本 | 广东话 (粤语) | 中国 | N/A | N/A | N/A | N/A | N/A | 40 000 | N/A | Appen Global | G | ||
154 | 词性词典 | 10,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | yue_HKG_POS | text | 文本 | 广东话 (粤语) | 中国 | N/A | N/A | N/A | N/A | N/A | 10 000 | N/A | Appen Global | G | ||
278 | 语料朗读 | 4.06小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | GUANGDONG_ASR001_CN | wav | 音频 | 广东 | 中国 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | 8 | NA | NA | Appen China | Z | |||
204 | 发音词典 | 60,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | kur_TUR_PHON | text | 文本 | 库尔德语 | 土耳其 | N/A | N/A | N/A | N/A | N/A | 60 000 | N/A | Appen Global | K | ||
267 | 自由说 | 20.19小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | DEU_ASR004_CN | wav | 音频 | 德语 (德国) | 德国 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | 80 | NA | NA | 1 | Appen China | D | ||
322 | 有字幕视频 | 10261 小时 | NA | 添加到咨询列表 | ESP_AUD001_CN | MP4 | 视频 | 西班牙 | 西班牙 | NA | NA | NA | NA | NA | NA | NA | Appen China | D | ||
340 | OCR | 636张 | 图片标签识别训练 | 添加到咨询列表 | IMG_OCR_Germany_CN | jpg | 图像 | 德语 | 德国 | 手机/照相机 | 多种光线 | NA | NA | NA | NA | NA | Appen China | D | ||
57 | 有定稿的录音 | 33小时 | ASR|呼叫中心|虚拟助手 | 添加到咨询列表 | Luxembourgish German SpeechDat(II) FDB-500 (FIXED1LG) | 可根据要求提供 | 音频 | 德语 | 卢森堡 | 仅固定电话 | 低背景噪音 | 8 | 500 | 26 500 | 可根据要求提供 | 1 | Nuance | D | ||
64 | 有定稿的录音 | 31小时 | ASR|呼叫中心|虚拟助手 | 添加到咨询列表 | OrienTel German Spoken by Turkish | 可根据要求提供 | 音频 | 德语 | 土耳其 | 移动电话和固定电话 | 低背景噪音 | 8 | 300 | 15 600 | 可根据要求提供 | 1 | Nuance | D | ||
185 | 发音词典 | 146,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | deu_DEU_PHON | text | 文本 | 德语 | 德国 | N/A | N/A | N/A | N/A | N/A | 146 000 | N/A | Appen Global | D | ||
294 | 对话 | 100 小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | DEU_ASR004 | wav | 音频 | 德语 | 德国 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | NA | NA | NA | 1 | Appen Global | D | ||
14 | 有定稿的录音 | 16小时 | ASR|虚拟助手|聊天机器人 | 添加到咨询列表 | DEU_ASR001 | alaw | 音频 | 德语 | 德国 | 麦克风 | 低背景噪音(录音棚) | 16 | 127 | 12 700 | 6 826 | 2 | Appen Global | D | ||
15 | 有定稿的录音 | 25小时 | ASR|虚拟助手|聊天机器人 | 添加到咨询列表 | DEU_ASR003 | wav | 音频 | 德语 | 德国 | 麦克风 | 低背景噪音(家庭/办公室) | 16 | 77 | 10 085 | 可根据要求提供 | 1 | Global Phone | D | ||
38 | 有定稿的录音 | 31小时 | ASR|呼叫中心|虚拟助手 | 添加到咨询列表 | German SpeechDat (II) FDB-1000 | 可根据要求提供 | 音频 | 德语 | 德国 | 仅固定电话 | 低背景噪音(家庭/办公室) | 8 | 988 | 43 000 | 可根据要求提供 | 1 | Nuance | D | ||
39 | 有定稿的录音 | 268小时 | ASR|呼叫中心|虚拟助手 | 添加到咨询列表 | German SpeechDat(II) FDB-4000 | 可根据要求提供 | 音频 | 德语 | 德国 | 仅固定电话 | 低背景噪音(家庭/办公室) | 8 | 4 000 | 160 000 | 可根据要求提供 | 1 | Nuance | D | ||
186 | 发音词典 | 15,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | deu_CHE_PHON | text | 文本 | 德语 | 瑞士 | N/A | N/A | N/A | N/A | N/A | 15 000 | N/A | Appen Global | D | ||
90 | 有定稿的录音 | 53小时 | ASR|虚拟助手|聊天机器人 | 添加到咨询列表 | Speecon German (Switzerland) database | 可根据要求提供 | 音频 | 德语 | 瑞士 | 麦克风 | 混合(办公室/娱乐场所/车内/公共场所) | 16 | 600(550个成年语料提供者及50个儿童语料提供者) | 170 000 | 可根据要求提供 | 4 | Nuance | D | ||
296 | 对话 | 250 小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | ITA_ASR005 | wav | 音频 | 意大利 | 意大利 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | NA | NA | NA | 1 | Appen Global | Y | ||
195 | 发音词典 | 197,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | ita_ITA_PHON | text | 文本 | 意大利语 | 意大利 | N/A | N/A | N/A | N/A | N/A | 197 000 | N/A | Appen Global | Y | ||
48 | 对话录音 | 36小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | ITA_ASR003 | alaw | 音频 | 意大利语 | 意大利 | 移动电话和固定电话 | 低背景噪音 | 8 | 200 | 可根据要求提供 | 18 974 | 2 | Appen Global | Y | ||
46 | 有定稿的录音 | 44小时 | ASR|虚拟助手|聊天机器人 | 添加到咨询列表 | ITA_ASR001 | alaw | 音频 | 意大利语 | 意大利 | 麦克风 | 混合 | 22 | 200 | 40 000 | 7 316 | 4 | Appen Global | Y | ||
47 | 有定稿的录音 | 47小时 | ASR|虚拟助手|车载HMI及娱乐设备 | 添加到咨询列表 | ITA_ASR002 | alaw | 音频 | 意大利语 | 意大利 | 麦克风 | 混合(车内) | 48 | 103 | 35 875 | 10 366 | 4 | Appen Global | Y | ||
49 | 有定稿的录音 | 3小时 | TTS | 添加到咨询列表 | ITA_TTS001 | alaw | 音频 | 意大利语 | 意大利 | 麦克风 | 低背景噪音(录音棚) | 22 | 1 | 3 300 | 可根据要求提供 | 1 | Appen Global | Y | ||
50 | 有定稿的录音 | 38小时 | ASR|呼叫中心|虚拟助手 | 添加到咨询列表 | Italian Fixed Network Speech SpeechDat(M) Corpus | 可根据要求提供 | 音频 | 意大利语 | 意大利 | 仅固定电话 | 低背景噪音(家庭/办公室) | 8 | 1 000 | 39 000 | 可根据要求提供 | 1 | Nuance | Y | ||
51 | 有定稿的录音 | 228小时 | ASR|呼叫中心|虚拟助手 | 添加到咨询列表 | Italian SpeechDat(II) FDB-3000 | 可根据要求提供 | 音频 | 意大利语 | 意大利 | 仅固定电话 | 低背景噪音(家庭/办公室) | 8 | 3 040 | 134 000 | 可根据要求提供 | 1 | Nuance | Y | ||
52 | 有定稿的录音 | 103小时 | ASR|呼叫中心|虚拟助手 | 添加到咨询列表 | Italian SpeechDat(II) MDB-250 | 可根据要求提供 | 音频 | 意大利语 | 意大利 | 移动电话 | 低背景噪音(家庭/办公室) | 8 | 375 | 19 000 | 可根据要求提供 | 1 | Nuance | Y | ||
85 | 有定稿的录音 | 13小时 | ASR|呼叫中心|虚拟助手 | 添加到咨询列表 | SpeechDat(M) Italian Mobile Network Speech Database | 可根据要求提供 | 音频 | 意大利语 | 意大利 | 移动电话 | 低背景噪音(家庭/办公室) | 8 | 342 | 13 500 | 可根据要求提供 | 1 | Nuance | Y | ||
196 | 词性词典 | 147,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | ita_ITA_POS | text | 文本 | 意大利语 | 意大利 | N/A | N/A | N/A | N/A | N/A | 147 000 | N/A | Appen Global | Y | ||
290 | 自由说 | 3.8小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | ITA_ASR001_CN | wav | 音频 | 意大利语 | 意大利 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | 6 | NA | NA | Appen China | Y | |||
329 | OCR | 964 张 | 图片标签识别训练 | 添加到咨询列表 | IMG_OCR_Handwritten | jpg | 图像 | N/A | 多国 | 手机/照相机 | 多种光线 | NA | NA | NA | NA | NA | Appen Global | S | ||
244 | 发音词典 | 10,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | tpi_PNG_PHON | text | 文本 | 托克皮辛语 | 巴布亚新几内亚 | N/A | N/A | N/A | N/A | N/A | 10 000 | N/A | Appen Global | T | ||
314 | 自由说 | 30.1小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | LAT_AKD_ASR001_CN | wav | 音频 | 拉脱维亚 | 拉脱维亚 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | 1500+ | NA | NA | 1 | Appen China | L | ||
213 | 发音词典 | 115,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | nor_NOR_PHON | text | 文本 | 挪威语 | 挪威 | N/A | N/A | N/A | N/A | N/A | 115 000 | N/A | Appen Global | N | ||
214 | 词性词典 | 3,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | nor_NOR_POS | text | 文本 | 挪威语 | 挪威 | N/A | N/A | N/A | N/A | N/A | 3 000 | N/A | Appen Global | N | ||
158 | 发音词典 | 50,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | ces_CZE_PHON | text | 文本 | 捷克语 | 捷克共和国 | N/A | N/A | N/A | N/A | N/A | 50 000 | N/A | Appen Global | J | ||
11 | 有定稿的录音 | 93小时 | ASR|呼叫中心|虚拟助手 | 添加到咨询列表 | Czech SpeechDat(E) Dataset | alaw | 音频 | 捷克语 | 捷克共和国 | 仅固定电话 | 低背景噪音 | 8 | 1 000 | 52 000 | 可根据要求提供 | 1 | Nuance | J | ||
10 | 有定稿的录音 | 31小时 | ASR|虚拟助手|聊天机器人 | 添加到咨询列表 | CZE_ASR001 | wav | 音频 | 捷克语 | 捷克共和国 | 麦克风 | 低背景噪音(家庭/办公室) | 16 | 102 | 12 425 | 可根据要求提供 | 1 | Global Phone | J | ||
364 | OCR | 106张 | 图片标签识别训练 | 添加到咨询列表 | IMG_OCR_politics and law_CN | jpg | 图像 | 中文 | 中国 | 手机/照相机 | 多种光线 | NA | NA | NA | NA | NA | Appen China | Z | ||
355 | OCR | 12940张 | 图片标签识别训练 | 添加到咨询列表 | IMG_OCR_Educational aids_CN | jpg | 图像 | 中文 | 中国 | 手机/照相机 | 多种光线 | NA | NA | NA | NA | NA | Appen China | J | ||
81 | 有定稿的录音 | 65小时 | ASR|呼叫中心|虚拟助手 | 添加到咨询列表 | Slovak SpeechDat(E) Database | 可根据要求提供 | 音频 | 斯洛伐克语 | 斯洛伐克 | 仅固定电话 | 低背景噪音 | 8 | 1 000 | 48 000 | 可根据要求提供 | 1 | Nuance | S | ||
82 | 有定稿的录音 | 76小时 | ASR|呼叫中心|虚拟助手 | 添加到咨询列表 | Slovenian SpeechDat(II) FDB-1000 | 可根据要求提供 | 音频 | 斯洛维尼亚语 | 斯洛文尼亚 | 仅固定电话 | 低背景噪音(家庭/办公室) | 8 | 1 000 | 40 000 | 可根据要求提供 | 1 | Nuance | S | ||
236 | 发音词典 | 66,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | swa_KEN_PHON | text | 文本 | 斯瓦西里语 | 肯尼亚 | N/A | N/A | N/A | N/A | N/A | 66 000 | N/A | Appen Global | S | ||
76 | 对话录音 | 20小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | PAP_ASR001 | alaw | 音频 | 旁遮普语 | 巴基斯坦 | 移动电话和固定电话 | 低背景噪音 | 8 | 205 | 可根据要求提供 | 7 298 | 2 | Appen Global | P | ||
132 | NER | 20,629个句子 | NER|内容分类|搜索引擎 | 添加到咨询列表 | JPY_NER001 | text | 文本 | 日语 | 日本 | N/A | N/A | N/A | N/A | 20 629 | 可根据要求提供 | N/A | Appen Global | R | ||
337 | OCR | 1000张 | 图片标签识别训练 | 添加到咨询列表 | IMG_JP OCR Invoices_CN | jpg | 图像 | 日本 | 日本 | 手机/照相机 | 多种光线 | NA | NA | NA | NA | NA | Appen China | R | ||
285 | 自由说 | 3.38小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | JAP_ASR001_CN | wav | 音频 | 日语 | 日本 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | 6 | NA | NA | Appen China | R | |||
197 | 发音词典 | 262,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | jpn_JPN_PHON | text | 文本 | 日语 | 日本 | N/A | N/A | N/A | N/A | N/A | 262 000 | N/A | Appen Global | R | ||
53 | 有定稿的录音 | 33小时 | ASR|虚拟助手|聊天机器人 | 添加到咨询列表 | JPN_ASR001 | wav | 音频 | 日语 | 日本 | 麦克风 | 低背景噪音(家庭/办公室) | 16 | 144 | 13 067 | 可根据要求提供 | 1 | Global Phone | R | ||
91 | 有定稿的录音 | 57小时 | ASR|虚拟助手|聊天机器人 | 添加到咨询列表 | Speecon Japanese | 可根据要求提供 | 音频 | 日语 | 日本 | 麦克风 | 混合(办公室/娱乐场所/车内/公共场所) | 16 | 600(550个成年语料提供者及50个儿童语料提供者) | 170 000 | 可根据要求提供 | 4 | Nuance | R | ||
198 | 词性词典 | 265,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | jpn_JPN_POS | text | 文本 | 日语 | 日本 | N/A | N/A | N/A | N/A | N/A | 265 000 | N/A | Appen Global | R | ||
281 | 语料朗读 | 2.53小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | KUNMING_ASR001_CN | wav | 音频 | 昆明 | 中国 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | 8 | NA | NA | Appen China | Z | |||
216 | 发音词典 | 65,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | pus_AFG_PHON | text | 文本 | 普什图语 | 阿富汗 | N/A | N/A | N/A | N/A | N/A | 65 000 | N/A | Appen Global | P | ||
68 | 对话录音 | 55小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | PAS_ASR001 | wav | 音频 | 普什图语 | 阿富汗 | 移动电话和固定电话 | 低背景噪音 | 8 | 967 | 可根据要求提供 | 13 633 | 2 | Appen Global | P | ||
69 | 对话录音 | 39小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | PAS_ASR002 | wav | 音频 | 普什图语 | 阿富汗 | 麦克风 | 低背景噪音 | 16 | 40 | 可根据要求提供 | 9 480 | 2 | Appen Global | P | ||
70 | 广播录音 | 51小时 | ASR|自动字幕|关键字检索 | 添加到咨询列表 | PAS_BRC001 | wav | 音频 | 普什图语 | 阿富汗 | 麦克风 | 低背景噪音(录音棚) | N/A | N/A | 可根据要求提供 | 可根据要求提供 | 1 | Appen Global | P | ||
130 | NER | 17,313个句子 | NER|内容分类|搜索引擎 | 添加到咨询列表 | MAC_NER001 | text | 文本 | 普通话 | 中国 | N/A | N/A | N/A | N/A | 17 313 | 可根据要求提供 | N/A | Appen Global | P | ||
58 | 有定稿的录音 | 323小时 | ASR|呼叫中心|虚拟助手 | 添加到咨询列表 | MAC_ASR001 | alaw | 音频 | 普通话 | 中国 | 移动电话和固定电话 | 混合 | 8 | 2 000 | 200 000 | 7 145 | 1 | Appen Global | P | ||
59 | 有定稿的录音 | 26小时 | ASR|虚拟助手|聊天机器人 | 添加到咨询列表 | MAC_ASR002 | wav | 音频 | 普通话 | 中国 | 麦克风 | 低背景噪音(家庭/办公室) | 16 | 132 | 10 225 | 可根据要求提供 | 1 | Global Phone | P | ||
209 | 发音词典 | 35,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | zho_CHN_PHON | text | 文本 | 中文(简体) | 中国 | N/A | N/A | N/A | N/A | N/A | 35 000 | N/A | Appen Global | P | ||
210 | 发音词典 | 50,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | zho_TWN_PHON | text | 文本 | 中文(繁体) | 台湾 | N/A | N/A | N/A | N/A | N/A | 50 000 | N/A | Appen Global | P | ||
273 | 语料朗读 | 2.49小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | HANGZHOU_ASR001_CN | wav | 音频 | 杭州方言 | 中国 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | 10 | NA | NA | Appen China | Z | |||
259 | 对话录音 | 42.7小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | WUHAN_ASR001_CN | wav | 音频 | 武汉方言 | 中国 | 录音笔/麦克风 | 低背景噪音(家庭/办公室) | 16 | 135 | NA | NA | 1 | Appen China | Z | ||
260 | 对话录音 | 58.1小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | WUHAN_ASR002_CN | wav | 音频 | 武汉方言 | 中国 | 移动电话 | 低背景噪音(家庭/办公室) | 8 | 180 | NA | NA | 1 | Appen China | Z | ||
280 | 语料朗读 | 3.19小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | WUHAN_ASR003_CN | wav | 音频 | 武汉 | 中国 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | 8 | NA | NA | Appen China | Z | |||
275 | 语料朗读 | 2.9小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | HENAN_ASR001_CN | wav | 音频 | 河南 | 中国 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | 7 | NA | NA | Appen China | Z | |||
268 | 自由说 | 16.6小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | FRA_ASR004_CN | wav | 音频 | 法语 (法国) | 法国 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | 96 | NA | NA | 1 | Appen China | F | ||
339 | OCR | 1135张 | 图片标签识别训练 | 添加到咨询列表 | IMG_OCR_French_CN | jpg | 图像 | 法语 | 法国 | 手机/照相机 | 多种光线 | NA | NA | NA | NA | NA | Appen China | F | ||
182 | 发音词典 | 67,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | fra_CAN_PHON | text | 文本 | 法语 | 加拿大 | N/A | N/A | N/A | N/A | N/A | 67 000 | N/A | Appen Global | F | ||
32 | 对话录音 | 9小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | FRC_ASR003 | alaw | 音频 | 法语 | 加拿大 | 移动电话和固定电话 | 混合 | 8 | 68 | 可根据要求提供 | 6 022 | 2 | Appen Global | F | ||
30 | 有定稿的录音 | 131小时 | ASR|呼叫中心|虚拟助手 | 添加到咨询列表 | FRC_ASR001 | alaw | 音频 | 法语 | 加拿大 | 移动电话 | 混合 | 8 | 1 000 | 100 000 | 11 697 | 1 | Appen Global | F | ||
31 | 有定稿的录音 | 46小时 | ASR|虚拟助手|聊天机器人 | 添加到咨询列表 | FRC_ASR002 | alaw | 音频 | 法语 | 加拿大 | 麦克风 | 低背景噪音(家庭/办公室) | 16 | 150 | 22 500 | 10 755 | 1 | Appen Global | F | ||
56 | 有定稿的录音 | 45小时 | ASR|呼叫中心|虚拟助手 | 添加到咨询列表 | Luxembourgish French SpeechDat(II) FDB-500 (FIXED1LF) | 可根据要求提供 | 音频 | 法语 | 卢森堡 | 仅固定电话 | 低背景噪音 | 8 | 614 | 32 000 | 可根据要求提供 | 1 | Nuance | F | ||
4 | 有定稿的录音 | 76小时 | ASR|呼叫中心|虚拟助手 | 添加到咨询列表 | Belgian French SpeechDat(II) FDB-1000 (FIXED1BF) | alaw | 音频 | 法语 | 比利时 | 仅固定电话 | 低背景噪音 | 8 | 1 000 | 53 000 | 可根据要求提供 | 1 | Nuance | F | ||
295 | 对话 | 150 小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | FRF_ASR004 | wav | 音频 | 法语 | 法国 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | NA | NA | NA | 1 | Appen Global | F | ||
183 | 发音词典 | 112,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | fra_FRA_PHON | text | 文本 | 法语 | 法国 | N/A | N/A | N/A | N/A | N/A | 112 000 | N/A | Appen Global | F | ||
36 | 对话录音 | 25小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | FRF_ASR001 | alaw | 音频 | 法语 | 法国 | 移动电话和固定电话 | 低背景噪音 | 8 | 563 | 可根据要求提供 | 11 922 | 2 | Appen Global | F | ||
33 | 有定稿的录音 | 41小时 | ASR|呼叫中心|虚拟助手 | 添加到咨询列表 | French SpeechDat(II) FDB-1000 | 可根据要求提供 | 音频 | 法语 | 法国 | 仅固定电话 | 低背景噪音(家庭/办公室) | 8 | 1 017 | 48 000 | 可根据要求提供 | 1 | Nuance | F | ||
34 | 有定稿的录音 | 305小时 | ASR|呼叫中心|虚拟助手 | 添加到咨询列表 | French SpeechDat(II) FDB-5000 | 可根据要求提供 | 音频 | 法语 | 法国 | 仅固定电话 | 低背景噪音 | 8 | 5 040 | 237 000 | 可根据要求提供 | 1 | Nuance | F | ||
37 | 有定稿的录音 | 26小时 | ASR|虚拟助手|聊天机器人 | 添加到咨询列表 | FRF_ASR003 | wav | 音频 | 法语 | 法国 | 麦克风 | 低背景噪音(家庭/办公室) | 16 | 98 | 10 273 | 可根据要求提供 | 1 | Global Phone | F | ||
184 | 词性词典 | 95,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | fra_FRA_POS | text | 文本 | 法语 | 法国 | N/A | N/A | N/A | N/A | N/A | 95 000 | N/A | Appen Global | F | ||
35 | 有定稿的录音 | ASR|虚拟助手|车载HMI及娱乐设备 | 添加到咨询列表 | French SpeechDat-Car | 可根据要求提供 | 音频 | 法语 | 法国 | 麦克风和移动电话 | 混合(车内) | 16和8 | 300 | 37 500 | 可根据要求提供 | 5 | Nuance | F | |||
141 | 发音词典 | 4,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | fra_DZA_PHON | text | 文本 | 法语 | 阿尔及利亚 | N/A | N/A | N/A | N/A | N/A | 4 000 | N/A | Appen Global | F | ||
217 | 发音词典 | 40,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | pol_POL_PHON | text | 文本 | 波兰语 | 波兰 | N/A | N/A | N/A | N/A | N/A | 40 000 | N/A | Appen Global | B | ||
116 | 有定稿的录音 | 293小时 | ASR|虚拟助手|聊天机器人 | 添加到咨询列表 | POL_ASR002_CN | wav | 音频 | 波兰语 | 波兰 | 移动电话 | 低背景噪音(家庭/办公室) | 16 | 353 | 106 674 | 168 544 | 1 | Appen China | B | ||
72 | 有定稿的录音 | 78小时 | ASR|呼叫中心|虚拟助手 | 添加到咨询列表 | Polish SpeechDat(E) Database | 可根据要求提供 | 音频 | 波兰语 | 波兰 | 仅固定电话 | 低背景噪音 | 8 | 1 000 | 48 000 | 可根据要求提供 | 1 | Nuance | B | ||
71 | 有定稿的录音 | 25小时 | ASR|虚拟助手|聊天机器人 | 添加到咨询列表 | POL_ASR001 | wav | 音频 | 波兰语 | 波兰 | 麦克风 | 低背景噪音(家庭/办公室) | 16 | 99 | 10 130 | 可根据要求提供 | 1 | Global Phone | B | ||
218 | 词性词典 | 4,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | pol_POL_POS | text | 文本 | 波兰语 | 波兰 | N/A | N/A | N/A | N/A | N/A | 4 000 | N/A | Appen Global | B | ||
317 | 自由说 | 64.32小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | PER_AKD_ASR001_CN | wav | 音频 | 波斯 | 波斯 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | 1500+ | NA | NA | 1 | Appen China | B | ||
131 | NER | 19,584个句子 | NER|内容分类|搜索引擎 | 添加到咨询列表 | FAR_NER001 | text | 文本 | 波斯语 | 伊朗 | N/A | N/A | N/A | N/A | 19 584 | 可根据要求提供 | N/A | Appen Global | B | ||
28 | 对话录音 | 30小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | FAR_ASR002 | wav | 音频 | 波斯语 | 伊朗 | 移动电话和固定电话 | 混合 | 8 | 1 000 | 可根据要求提供 | 12 358 | 2 | Appen Global | B | ||
27 | 有定稿的录音 | 85小时 | ASR|呼叫中心|虚拟助手 | 添加到咨询列表 | FAR_ASR001 | alaw | 音频 | 波斯语 | 伊朗 | 移动电话和固定电话 | 混合 | 8 | 789 | 38 400 | 8 716 | 1 | Appen Global | B | ||
241 | 发音词典 | 50,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | tel_IND_PHON | text | 文本 | 泰卢固语 | 印度 | N/A | N/A | N/A | N/A | N/A | 50 000 | N/A | Appen Global | T | ||
242 | 发音词典 | 105,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | tam_IND_PHON | text | 文本 | 泰米尔语 | 印度 | N/A | N/A | N/A | N/A | N/A | 105 000 | N/A | Appen Global | T | ||
318 | 自由说 | 91.41小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | TAM_AKD_ASR001_CN | wav | 音频 | 泰米尔 | 泰米尔 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | 1500+ | NA | NA | 1 | Appen China | T | ||
333 | OCR | 3250 张 | 图片标签识别训练 | 添加到咨询列表 | IMG_OCR_THA002_CN | jpg | 图像 | 泰国 | 泰国 | 手机/照相机 | 多种光线 | NA | NA | NA | NA | NA | Appen China | T | ||
323 | 有字幕视频 | 7713 小时 | NA | 添加到咨询列表 | THA_AUD001_CN | MP4 | 视频 | 泰国 | 泰语 | NA | NA | NA | NA | NA | NA | NA | Appen China | T | ||
271 | 自由说 | 2.95小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | THA_ASR002_CN | wav | 音频 | 泰语(泰国) | 泰国 | 手机麦克风 | 低背景噪音(家庭/办公室) | 17 | NA | NA | Appen China | T | ||||
305 | 自由说 | 350小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | THA_AKC_ASR001_CN | wav | 音频 | 泰语 | 泰语 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | 400+ | NA | NA | 1 | Appen China | T | ||
301 | 电话信道 | 1000小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | TH_ASR001 | wav | 音频 | 泰语 | 泰国 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | NA | NA | NA | 1 | Appen Global | T | ||
123 | OCR | 1219张图片 | 文件处理|文件搜索 | 添加到咨询列表 | IMG_OCR_THA_CN | jpg | 图像 | 泰语 | 泰国 | 照相机 | 不同光线 | NA | 10 | NA | NA | NA | Appen China | T | ||
243 | 发音词典 | 30,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | tha_THA_PHON | text | 文本 | 泰语 | 泰国 | N/A | N/A | N/A | N/A | N/A | 30 000 | N/A | Appen Global | T | ||
97 | 有定稿的录音 | 28小时 | ASR|虚拟助手|聊天机器人 | 添加到咨询列表 | THA_ASR001 | wav | 音频 | 泰语 | 泰国 | 麦克风 | 低背景噪音(家庭/办公室) | 16 | 98 | 14 039 | 可根据要求提供 | 1 | Global Phone | T | ||
189 | 发音词典 | 15,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | hat_HTI_PHON | text | 文本 | 海地克里奥尔语 | 海地 | N/A | N/A | N/A | N/A | N/A | 15 000 | N/A | Appen Global | H | ||
359 | OCR | 1480张 | 图片标签识别训练 | 添加到咨询列表 | IMG_OCR_leaflets_CN | jpg | 图像 | 中文 | 中国 | 手机/照相机 | 多种光线 | NA | NA | NA | NA | NA | Appen China | H | ||
252 | 发音词典 | 10,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | hsn_CHN_PHON | text | 文本 | 湘语 | 中国 | N/A | N/A | N/A | N/A | N/A | 10 000 | N/A | Appen Global | X | ||
199 | 发音词典 | 20,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | jav_IDN_PHON | text | 文本 | 爪哇语 | 印度尼西亚 | N/A | N/A | N/A | N/A | N/A | 20 000 | N/A | Appen Global | G | ||
237 | 发音词典 | 100,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | swe_SWE_PHON | text | 文本 | 瑞典语 | 瑞典 | N/A | N/A | N/A | N/A | N/A | 100 000 | N/A | Appen Global | R | ||
238 | 词性词典 | 105,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | swe_SWE_POS | text | 文本 | 瑞典语 | 瑞典 | N/A | N/A | N/A | N/A | N/A | 105 000 | N/A | Appen Global | R | ||
94 | 有定稿的录音 | 30小时 | ASR|虚拟助手|聊天机器人 | 添加到咨询列表 | SWE_ASR001 | wav | 音频 | 瑞典语 | 瑞典-芬兰 | 麦克风 | 低背景噪音(家庭/办公室) | 16 | 98 | 11 816 | 可根据要求提供 | 1 | Global Phone | R | ||
188 | 发音词典 | 35,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | grn_PRY_PHON | text | 文本 | 瓜拉尼语 | 巴拉圭 | N/A | N/A | N/A | N/A | N/A | 35 000 | N/A | Appen Global | G | ||
334 | OCR | 10000张 | 图片标签识别训练 | 添加到咨询列表 | OMG_Skin segmentation_CN | jpg | 图像 | 中国 | 多国 | 手机/照相机 | 多种光线 | NA | NA | NA | NA | NA | Appen China | P | ||
336 | OCR | 11万张 | 图片标签识别训练 | 添加到咨询列表 | IMG_Monitoring/Mobile Camera Car_CN | jpg | 图像 | 中国 | 多国 | 手机/照相机 | 多种光线 | NA | NA | NA | NA | NA | Appen China | J | ||
253 | 发音词典 | 75,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | zul_ZAF_PHON | text | 文本 | 祖鲁语 | 南非 | N/A | N/A | N/A | N/A | N/A | 75 000 | N/A | Appen Global | Z | ||
206 | 发音词典 | 60,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | lit_LTU_PHON | text | 文本 | 立陶宛语 | 立陶宛 | N/A | N/A | N/A | N/A | N/A | 60 000 | N/A | Appen Global | L | ||
122 | OCR | 200张图片 | 文件处理|文件搜索 | 添加到咨询列表 | IMG_OCR_MAC_CN | jpg | 图像 | N/A | 中国 | 照相机 | 不同光线 | NA | 30 | NA | NA | NA | Appen China | Z | ||
228 | 发音词典 | 25,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | kur_IRQ_PHON | text | 文本 | 索马里语 | 伊拉克 | N/A | N/A | N/A | N/A | N/A | 25 000 | N/A | Appen Global | S | ||
227 | 发音词典 | 76,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | som_SOM_PHON | text | 文本 | 索马里语 | 索马里 | N/A | N/A | N/A | N/A | N/A | 76 000 | N/A | Appen Global | S | ||
83 | 对话录音 | 50小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | SOM_ASR001 | alaw | 音频 | 索马里语 | 索马里 | 移动电话和固定电话 | 低背景噪音 | 8 | 1 000 | 可根据要求提供 | 23 217 | 2 | Appen Global | S | ||
262 | 对话录音 | 122小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | WWE_ASR001_CN | wav | 音频 | 维吾尔族语 | 中国 | 移动电话 | 低背景噪音(家庭/办公室) | 16 | 231 | NA | NA | 1 | Appen China | Z | ||
326 | OCR | 461张 | 图片标签识别训练 | 添加到咨询列表 | IMG_OCR_THA001_CN | jpg | 图像 | 中国 | 维藏 | 手机/照相机 | 多种光线 | NA | NA | NA | NA | NA | Appen China | W | ||
274 | 语料朗读 | 3.9小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | WWE_ASR002_CN | wav | 音频 | 维语 | 中国 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | N/A | NA | NA | Appen China | Z | |||
223 | 发音词典 | 15,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | ron_ROU_PHON | text | 文本 | 罗马尼亚语 | 罗马尼亚 | N/A | N/A | N/A | N/A | N/A | 15 000 | N/A | Appen Global | L | ||
77 | 对话录音 | 37小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | ROM_ASR001 | alaw | 音频 | 罗马尼亚语 | 罗马尼亚 | 移动电话和固定电话 | 低背景噪音 | 8 | 200 | 可根据要求提供 | 16 658 | 2 | Appen Global | L | ||
205 | 发音词典 | 9,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | lao_LAO_PHON | text | 文本 | 老挝语 | 老挝 | N/A | N/A | N/A | N/A | N/A | 9 000 | N/A | Appen Global | L | ||
124 | OCR | 7293张图片 | 文件处理|文件搜索 | 添加到咨询列表 | IMG_OCR_FIN_CN | jpg | 图像 | 芬兰语 | 芬兰 | 照相机 | 不同光线 | NA | 4 | NA | NA | NA | Appen China | F | ||
180 | 发音词典 | 85,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | fin_FIN_PHON | text | 文本 | 芬兰语 | 芬兰 | N/A | N/A | N/A | N/A | N/A | 85 000 | N/A | Appen Global | F | ||
181 | 词性词典 | 10,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | fin_FIN_POS | text | 文本 | 芬兰语 | 芬兰 | N/A | N/A | N/A | N/A | N/A | 10 000 | N/A | Appen Global | F | ||
272 | 语料朗读 | 2.84小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | SUZHOU_ASR001_CN | wav | 音频 | 苏州方言 | 中国 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | 8 | NA | NA | Appen China | Z | |||
166 | 发音词典 | 50,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | eng_CAN_PHON | text | 文本 | 英语 | 加拿大 | N/A | N/A | N/A | N/A | N/A | 50 000 | N/A | Appen Global | Y | ||
19 | 有定稿的录音 | 144小时 | ASR|呼叫中心|虚拟助手 | 添加到咨询列表 | ENC_ASR001 | alaw或wav | 音频 | 英语 | 加拿大 | 移动电话和固定电话 | 混合 | 8 | 1 000 | 99 000 | 12 483 | 1 | Appen Global | Y | ||
167 | 词性词典 | 3,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | eng_CAN_POS | text | 文本 | 英语 | 加拿大 | N/A | N/A | N/A | N/A | N/A | 3 000 | N/A | Appen Global | Y | ||
170 | 发音词典 | 60,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | eng_IND_PHON | text | 文本 | 英语 | 印度 | N/A | N/A | N/A | N/A | N/A | 60 000 | N/A | Appen Global | Y | ||
22 | 对话录音 | 67小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | ENI_ASR002 | alaw | 音频 | 英语 | 印度 | 移动电话和固定电话 | 低背景噪音 | 8 | 540 | 77 565 | 11 646 | 2 | Appen Global | Y | ||
21 | 有定稿的录音 | 217小时 | ASR|呼叫中心|虚拟助手 | 添加到咨询列表 | ENI_ASR001 | alaw | 音频 | 英语 | 印度 | 移动电话和固定电话 | 混合 | 8 | 2 358 | 117 900 | 9 190 | 1 | Appen Global | Y | ||
171 | 词性词典 | 13,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | eng_IND_POS | text | 文本 | 英语 | 印度 | N/A | N/A | N/A | N/A | N/A | 13 000 | N/A | Appen Global | Y | ||
168 | 发音词典 | 5,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | eng_PHL_PHON | text | 文本 | 英语 | 菲律宾 | N/A | N/A | N/A | N/A | N/A | 5 000 | N/A | Appen Global | Y | ||
20 | 对话录音 | 53小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | ENF_ASR001 | alaw或wav | 音频 | 英语 | 菲律宾 | 移动电话和固定电话 | 低背景噪音 | 8 | 450 | 41 602 | 7 272 | 2 | Appen Global | Y | ||
18 | 对话录音 | 28小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | ENA_ASR001 | alaw | 音频 | 英语 | 埃及 | 移动电话和固定电话 | 低背景噪音 | 8 | 250 | 可根据要求提供 | 5 619 | 2 | Appen Global | Y | ||
376 | 会话短信-线程 | 100000 messages | MT|聊天机器人|对话式AI | 添加到咨询列表 | ENG_SMS001A | text | 文本 | 英语 | 美国 | NA | NA | NA | NA | NA | NA | NA | Appen Global | Y | ||
377 | 会话短信-线程 | 1 million messages | MT|聊天机器人|对话式AI | 添加到咨询列表 | ENG_SMS001 | text | 文本 | 英语 | 美国 | NA | NA | NA | NA | NA | NA | NA | Appen Global | Y | ||
127 | NER | 22,768个句子 | NER|内容分类|搜索引擎 | 添加到咨询列表 | ENG_NER001 | text | 文本 | 英语 | N/A | N/A | N/A | N/A | N/A | 22 768 | 可根据要求提供 | N/A | Appen Global | Y | ||
374 | 平行语料 | 13000000对 | MT|聊天机器人|对话式AI | 添加到咨询列表 | English_Tamil_corpus_CN | text | 文本 | 英语泰米尔语 | N/A | NA | NA | NA | NA | NA | NA | NA | Appen China | Y | ||
368 | 平行语料 | 50000对 | MT|聊天机器人|对话式AI | 添加到咨询列表 | English_Thai_corpus_CN | text | 文本 | 英语泰语 | N/A | NA | NA | NA | NA | NA | NA | NA | Appen China | Y | ||
371 | 平行语料 | 210000对 | MT|聊天机器人|对话式AI | 添加到咨询列表 | English_Burmese_corpus_CN | text | 文本 | 英语缅甸语 | N/A | NA | NA | NA | NA | NA | NA | NA | Appen China | Y | ||
373 | 平行语料 | 10180000对 | MT|聊天机器人|对话式AI | 添加到咨询列表 | English_Filipino_corpus_CN | text | 文本 | 英语菲律宾语 | N/A | NA | NA | NA | NA | NA | NA | NA | Appen China | Y | ||
369 | 平行语料 | 150000对 | MT|聊天机器人|对话式AI | 添加到咨询列表 | English_Portuguese_corpus_CN | text | 文本 | 英语葡萄牙语 | N/A | NA | NA | NA | NA | NA | NA | NA | Appen China | Y | ||
370 | 平行语料 | 150000对 | MT|聊天机器人|对话式AI | 添加到咨询列表 | English_Spanish_corpus_CN | text | 文本 | 英语西班牙语 | N/A | NA | NA | NA | NA | NA | NA | NA | Appen China | Y | ||
366 | 平行语料 | 520000 | MT|聊天机器人|对话式AI | 添加到咨询列表 | eng_vie_corpus_CN | text | 文本 | 英语越南语 | N/A | NA | NA | NA | NA | NA | NA | NA | Appen China | Y | ||
375 | 平行语料 | 5010000对 | MT|聊天机器人|对话式AI | 添加到咨询列表 | English_Vienamses_corpus_CN | text | 文本 | 英语越南语 | N/A | NA | NA | NA | NA | NA | NA | NA | Appen China | Y | ||
365 | 平行语料 | 105000000 | MT|聊天机器人|对话式AI | 添加到咨询列表 | eng_mal_corpus_CN | text | 文本 | 英语马来语 | N/A | NA | NA | NA | NA | NA | NA | NA | Appen China | Y | ||
372 | 平行语料 | 5000000对 | MT|聊天机器人|对话式AI | 添加到咨询列表 | English_Malay_corpus_CN | text | 文本 | 英语马来语 | N/A | NA | NA | NA | NA | NA | NA | NA | Appen China | Y | ||
298 | 对话 | 143 小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | ENI_ASR003 | wav | 音频 | 英语 | 印度 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | 2358 | NA | NA | 1 | Appen Global | Y | ||
165 | 发音词典 | 157,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | eng_AUS_PHON | text | 文本 | 英语 | 澳大利亚 | N/A | N/A | N/A | N/A | N/A | 157 000 | N/A | Appen Global | Y | ||
1 | 有定稿的录音 | 92小时 | ASR|呼叫中心|虚拟助手 | 添加到咨询列表 | AUS_ASR001 | alaw | 音频 | 英语 | 澳大利亚 | 移动电话和固定电话 | 低背景噪音(家庭/办公室) | 8 | 500 | 82 500 | 35 137 | 1 | Appen Global | E | ||
2 | 有定稿的录音 | 118小时 | ASR|呼叫中心|虚拟助手 | 添加到咨询列表 | AUS_ASR002 | alaw | 音频 | 英语 | 澳大利亚 | 移动电话和固定电话 | 混合 | 8 | 1 000 | 75 000 | 19 | 1 | Appen Global | E | ||
172 | 发音词典 | 12,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | eng_IRL_PHON | text | 文本 | 英语 | 爱尔兰 | N/A | N/A | N/A | N/A | N/A | 12 000 | N/A | Appen Global | Y | ||
173 | 发音词典 | 50,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | eng_NZL_PHON | text | 文本 | 英语 | 纽西兰 | N/A | N/A | N/A | N/A | N/A | 50 000 | N/A | Appen Global | Y | ||
297 | 对话 | 50 小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | USE_ASR004 | wav | 音频 | 英语 | 英语 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | NA | NA | NA | 1 | Appen Global | M | ||
176 | 发音词典 | 330,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | eng_USA_PHON | text | 文本 | 英语 | 美国 | N/A | N/A | N/A | N/A | N/A | 330 000 | N/A | Appen Global | Y | ||
103 | 对话录音 | 1000小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | USE_ASR003 | wav | 音频 | 英语 | 美国 | 移动电话 | 低背景噪音 | 16 | 2 000 | 500 000 | 52 586 | 1 | Appen Global | Y | ||
89 | 有定稿的录音 | 53小时 | ASR|虚拟助手|聊天机器人 | 添加到咨询列表 | Speecon English (USA) database | 可根据要求提供 | 音频 | 英语 | 美国 | 麦克风 | 混合(办公室/娱乐场所/车内/公共场所) | 16 | 600(550个成年语料提供者及50个儿童语料提供者) | 170 000 | 可根据要求提供 | 4 | Nuance | Y | ||
102 | 有定稿的录音 | 62小时 | ASR|虚拟助手|聊天机器人 | 添加到咨询列表 | USE_ASR001 | alaw | 音频 | 英语 | 美国 | 麦克风 | 低背景噪音(录音棚) | 48 | 200 | 80 000 | 18 318 | 2 | Appen Global | Y | ||
177 | 词性词典 | 263,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | eng_USA_POS | text | 文本 | 英语 | 美国 | N/A | N/A | N/A | N/A | N/A | 263 000 | N/A | Appen Global | Y | ||
300 | 对话 | 1196 小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | USE_UHV001 | wav | 音频 | 英语 | 美国 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | NA | NA | NA | 1 | Appen Global | Y | ||
95 | 有定稿的录音 | 11小时 | TTS | 添加到咨询列表 | TC-STAR female baseline voice Laura | 可根据要求提供 | 音频 | 英语 | 英国 | 头戴式麦克风 | 低背景噪音(录音棚) | 96 | 1 | 可根据要求提供 | 可根据要求提供 | 1 | Nuance | Y | ||
96 | 有定稿的录音 | 7小时 | TTS | 添加到咨询列表 | TC-STAR male baseline voice Ian | 可根据要求提供 | 音频 | 英语 | 英国 | 头戴式麦克风 | 低背景噪音(录音棚) | 96 | 1 | 可根据要求提供 | 可根据要求提供 | 1 | Nuance | Y | ||
174 | 发音词典 | 195,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | eng_GBR_PHON | text | 文本 | 英语 | 英国 | N/A | N/A | N/A | N/A | N/A | 195 000 | N/A | Appen Global | Y | ||
100 | 对话录音 | 150小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | UKE_ASR001 | wav | 音频 | 英语 | 英国 | 移动电话和固定电话 | 低背景噪音 | 8 | 1 150 | 298 562 | 24 193 | 2 | Appen Global | Y | ||
254 | 对话录音 | 50小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | UKE_ASR001B | wav | 音频 | 英语 | 英国 | 移动电话和固定电话 | 低背景噪音 | 8 | 1 150 | 可根据要求提供 | 13 192 | 2 | Appen Global | Y | ||
175 | 词性词典 | 155,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | eng_GBR_POS | text | 文本 | 英语 | 英国 | N/A | N/A | N/A | N/A | N/A | 155 000 | N/A | Appen Global | Y | ||
164 | 发音词典 | 5,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | eng_ARE_PHON | text | 文本 | 英语 | 阿拉伯联合酋长国 | N/A | N/A | N/A | N/A | N/A | 5 000 | N/A | Appen Global | Y | ||
63 | 有定稿的录音 | 33小时 | ASR|呼叫中心|虚拟助手 | 添加到咨询列表 | OrienTel English as spoken in the United Arab Emirates | alaw | 音频 | 英语 | 阿拉伯联合酋长国 | 移动电话和固定电话 | 低背景噪音 | 8 | 500 | 25 500 | 可根据要求提供 | 1 | Nuance | Y | ||
169 | 发音词典 | 18,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | eng_HKG_PHON | text | 文本 | 英语 | 香港 | N/A | N/A | N/A | N/A | N/A | 18 000 | N/A | Appen Global | Y | ||
29 | 有定稿的录音 | 80小时 | ASR|呼叫中心|虚拟助手 | 添加到咨询列表 | Flemish SpeechDat(II) FDB-1000 (FIXED1FL) | alaw | 音频 | 荷兰语 | 比利时 | 麦克风 | 低背景噪音 | 8 | 1 000 | 52 000 | 可根据要求提供 | 1 | Nuance | H | ||
87 | 有定稿的录音 | 47小时 | ASR|虚拟助手|聊天机器人 | 添加到咨询列表 | Speecon Dutch from Belgium | alaw | 音频 | 荷兰语 | 比利时 | 麦克风 | 混合(办公室/娱乐场所/车内/公共场所) | 16 | 600(550个成年语料提供者及50个儿童语料提供者) | 170 000 | 可根据要求提供 | 4 | Nuance | H | ||
16 | 有定稿的录音 | 27小时 | ASR|虚拟助手|车载HMI及娱乐设备 | 添加到咨询列表 | Dutch and Flemish SpeechDat-Car | alaw | 音频 | 荷兰语 | 荷兰-比利时 | 麦克风和移动电话 | 混合(车内) | 16和8 | 302 | 15 100 | 可根据要求提供 | 5 | Nuance | H | ||
163 | 发音词典 | 45,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | nld_NLD_PHON | text | 文本 | 荷兰语 | 荷兰 | N/A | N/A | N/A | N/A | N/A | 45 000 | N/A | Appen Global | H | ||
62 | 对话录音 | 36小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | NLD_ASR001 | alaw | 音频 | 荷兰语 | 荷兰 | 移动电话和固定电话 | 低背景噪音 | 8 | 200 | 可根据要求提供 | 14 964 | 2 | Appen Global | H | ||
88 | 有定稿的录音 | 68小时 | ASR|虚拟助手|聊天机器人 | 添加到咨询列表 | Speecon Dutch from the Netherlands | alaw | 音频 | 荷兰语 | 荷兰 | 麦克风 | 混合(办公室/娱乐场所/车内/公共场所) | 16 | 600(550个成年语料提供者及50个儿童语料提供者) | 170 000 | 可根据要求提供 | 4 | Nuance | H | ||
310 | 自由说 | 137.76小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | PHI_AKD_ASR001_CN | wav | 音频 | 菲律宾 | 菲律宾 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | 1500+ | NA | NA | 1 | Appen China | F | ||
291 | 自由说 | 2.88小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | POR_EUR_ASR001_CN | wav | 音频 | 葡萄牙语(欧洲) | 葡萄牙 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | 8 | NA | NA | Appen China | P | |||
342 | OCR | 684张 | 图片标签识别训练 | 添加到咨询列表 | IMG_OCR_Portuguese_CN | jpg | 图像 | 葡萄牙语 | 葡萄牙 | 手机/照相机 | 多种光线 | NA | NA | NA | NA | NA | Appen China | P | ||
219 | 发音词典 | 102,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | por_BRA_PHON | text | 文本 | 葡萄牙语 | 巴西 | N/A | N/A | N/A | N/A | N/A | 102 000 | N/A | Appen Global | P | ||
74 | 对话录音 | 33小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | PTB_ASR002 | alaw | 音频 | 葡萄牙语 | 巴西 | 移动电话和固定电话 | 低背景噪音 | 8 | 200 | 可根据要求提供 | 11 287 | 2 | Appen Global | P | ||
220 | 词性词典 | 100,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | por_BRA_POS | text | 文本 | 葡萄牙语 | 巴西 | N/A | N/A | N/A | N/A | N/A | 100 000 | N/A | Appen Global | P | ||
73 | 有定稿的录音 | 26小时 | ASR|虚拟助手|聊天机器人 | 添加到咨询列表 | PTB_ASR001 | wav | 音频 | 葡萄牙语 | 巴西 | 麦克风 | 低背景噪音(家庭/办公室) | 16 | 102 | 10 417 | 可根据要求提供 | 1 | Global Phone | P | ||
221 | 发音词典 | 112,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | por_PRT_PHON | text | 文本 | 葡萄牙语 | 葡萄牙 | N/A | N/A | N/A | N/A | N/A | 112 000 | N/A | Appen Global | P | ||
75 | 对话录音 | 36小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | PTP_ASR001 | alaw | 音频 | 葡萄牙语 | 葡萄牙 | 移动电话和固定电话 | 低背景噪音 | 8 | 200 | 可根据要求提供 | 16 339 | 2 | Appen Global | P | ||
222 | 词性词典 | 100,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | por_PRT_POS | text | 文本 | 葡萄牙语 | 葡萄牙 | N/A | N/A | N/A | N/A | N/A | 100 000 | N/A | Appen Global | P | ||
212 | 发音词典 | 30,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | mon_MNG_PHON | text | 文本 | 蒙古语 | 蒙古 | N/A | N/A | N/A | N/A | N/A | 30 000 | N/A | Appen Global | M | ||
353 | OCR | 7170张 | 图片标签识别训练 | 添加到咨询列表 | IMG_OCR_Industry books and magazines_CN | jpg | 图像 | 中文 | 中国 | 手机/照相机 | 多种光线 | NA | NA | NA | NA | NA | Appen China | H | ||
232 | 发音词典 | 15,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | spa_COL_PHON | text | 文本 | 西班牙语 | 哥伦比亚 | N/A | N/A | N/A | N/A | N/A | 15 000 | N/A | Appen Global | X | ||
235 | 发音词典 | 15,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | spa_VEN_PHON | text | 文本 | 西班牙语 | 委内瑞拉 | N/A | N/A | N/A | N/A | N/A | 15 000 | N/A | Appen Global | X | ||
231 | 发音词典 | 15,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | spa_CHL_PHON | text | 文本 | 西班牙语 | 智利 | N/A | N/A | N/A | N/A | N/A | 15 000 | N/A | Appen Global | X | ||
230 | 发音词典 | 100,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | spa_ESP_PHON | text | 文本 | 西班牙语 | 西班牙 | N/A | N/A | N/A | N/A | N/A | 100 000 | N/A | Appen Global | X | ||
113 | 有定稿的录音 | 540小时 | ASR|虚拟助手|聊天机器人 | 添加到咨询列表 | ESP_ASR002_CN | wav | 音频 | 西班牙语 | 西班牙 | 移动电话 | 低背景噪音(家庭/办公室) | 16 | 347 | 258 395 | 134 939 | 1 | Appen China | X | ||
25 | 有定稿的录音 | 39小时 | ASR|虚拟助手|聊天机器人 | 添加到咨询列表 | ESP_ASR001 | alaw | 音频 | 西班牙语 | 西班牙 | 麦克风 | 混合 | 22 | 200 | 40 000 | 6 367 | 4 | Appen Global | X | ||
26 | 有定稿的录音 | 1 hour | TTS | 添加到咨询列表 | ESP_TTS001 | alaw | 音频 | 西班牙语 | 西班牙 | 麦克风 | 低背景噪音(录音棚) | 22 | 1 | 1 787 | 3 614 | 1 | Appen Global | X | ||
93 | 有定稿的录音 | 46小时 | ASR|虚拟助手|聊天机器人 | 添加到咨询列表 | Speecon Spanish Database | 可根据要求提供 | 音频 | 西班牙语 | 西班牙 | 麦克风 | 混合(办公室/娱乐场所/车内/公共场所) | 16 | 600(550个成年语料提供者及50个儿童语料提供者) | 170 000 | 可根据要求提供 | 4 | Nuance | X | ||
270 | 自由说 | 2小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | ESP_ASR002_CN | wav | 音频 | 西班牙语 | 西班牙 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | N/A | NA | NA | Appen China | X | |||
292 | 自由说 | 220 小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | ESP_ASR003_CN | wav | 音频 | 西班牙语 | 西班牙 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | NA | NA | NA | 1 | Appen China | X | ||
304 | 自由说 | 1200小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | SPA_AKC_ASR001_CN | wav | 音频 | 西班牙语 | 西班牙语 | 手机麦克风 | 低背景噪音(家庭/办公室) | 16 | 400+ | NA | NA | 1 | Appen China | X | ||
343 | OCR | 725张 | 图片标签识别训练 | 添加到咨询列表 | IMG_OCR_Spanish_CN | jpg | 图像 | 西班牙语 | 西班牙 | 手机/照相机 | 多种光线 | NA | NA | NA | NA | NA | Appen China | X | ||
24 | 对话录音 | 22小时 | ASR|对话式AI|语音分析 | 添加到咨询列表 | ESL_ASR002 | wav | 音频 | 西班牙语 | 智利-哥伦比亚 | 移动电话和固定电话 | 混合 | 8 | 84 | 可根据要求提供 | 可根据要求提供 | 2 | Appen Global | X | ||
23 | 有定稿的录音 | 17小时 | ASR|虚拟助手|聊天机器人 | 添加到咨询列表 | ESL_ASR001 | wav | 音频 | 西班牙语 | 哥斯达黎加 | 麦克风 | 低背景噪音(家庭/办公室) | 16 | 100 | 6 898 | 可根据要求提供 | 1 | Global Phone | X | ||
233 | 发音词典 | 15,000个单词 | ASR|TTS|语言建模 | 添加到咨询列表 | spa_PER_PHON | text | 文本 | 西班牙语 | 秘鲁 | N/A | N/A | N/A | N/A | N/A | 15 000 | N/A | Appen Global | X | ||
234 |