手写识别

转录 40 万个手写姓名,用于进行光学字符识别 (OCR) 。

概述

该数据集包括超过 40 万个手写姓名,它们都是通过慈善项目收集的,旨在支持世界各地的弱势儿童。

光学字符识别 (OCR) 利用图像处理技术将扫描文档上的字符转换为数字形式。通常而言,这种技术识别机器打印字体的质量非常高。不过,个人书写风格的巨大差异给通过机器识别手写字符带来了诸多艰巨挑战。

该数据集总共包括 206,799 个姓氏和 207,024 个名字,分为训练集(331,059 个)、测试集(41,382 个)和验证集(41,382 个)。

此外,它还提供了通过澳鹏平台上的人工辅助标注功能创建的所有图像标签,使您可以使用自己的数据扩展该数据集。

 

该任务的输入数据是成千上万个手写姓名的图像。点击上方的“数据 (Data)”标签,您会发现转录后的图像分为测试集、训练集和验证集。

Imageurl     
D2M150010079F00021firstname.jpg
D2M150010079F00021surname.jpg
D2M150010079F00032surname.jpg
D2M150010079F00043firstname.jpg
D2M150010079F00043surname.jpg
D2M150010079F00054firstname.jpg
D2M150010079F00065firstname.jpg
D2M150010079F00065surname.jpg
D2M150010079F00076firstname.jpg

数据

test_v2.zip | 127.1 MB
written_name_test_v2.csv | 2MB
train_v2.zip | 1015.6 MB
written_name_train_v2.csv | 16.1 MB
validation_v2.zip | 127.4 MB
written_name_validation_v2.csv | 2 MB
antalya escort

instagram takipçi satın al - instagram takipçi satın al mobil ödeme - takipçi satın al

a

bahis siteleri - deneme bonusu - casino siteleri

bahis siteleri - kaçak bahis - canlı bahis

goldenbahis - makrobet - cepbahis

cratosslot - cratosslot giriş - cratosslot

Language