通过 Shotzr 快速识别哪些图像需要元数据定位
Shotzr 如何使用澳鹏平台为其客户改善推荐和搜索体验
对于我们来说,使机器学习切实可行的一大挑战是缩短从构思到生产的周期时间。我们深知,如果我们能够快速地重新平衡我们的训练数据并将 机器学习团队的反馈整合到流程中时,则我们正在取得进步。迭代周期显著加快,我们可以在创纪录的时间内使模型从构思转为生产。
– Mark Lemmons Shotzr 联合创始人
公司简介
在物联网设备数量预计达到 100 亿台的世界中,客户体验和关注是通过图像来驱动的。Shotzr 可帮助您识别客户,然后通过与您的受众群体定位相匹配的上下文图像与他们进行确认。
无论您的业务是 Facebook 和 Instagram 广告活动、社交媒体营销、SEM 登陆页面还是真正的动态广告素材,Shotzr 都能为您提供数字营销所需的所有图像。
挑战
Shotzr 收集的精选高质量图像的数量正在以惊人的速度增长,可访问图片已接近 1 亿张。为了提供营销人员在每个营销时刻需要的精确图像,Shotzr 需要对他们的图像进行正确且准确的标注。
随着 Shotzr 标注者上传的图像数量不断增多,以及 Shotzr 与其他图像提供商合作伙伴关系的不断发展,内部团队已经无法跟上标签和元数据的需求,使业务难以扩展。Shotzr 在 90 天内标注了大约 2 万张图片,但这个速度仍无法匹配平台上庞大的图片数量。
为了确保 Shotzr 的平台能够提供营销人员所需的正确图像,Shotzr 需要创建一种图像识别解决方案,而这个方案需要特定的标签。这些标签仅向客户显示最佳选择的候选列表,而不是让客户滚动浏览数百个与搜索查询匹配的图像。例如,某些图像显然来自特定位置,例如科罗拉多州的阿斯彭 (Aspen)。标记该位置可以帮助人们查找阿斯彭的特定照片,不是树木,而是城镇和周边区域。但有些图像无法分辨位置,例如很多手交叠在一起的照片或典型的图库照片。
解决方案
Shotzr 通过机器学习,希望借助该技术快速并自动识别哪些图像需要具有特定的位置元数据。通过 机器学习尽早证明价值并实际交付这种价值,这是 Shotzr 从试验阶段成功进入生产的关键,因为他们最初的资源有限,无法使模型发挥作用。为了证明这种价值,Shotzr 需要获取高质量的数据并正确和准确地训练他们的模型。
为了提供这种级别的细化标签,Shotzr 需要一个数据合作伙伴,能够应对他们这样公司规模的工作量的挑战,并且定价合理。基于上述原因,他们向澳鹏(Appen)寻求帮助,希望我们提供可输入到他们的搜索相关性模型的数据。
成果
仅仅几周之后,Shotzr 就预计,训练的分类器数量会是他们此前最大估算量的 4 倍。
在澳鹏平台(Appen platform)上完成第一项工作后,Shotzr 识别了超过 1.7 万张不需要附加标签的图片。他们预计,他们可以节省原计划为位置数据投入的超过 6100 万的资产,同时腾出时间专注于可从位置数据获益的图像,并创建新的模型来自动进行位置标记过程。
项目概况:为所有用户打造更安全的网络体验
Trust Lab是一家值得信赖的软件开发公司,由若干来自谷歌、YouTube、Reddit和TikTok的信任与安全高管创立,致力于确保为所有用户打造安全的互联网。他们通过情绪分析了解互联网用户对于在万维网上分享的各种内容的真实看法。根据Enough Organization的数据,自2020年3月以来,全球范围内,人们花在社交媒体上的时间增加了45%。
挑战:“一千个读者就有一千个哈姆雷特”
社交媒体用户遍布世界各地,人们的背景各不相同,对内容的看法也纷纷不一。制定平台规则使公众在使用时感到安心无虞并非易事。因为让有的人反感的内容在其他人看来可能无伤大雅。此外,不同平台所使用的内容政策可能截然不同。这意味着一些平台会容忍裸体等更有争议性的主题,而另一些平台则不然。要确定某一平台所应采用的最佳政策,则需获取反映其全球用户意见的数据。Trust Lab认为,获取公众意见的最佳方法是通过分析基于用户对各种用户生成内容(UGC)的意见的用户情绪数据。
解决方案:明确的信任与安全计划
利用我们的澳鹏数据标注平台(ADAP),增加涵盖所有可能主题的、包含UGC内容的数据集。我们的平台包括丰富的数据标注选项,让公司能够掌握他们希望了解的用户对每条查看过UGC的具体情绪。公司能够收到详细的情绪分析数据,让他们了解由全球审查员团队确定的平台上不良信息的比例。
Trust Lab使用这些数据为各种互联网平台公司提供度量分析,帮助他们了解自己平台上的内容类型、与其他平台相比的情况以及公众对内容的感受。据此,这些平台公司就能调整其信任与安全计划,或删除冒犯性的内容。
结果:未来更加安全
数据标注者通过澳鹏平台做出数百万条判断。接收到的情绪数据是用于创建详细的信任与安全企业系统的输入,该系统能够大规模识别高风险和不安全的内容、账户和交易,并针对需要做出的改变以及为什么需要改变为合作伙伴提供建议。澳鹏提供的信息有助于Trust Lab丰富其信任图产品的背景。
信任与安全计划详实的公司向用户传达的信息是,他们真切关心用户福祉,希望用户长期使用公司应用。而那些感到安全的用户就会选择继续留在这些平台上。在数据标注的帮助下,这些平台公司现能够实施其信任与安全计划,提升平台未来的安全性。
“澳鹏的专业知识和扩展能力使Trust Lab能够为我们的客户提供用户情绪度量分析,以确保他们的平台对公众是安全的,”Trust Lab高级数据科学家Nick Miller表示。