训练数据驱动AI,优化搜索相关性

训练数据驱动机器学习,机器学习促进丰富的人机交互体验。在快速迭代的互联网时代,我们不断被各种广告铺盖,甚至经常细思极恐,“天呐,小红书怎么知道我面膜没了。”这都是算法和机器学习的鬼斧神工洞察着用户的搜索意图。

通过机器学习技术进行搜索相关性优化

当您在收藏的在线零售商搜索栏中输入查询时,您期望得到什么样的结果?如今,大多数客户期望搜索引擎能够高度准确、相关和即时提供数据。搜索引擎应提供个性化的体验并预测您的需求——即使您的措词或拼写有些许偏离或查询有些模糊。多家公司正在转向使用人工智能(AI)驱动自身的搜索引擎,并在这些领域表现出色。

优化搜索相关性(即查询与搜索结果间的准确程度)对许多拥有强大网站的大型企业(尤其是在线零售商)至关重要。超过40%的客户首先直接进入搜索栏,这意味着搜索栏是他们对网站的第一印象。搜索引擎将客户定向至他们想要的产品和信息,理想情况下会促成销售。搜索相关性较高的引擎可以提升客户满意度、转化率和留存率,而不佳的搜索体验可能会使客户失望并对客户产生负面影响。

虽然大多数公司都了解整合搜索是客户体验不可或缺的一部分,但搜索相关性是如何发挥作用的?多家公司正在深入研究并投入资金,利用机器学习(ML)技术提高搜索相关性。这些企业在搜索相关性机器学习计划中使用客户行为和分析技术,将客户与他们想要的东西相关联。

AI驱动的搜索与基本搜索

搜索与时俱进。过去,搜索引擎通常量化搜索关键字在网页上出现的次数;数字越大,特定事物(网站、产品等)在搜索结果中的排名就越高。这种基本搜索方法(将查询内容与文档中的文本进行匹配)仍在许多网站上使用,尤其是在一些小公司的网站上。但在1998年,Google改变了这一切。谷歌公司进入该领域,并成为首家使用高级统计分析技术对查询予以解释和分类的公司。

如今,许多公司使用由AI支持的统计分析推动搜索结果。部分原因是结果的复杂性增加了。内容结构已逐渐发展为不仅具有文本,而且具有标签、描述、类别标记和其他可搜索元数据。此外,各公司现在希望将其业务重点、用户的地理位置、用户的过往行为以及其他背景因素结合在一起,以确定针对每个个体的特定内容相关性。这些复杂化因素导致需要通过复杂精细的算法才能得出解释和输出解决方案。

AI能够进一步区分低质量内容和高质量内容,并对其进行相应排名。例如,AI可以识别试图不公平地从算法中获益的搜索引擎优化(SEO)技术(例如将关键字和不可见的文本填充到产品描述或网页中),并将这些搜索结果置于高质量、意图驱动的结果下方。

提高相关性的挑战

How does search relevance work

客户的要求从未像现在这样苛刻;我们对量身定制的体验以及实现自我需求的便捷途径有很高的期望值。然而,人与人之间有很大差异。我可能会在搜索查询中键入“双人寝具”,而您可能会键入“棉被”,但我们两个人很可能最终搜索的是相同的产品。人们会以不同的方式提出相同的问题;学习所有这些可能的迭代对任何算法都很困难。

但是,在理解迭代之前,算法还必须对我们的语言有基本的理解。自然语言理解是让机器学习人类语言的学科。为了成功实现搜索相关性,模型必须能够检测词的含义(例如“寝具”)并提供适当的结果。使情况更复杂的是,当我键入“beding”时,搜索引擎还应该猜出我实际上是指“bedding”。模型必须考虑拼写、错别字和语法错误,因为这些情况很常见。

训练搜索引擎理解我们的自然语言需要大量训练数据。考虑到收集和准备此类数据所需的费用、时间和精力,许多公司尤其是中小型公司可能会感到这是一个难以克服的障碍。

不过,这些公司不应气馁。了解Shotzr如何与澳鹏合作识别超过17,000张不需要附加标签的图像,以便可以专注于那些需要附加标注的图像,从而提高库存照片的搜索相关性。

基于ML的搜索相关性优化方法

AI支持的搜索引擎依靠自然语言处理(NLP)来读取、理解、解释和分析查询。如前所述,这些旨在提高搜索相关性的模型需要依靠自然语言数据进行训练。这些数据必须涵盖从模糊到精确的数百万个用例和边缘用例。好的算法即使在查询不易理解的情况下也应提供相关搜索结果。

自然语言处理学科中有许多技术,包括语义标注、文本分析和命名实体识别。我们的NLP简介涵盖了许多这方面的内容。必须了解的是,这些技术为机器配备解析文本并揭示其含义的工具。搜索引擎可以使用衍生的含义来检测查询的结果并提升其排名。

搜索相关性模型也可以使用点击跟踪,它会根据个体的过往查询来确定哪个结果在统计学上也会适合这个人。

特定的搜索引擎,例如Google Image Search或Adobe Stock Photos,需要进行图像分析。像NLP一样,图像分析技术需要大量高质量、经标注的图像数据。图像分析可帮助机器将图像和图像质量分类为相关的、可搜索的特征。

在使用上述任何一种ML技术时,建议采用人机协同方法提供实况监测。例如,人可以评估特定查询是否提供了相关的搜索结果。在发生错误的情况下,人可以向机器提供反馈,以提高机器的准确性。

随着查询输入的发展,机器也必须适应。传统的查询基于文本,但现在我们看到的是使用图像进行搜索或使用语音进行查询的机会。这些机会将为搜索引擎增加新的复杂性,但并非无法克服。

澳鹏搜索相关性专家Kelly Sinclair的见解

澳鹏依靠自己的专家团队帮助您构建前沿的模型,利用AI驱动的搜索成功实现搜索相关性。之后,您就能提供优质的客户体验,并提高业务投资回报率。我们的客户服务总监Kelly Sinclair是我们团队的权威专家之一,可确保客户通过机器学习成功实现和改善搜索相关性。Kelly关于成功的搜索相关性项目的三大见解包括:

  • 确定业务需求。相关性具有挑战的。它可能高度依赖许多变化的变量,例如语义、位置或上下文。用户意图至关重要,因为这类工作可能是主观的。用户在移动设备上进行的查询将得到与在台式机上执行相同搜索完全不同的结果。成功来自对每个项目及其目标的深刻理解。这些目标应该是具体的、可衡量的、可实现的和相关的
  • 为项目建立明确的目标和衡量指标。开发高质量的数据并非一蹴而就,而是需要培训、加强和随时间积累的专业知识。为此,我们必须对成功作出定义。这些可衡量的成果应为所涉及的所有利益相关者接纳并达成共识。项目是动态的,随着每次周期迭代带来的效率和数据质量的改善,我们应检查衡量指标,以确保我们仍在提供价值。
  • 实施数据驱动的决策。数据驱动的决策过程始于以可衡量目标和识别数据信号为基础的数据收集。机器学习有助于发现差距、认识决策的模式以及需要改进的方面。然后,我们可以采用分析方法来确定响应这些见解的下一个步骤。

澳鹏能为您做的

我们已有20多年搜索相关性优化的行业经验。在这段时间里,我们通过提供高质量的训练数据成功满足了不同客户的个性化搜索需求。无论是帮助Adobe Stock提高搜索相关性,还是与微软的必应搜索引擎团队合作开拓新市场,我们都乐于帮助客户迅速交付和扩展AI搜索相关性模型。

详细了解我们的专业团队,以及我们如何帮助您实现特定的搜索相关性需求。

Language