2021年数据的重心:治理、隐私和道德

随着我们在2021年工作的提速,数据治理、隐私和道德等议题理应迫切受到企业的重视。虽然数据的使用回报巨大,但涉及数据滥用、丢失和误用的风险也同样不容小觑,而且这些风险正日益显现。

通过我们的专家网络,我们向专家们了解他们对这一问题的想法,他们对治理、隐私和道德发展趋势将如何影响大数据从业者今年和未来的工作畅谈自己的预测。

Dremio联合创始人兼首席技术官Tomer Shiran表示,在数据隐私和治理方面掌握主动权并不容易,但由于消费者的强烈要求,这已迅速成为美国的一项要求。

Shiran写道:“用户越来越关注他们的网络隐私,这使得美国更有可能实施类似于欧洲《通用数据保护条例》(GDPR)和加州《消费者隐私法》(CCPA)的法规。这将要求企业在数据分析基础设施中加倍重视隐私和数据治理。此外,企业将认识到,数据隐私和治理无法通过独立的工具实现,而必须作为分析基础设施的一部分来实现。正因为如此,数据版本控制将成为云数据湖的标准,而像Project Nessie这样的开源技术将使企业能够在企业级平台上安全地管理和治理数据。”

数据无序扩张日益成为一个严重的问题,它也增加了数据治理的难度,1touch.io业务发展高级总监Rick Hedeman表示。

Hedeman表示:“随着我们进入新的一年,数据蔓延继续加速,各地都出现了数据湖,信息治理变得更加困难。人们往往认为,医疗保健和金融服务行业存储了大量个人数据,但现在各行各业都在存储数据,因为数据成为当今企业最有价值的所在。  不同行业的企业都认识到尽可能掌握客户行为和情绪的价值,但这在很大程度上是一种‘先采集,再思考’的方法。”

Luminati首席技术官Ron Kol表示,虽然企业必须关注数据隐私和版权问题,但人们在互联网上公开自由分享的大量数据实在是太有趣、太有用了,不容错过。

《通用数据保护条例》(GDPR)日益成为各国实施数据安全和隐私管理的模式

Kol指出:“在线数据可以帮助不同规模的企业满足客户的愿望和需求,改善整体客户服务水平和产品质量,并在即将来临的变化中预测市场变化。因此,商界将加大在线数据采集业务的力度,2021年将继续以前所未有的速度加快推进,并不会出现任何放缓的迹象。”

数据隐私初创公司Privacera的联合创始人兼首席执行官Balaji Ganesan表示,随着我们进入消费者隐私的新时代,数据共享的“蛮荒西部”时代将在2021年终结。

Ganesan指出,“2021年,世界各地的监管立法将加强对个人识别信息(PII)数据的控制,以保护消费者隐私。各国正越来越多地效仿欧盟GDPR,加利福尼亚州CCPA和巴西LGPD的最新法规,这就是证明。最新的新冠病毒数据政治化,加上人工和机器人辅助的信息传播,以及利用Facebook和Twitter等社交媒体平台上的个人数据传播错误信息,预示着互联网上个人信息‘蛮荒西部’时代的终结,一个注重消费者隐私的新时代即将来临。”

GDPR正在成为世界各地隐私政策的全球标杆。不过,Killi首席执行官Neil Sweeney发现GPDR在具体实施中存在一个小问题,特别是在涉及大型科技公司如何使用(或滥用)个人标识符时。

他写道:“科技巨头让公众产生一种普遍的看法,认为我们正在转向移动ID和电子邮件哈希散列,以抵消第三方Cookie的影响,从而有利于保护消费者的隐私。但发生这种情况的真正原因是,苹果和谷歌等巨头希望让自己的生态系统更加强大。我们都在谈论负责任和合乎道德标准的媒体、许可和隐私,但这个行业却正在远离可靠的标识符,靠牺牲隐私求生存。”

CloudSphere技术布道师Keith Nielsen表示,治理和保护海量数据宝库存在相当大的技术挑战,但在2021年,这一领域将以人工智能(AI)的形式出现新的勇士。

Nielsen表示,“云治理是一项日益复杂的任务,它已经迅速发展到人类无法独自管理的地步,未来一年,人们将越来越依赖AI,通过简化工作流程、管理变化和存档来保持云卫生。AI帮助建立并维护适当的云卫生后,它还将被作为战略预测知识工具。AI将通过预测和解决威胁和漏洞,帮助企业为其云环境创造尽可能好的结果。将AI作为战略资产加以利用,将使企业首席信息官能够对其云环境做出明智的决策,例如实施成本和合规风险评估。”

大数据和大数据技术的双重爆炸正在催生新的计算模型。Protegrity负责数据和AI的执行副总裁Eliano Marques表示,这将迫使数据隐私在2021年得到发展。

Marques写道,“几十年前,在智能手机出现、互联网崭露头角之前,数据只有一个家:数据库。数据将从一个数据库转移到另一个数据库,并为各个应用程序提供保护。现在数据几乎无处不在,数据的隐私和安全性必须不断发展,才能在托管、转移和分析时都能得到保护。  越来越多的企业在人力资源、运营和客户服务等组织职能部门采用分析和机器学习系统,通过利用敏感的客户和企业数据….做出更佳的商业决策。企业应该通过实施数据保护,适应新的计算需求,这样数据才能安全地在不同地点和数据集之间移动。”

Franz首席执行官Jans Aasman表示,我们还有另一种可以用来治理和保护数据的秘密武器:知识图谱。

Aasman表示,“当前的形势很明显,想要进入欧洲市场的美国公司必须遵守欧洲GDPR和美国的CCPA,否则便将面临巨额罚款的风险。2021年,我们将看到第一批企业创建知识图谱,了解各个客户的各个数据元素都在哪里。这些知识图谱将用于自动删除所有这些数据(如果其他法规允许),并保留知识图谱以用于删除数据,或者更好地保护数据,以达到合规目的。”

OReilly Media负责AI和数据内容的副总裁Rachel Roumeliotis表示,科技公司搭监管便车的时代已经终结,现在是时候采用负责任的机器学习了。

她写道:“数据使用环境不再是什么都不用做的‘蛮荒西部’;不当使用数据会带来法律和声誉后果。负责任的机器学习(ML)是使AI系统对其产生的结果负责的一场运动。负责任的ML包括可解释的AI(可以解释决策原因的系统)、以人为中心的机器学习、合规性、道德、可解释性、公平性和构建安全的AI。到目前为止,企业对负责任的ML一直态度冷淡,充其量只是被动反应。明年,加强监管(如GDPR、CCPA)、反垄断和其他法律力量将迫使企业采取负责任的ML实践。”

算法偏见是实现AI模型中公平和平等待人这一目标的真正威胁。Anaconda首席技术官Kevin Goldsmith预测,今年人们将重新认识算法偏见中存在的危险。

Kevin Goldsmith写道:“今年(2020年),围绕AI算法中的偏见和缓解,以及如何解决基于算法的个性化社会影响,进行了许多必要的对话。但我们需要继续开发工具,以深入了解ML系统的结果,揭示偏差,并检查部署模型随时间的漂移。随着越来越多的此类系统投入生产,这一点变得越来越重要,以确保我们不会成为延续或创造有害偏见的来源。”

Jumio首席执行官Robert Prigge表示,解决AI算法中的偏见将是当务之急,并将为如何通过面部识别系统跟踪种族制定指导方针。

Prigge写道:“企业越来越担心AI算法中的群体偏见(种族、年龄、性别)及其对品牌的影响和引发法律问题的可能性。2021年,在选择身份验证解决方案时,评估供应商如何解决群体偏见将成为首要任务。”

Sift首席执行官Jason Tan表示,如果出现更多因机器学习偏见而提起的诉讼,请不要感到意外。

Tan指出,“2021年,涉及人工智能技术的诉讼数量将显著增加。虽然在过去几年里,我们看到了针对企业的高调诉讼,但AI在我们的日常生活中也更为普及。AI作为一种不成熟的技术,会犯更多(和新的)错误,这些错误会对人类产生真正的影响。出现错误时,消费者将采取法律行动。”

Cloudera行业解决方案副总裁Cindy Maike预测,2021年和2022年,AI在道德方面将稳步改进。

她写道:“目前,AI道德议题对话正围绕着数据的匿名化展开。澳大利亚和欧洲已出台新的立法,我相信美国也不会落后。为了社会的福祉,我们需要致力于促进数据匿名化。此外,我们还要确保强大的数据治理,监控数据的使用。过去一年,我们围绕企业数据云帮助企业简化对数据和AI的治理和管理议题展开了热烈大讨论,这表明,我们正在AI道德方面更进一步。

展望2021年,围绕AI道德和数据治理的对话将在众多领域展开,例如联系人追踪(抗击新冠疫情)、联网车辆和智能设备(谁拥有数据?)和个人网络档案(网络足迹增加导致的隐私问题)。”

澳鹏首席技术官Wilson Pang预测,2021年,AI道德将成为企业高层的一大议题,并有望开启一个“负责任的AI”的新时代。

Pang写道:“2021年,企业高层将越来越重视弥补AI应用与现实需要之间的差距(仅大约十分之一的企业报告从AI获得“显著的”经济利益,麻省理工大学斯隆管理学院),他们将越来越多地强制执行纳入‘负责任的AI’原则的AI治理项目。负责任的AI为负责任的训练数据制定了标准和最佳实践,旨在提高质量、效率和透明度,包括消除训练数据中的偏见,同时促进包容性和协作。负责任的AI还包括向标注员支付合理的工资,并遵守劳动健康准则和标准。企业高层将更多地参与AI项目,促进广大技术社区对这些标准的采用,这反过来将增加AI对企业的价值,以及公众对AI使用的信任。”

许多AI系统就像不透明的黑盒子一样运作,阻碍了外部观察者对其工作机理的认识。Modzy数据科学负责人Clayton Davis表示,这导致的一个问题有望在2021年得到解决。

Davis写道:“可解释性不是灵丹妙药,但在今天,它却是企业能够理解AI预测、学会理解和信任技术的一种方式。AI系统的可解释性对于建立审计追踪和建立可信、可靠和负责任的AI至关重要。”

Boomi产品主管Ed Macosky表示,2021年,企业领导者将以新的法律和道德伦理视角审视AI。

Macosky写道:“过去几个月,人们对AI及其可能存在的未知偏见进行了批判性的关注,尤其是在社交媒体上。这一警告将清晰而响亮地传达给科技行业的领导者。明年,企业将采用新的视角调整AI,尤其是在招聘等项目上。即使是超级自动化这样无伤大雅的项目,也将从这一视角审视。领导者将以这种深谋远虑的方式采取行动,确保客户和企业对AI及其提供的洞察力的信任。”

虽然许多数据专业人士在工作中讲求道德标准,但却缺少一个统一的标准来定义大数据和AI中的道德原则。Indicative首席执行官Jeremy Levy表示,这种情况可能会在2021年发生改变。

Levy表示,“我认为,在未来一年,那些认识到数据滥用严重性的企业将引领数据分析领域在道德规范方面取得进步。也许美国政府会干预并通过类似的GDPR,但我相信,科技公司将主导这一行动。Facebook利用用户参与数据所做的事情并不违法,但我们已经看到,它可能会对儿童成长和我们的个人习惯产生有害影响。未来,回首再来看企业在2010年代使用个人数据的方式,感觉就像我们在1960年代的电影中看到人们在飞机上吸烟时那样,畏缩不前。”

Talend首席技术官Krishna Tamman表示,合乎道德标准的AI将在2021年成为热门话题,但这也是个很难解决的问题。不幸的是,解决这一问题真的非常难。

“企业纷纷利用数据和AI来打造解决方案,但他们可能在歧视、监控、透明度、隐私、安全、言论自由、工作权利和获得公共服务方面绕过人权。”“为了避免声誉、监管和法律风险的不断增加,实施合乎道德标准的AI是必要的,最终它将让位于AI政策。AI政策将确保高水平的透明度和对公众的保护措施。在数据领域,企业首席执行官和首席技术官需要通过仔细的分析、审查和编程,设法消除算法的偏见”。

相关文章:

2021年边缘和物联网预测

高级分析未来预测一探

2021年预测:数据科学

Language