2023人工智能前沿技术: 机器学习可观察性 KellyOnTech AI系列
先插播一下,2022年全球独角兽创业大赛已经完美收官啦,2023年直通车开启报名通道,符合六大类的优秀创业项目我直接推荐, 向来自全球50多个国家和地区的200多家风险投资机构展示自己的项目。
图片来源:Unicorn Battle. 2022全球独角兽创业大赛总决赛官方评委
根据最近的调研,实时机器学习的应用在未来三年内会显著增加。这种趋势其实给机器学习带来了一个很大的挑战。比如,我们都和聊天机器人打过交道,聊着聊着就感觉有点不对劲,这其中的原因之一涉及到机器学习的问题之一:模型漂移 (Model Drift)。
另外一个原因是数据杂乱,特别是数据源的保真度。在现实世界中,人们很难保证数据的质量或新鲜度。因为随着时间的推移,数据会出现各种变化。特别是如果引入外部数据源,其可靠性更是要打问号了。在研究实验室中,通常需要花费数千小时来创建噪声最小且标签准确的高质量数据集。
机器学习可观察性是一种在模型开发周期的所有阶段深入了解模型性能的实践。它使得机器学习从业者在模型构建过程中、部署后以及长期的生产生命周期中,能够找到模型以某种方式运行的根本原因,从而能够优化模型。
图片来源:Arize. 机器学习工程生命周期
机器学习可观察性的关键指标包括发现问题和解决问题的时效性:
检测时间:机器学习可观察性的第一个关键目标是及时展示模型可能出现的问题。一个好的机器学习可观察性解决方案有助于减少检测模型问题所需的时间。正如黄帝内经里提到的上医治未病。机器学习从业者借助机器学习可观察性方案在企业客户知道问题之前就提前解决问题。
解决时间:一旦检测到问题,一个机器学习可观察性工具能够帮助机器学习团队以多快的速度找到要解决的问题的根本原因。一个好的机器学习可观察性解决方案需要引导模型所有者了解发生变化的输入数据分布、特征转换或模型预测期望,并提供解决方案。
正是因为她们使用的机器学习模型出了故障,导致他们的 Audience Pinpointer 工具的准确性降低,造成惨重的损失。Audience Pinpointer 是一种基于机器学习的广告定位工具,它利用 Unity 积累的数据资源帮助营销人员更好地触达特定受众。
Arize AI 的两位创始人杰森·洛帕特基(Jason Lopatecki ) 和阿帕娜·迪纳卡兰 (Aparna Dhinakaran) 有一些共同的经历。首先,他们的本科都拿到了加州大学伯克利分校电气工程和计算机科学学士。
图片来源:Arize. Arize AI 创始人杰森·洛帕特基(Jason Lopatecki ) 和阿帕娜·迪纳卡兰 (Aparna Dhinakaran)
另外,他们还是老同事,曾经一起在TubeMogul 共事过。TubeMogul 是一家做品牌广告的企业软件公司,旨在弥合传统电视和数字格式之间差距的端到端广告平台。2016年底被Adobe 以 5.4 亿美元收购了。Jason帮助该公司建立了机器学习团队,Aparna是一名数据科学家, 她还拿到了康奈尔大学计算机科学博士。后来,她加入了Uber,成为其著名的米开朗基罗团队的成员之一。
两位创始人都有深厚的实践经验,并且亲身经历了费时费力的机器学习模型建立和训练的过程,部署到交付,以及对部署后的实际表现,整个生命周期中出现的各种问题。他们认为MLOps工具链中缺少一些根本性的东西。所以一拍即合,一起专注于通过Arize的专用机器学习可观察性平台为机器学习模型带来透明度和有效地性能提升。
更多关于全球前沿科技, 中国科技战略和创业项目的信息,欢迎购买最近出版的英文新书《Strategic Development of Technology in China 》。新书介绍 购买链接
英文新书《Strategic Development of Technology in China》
info@mansinternational.com
250 Yonge St. Suite 2201
Toronto ON M5B 1R7 Canada
Yangpu District Siping Road
#1063 Zhongtian Tower 1808
Shanghai, China
Copyright @ Mans International 2020