睿诚科技协会

Amazon Go无感支付背后的技术原理是什么?

在无需任何人工结账、扫码或操作手机的情况下,自动识别顾客从货架上拿走了哪些商品,并从其亚马逊账户中自动扣款。

Amazon Go无感支付背后的技术原理是什么?-图1
(图片来源网络,侵删)

为了实现这个目标,Amazon Go 主要依赖三大核心技术支柱:计算机视觉、传感器融合和深度学习


核心技术支柱

计算机视觉

这是系统的“眼睛”,负责“看”并理解发生了什么。

  • 核心设备:遍布天花板的高清摄像头,Amazon Go 店内安装了数量极多的摄像头,确保没有任何盲区,能够从不同角度和高度监控整个商店。
  • 工作原理
    • 目标检测与跟踪:摄像头会持续不断地捕捉视频流,系统通过计算机视觉算法,实时识别出画面中的“人”(顾客和店员)和“物”(商品货架)。
    • 行为识别:系统不仅要看到人,还要理解人的行为,它会追踪每个人的移动轨迹、姿态和手部动作,关键在于识别“拿取”和“放回”这两个核心动作。
    • 人脸识别(早期版本):在顾客首次进入商店时,需要通过手机 App 扫描二维码进入,系统会将摄像头捕捉到的顾客图像与账户信息进行绑定,从而将“看到的人”与“亚马逊账户”关联起来,随着技术的成熟,后来的版本可能更依赖于多传感器融合来识别顾客,而不是完全依赖人脸识别,以保护隐私和提高效率。

传感器融合

如果说计算机视觉是“眼睛”,那么传感器就是“耳朵”和“触觉”,它们提供丰富的环境数据,帮助 AI 做出更准确的判断。

  • 核心设备
    • 重量传感器:这是最关键的传感器之一,每一个货架的每一层都安装了极其灵敏的称重传感器,它能精确感知货架上商品重量的微小变化。
    • 红外传感器和压力垫:安装在货架前,可以检测到顾客是否靠近货架、伸手进入货架等行为。
  • 工作原理
    • 交叉验证:传感器数据与计算机视觉数据会进行交叉验证,形成一个强大的证据链。
      • 场景一(拿取):摄像头看到一位顾客伸手进入货架,同时红外传感器检测到有人靠近,紧接着重量传感器显示该货架的重量减轻了(一瓶 500ml 的可乐被拿走),这三个信号同时发生,系统就能高度确信这位顾客拿走了那瓶可乐。
      • 场景二(放回):摄像头看到顾客将商品放回货架,重量传感器显示货架重量恢复,系统就会从顾客的虚拟购物车中移除该商品。
    • 解决遮挡问题:计算机视觉最大的挑战是遮挡,当顾客拥挤在一起,或者手部动作被身体遮挡时,摄像头可能无法准确判断是谁拿了什么,但此时,重量传感器的数据依然可靠,传感器融合极大地弥补了视觉的盲点,提高了系统的鲁棒性。

深度学习

这是系统的“大脑”,负责处理海量的视觉和传感器数据,并做出最终的决策。

Amazon Go无感支付背后的技术原理是什么?-图2
(图片来源网络,侵删)
  • 核心作用
    • 复杂的模式识别:深度学习模型,特别是卷积神经网络,被用于训练来识别复杂的场景,它需要学会区分“拿起一瓶可乐”和“只是用手挡了一下商品”的区别;学会区分“拿起一个商品”和“拿起两个商品”的区别。
    • 数据融合与决策:大脑将来自摄像头(视觉信息)、重量传感器(重量信息)、红外传感器(接近信息)等所有数据源的信息融合在一起,进行综合判断,它不是简单地根据一个信号就下结论,而是根据多个信号的组合来评估置信度。
    • 持续学习与优化:系统会不断收集新的数据,对模型进行再训练,以应对各种新的、复杂的、边缘的场景,从而不断提高准确率。

工作流程:一次完整的购物体验

让我们把以上技术串联起来,看看一个顾客从进店到离店的完整流程:

  1. 进店(身份绑定)

    • 顾客打开 Amazon Go App,扫描店门入口处的二维码。
    • 系统通过摄像头识别顾客,并将该顾客的虚拟身份(亚马逊账户)与其在店内的物理位置进行绑定,系统开始为该顾客创建一个“虚拟购物车”。
  2. 购物(商品追踪)

    • 顾客开始在店内自由挑选商品。
    • 拿取商品:当顾客从货架上拿取一件商品时,摄像头捕捉到“拿取”动作,同时货架的重量传感器检测到重量减轻,大脑将这些信息融合,判断顾客已将某件商品放入虚拟购物车。
    • 放回商品:如果顾客改变主意,将商品放回货架,摄像头捕捉到“放回”动作,重量传感器检测到重量恢复,大脑判断该商品应从虚拟购物车中移除。
    • 购物车/购物篮:顾客可以拿起一个实体购物车或购物篮,系统会自动识别这个容器,并开始追踪放入其中的所有商品,无需顾客手动扫描。
  3. 离店(自动结算)

    Amazon Go无感支付背后的技术原理是什么?-图3
    (图片来源网络,侵删)
    • 顾客挑选完所有商品后,直接走出商店。
    • 当顾客通过出口传感器时,系统会进行最后的确认,确保所有商品都已记录无误。
    • 自动扣款:系统会立即在顾客的亚马逊账户上完成支付,并发送电子收据到其手机 App。

面临的挑战与解决方案

  • 挑战1:遮挡
    • 解决方案:传感器融合,即使摄像头看不清,重量传感器也能提供准确信息。
  • 挑战2:多人同时拿取
    • 解决方案:多视角摄像头和精确的个体追踪算法,系统会为每个人建立一个独立的追踪轨迹,确保将拿取动作与正确的顾客关联起来。
  • 挑战3:商品相似性
    • 解决方案:高分辨率摄像头和强大的深度学习模型,系统能够识别出不同品牌、不同包装的商品,即使它们外观相似。
  • 挑战4:隐私问题
    • 解决方案:数据本地化处理,所有图像和传感器数据都在店内服务器上进行实时处理和分析,只提取“顾客A拿走了商品B”这样的结构化信息,而原始的、包含顾客面部的视频流不会被上传或长期存储,以最大限度地保护顾客隐私。

Amazon Go 的技术原理本质上是一个“感知-融合-决策”的闭环系统。

  • 感知:通过计算机视觉传感器网络(重量、红外等)全方位、多维度地感知店内环境。
  • 融合:利用深度学习作为大脑,将来自不同感知源的异构数据进行融合,消除单一传感器的局限性,形成对事件的高度可信判断。
  • 决策:基于融合后的判断,实时更新顾客的虚拟购物车,并在离店时自动完成结算。

这套系统不仅是一次零售革命,更是物联网、人工智能和边缘计算技术在一个真实商业场景中应用的典范,它展示了如何将多种技术无缝集成,以创造前所未有的用户体验。

分享:
扫描分享到社交APP
上一篇
下一篇