睿诚科技协会

IBM Watson技术架构的核心优势是什么?

Watson 并不是一个单一的软件或产品,而是一个由多个层次和组件构成的技术平台和生态系统,它的架构是随着 AI 技术的发展而不断演进的,从早期专注于问答系统,发展到今天涵盖数据、AI、自动化和云平台的综合性解决方案。

IBM Watson技术架构的核心优势是什么?-图1
(图片来源网络,侵删)

我们可以将 Watson 的技术架构理解为一个“分层式”“模块化”的系统,每一层都为上一层提供支持,下面,我们将从现代的、云原生的视角来拆解其架构。


Watson 技术架构总览(分层模型)

一个典型的 Watson 解决方案(Watson Assistant, Watson Discovery)在其背后都遵循一个相似的、分层的架构,这个架构确保了其模块化、可扩展、可重用的特性。

第1层:基础设施层

这是整个架构的基石,提供计算、存储和网络等底层资源。

  • 核心:IBM Cloud (原 Bluemix):Watson 的绝大多数服务和应用都构建在 IBM Cloud 之上,IBM Cloud 提供了强大的 IaaS(基础设施即服务)和 PaaS(平台即服务)能力。
  • 关键组件
    • 计算资源:虚拟机、容器(如 Kubernetes)、无服务器计算(如 IBM Cloud Functions)。
    • 存储服务:对象存储、文件存储、数据库服务(如 Cloudant, a NoSQL JSON database)。
    • 网络服务:虚拟私有云、负载均衡器、内容分发网络。
  • 重要性:这一层确保了 Watson 服务的高可用性、弹性和安全性,用户可以根据需求动态扩展资源,无需关心底层硬件。

第2层:数据层

AI 的核心是数据,Watson 的数据层负责接入、存储、治理和管理所有类型的数据。

IBM Watson技术架构的核心优势是什么?-图2
(图片来源网络,侵删)
  • 核心功能
    • 数据接入:Watson 提供丰富的连接器,能够连接到各种数据源,包括:
      • 企业内部系统(如 Salesforce, SAP, SharePoint)。
      • 数据库(如 DB2, Oracle)。
      • 文件存储(如 Box, Dropbox)。
      • 云端数据湖和仓库。
    • 数据存储与管理:将接入的结构化和非结构化数据存储在 IBM Cloud 的数据存储服务中,如 Cloudant(用于 JSON 文档,非常适合半结构化数据)或 Cloud Object Storage(用于存储原始文件,如 PDF, 图片, 音视频)。
    • 数据治理与标注:提供工具来清洗数据、标记数据、管理数据版本和质量,确保用于训练 AI 模型的数据是准确和高质量的,这是构建可靠 AI 的关键一步。

第3层:AI 与认知服务层

这是 Watson 的“大脑”和核心能力所在,这一层包含了大量预训练的 AI 模型和工具,供开发者调用或进一步定制。

  • 核心构成
    1. 预构建 AI 服务:这些是开箱即用的 API,可以直接集成到应用中。
      • 自然语言理解:理解文本的意图、情感、实体、关键词等。
      • 自然语言生成:将结构化数据转换成流畅的人类语言。
      • 语音转文本:将音频流或文件转换成文本。
      • 文本转语音:将文本转换成自然的人声。
      • 视觉识别:分析图像,识别对象、人脸、场景等。
      • 知识图谱:构建和查询实体之间的关系网络。
    2. 机器学习平台:允许数据科学家和开发者使用自己的数据来训练、部署和管理自定义的机器学习模型。
      • Watson Machine Learning:一个统一的平台,支持多种开源框架(如 TensorFlow, PyTorch, Scikit-learn),提供从数据准备、模型训练、模型部署到模型监控的全生命周期管理。
    3. 自动化工作流引擎:将不同的 AI 服务和人工任务串联起来,构建端到端的智能自动化流程。
      • Watson Orchestrate:一个企业级自动化平台,能够理解业务目标,并自动执行跨应用的流程和任务。

第4层:应用与解决方案层

这一层是面向最终用户和开发者的接口,将底层的 AI 能力封装成具体的应用程序或行业解决方案。

  • 表现形式
    • SaaS (软件即服务) 应用:即我们熟知的 Watson 产品,如:
      • Watson Assistant:构建虚拟助手和聊天机器人。
      • Watson Discovery:进行深度内容分析和知识发现。
      • Watson Studio:一个协作式的数据科学和 AI 工作台。
      • Watson OpenScale:用于 AI 模型的治理、监控和公平性审计。
    • API 和 SDK:开发者可以通过 API 和软件开发工具包,将 Watson 的 AI 能力嵌入到自己的应用程序、网站或设备中。
    • 行业解决方案包:针对特定行业(如金融、医疗、零售、制造)预置了数据模型、工作流和最佳实践的解决方案,加速企业 AI 转型。

第5层:安全、治理与集成层

这一层贯穿所有层次,确保整个 Watson 生态系统是安全、可信且易于集成的。

  • 核心功能
    • 安全性:提供企业级的安全保障,包括数据加密、身份认证与访问控制、网络安全等,符合各种行业合规标准(如 GDPR, HIPAA)。
    • AI 伦理与治理:通过 IBM AI Governance 等工具,确保 AI 模型的决策是公平、透明、可解释和负责任的,监控模型性能和偏见,实现 AI 的生命周期治理。
    • 集成能力:提供丰富的连接器和 API,便于与企业现有的 IT 系统和业务流程集成。

架构的演进:从“问答系统”到“AI 平台”

理解 Watson 架构的演变,有助于更全面地认识它。

IBM Watson技术架构的核心优势是什么?-图3
(图片来源网络,侵删)
  1. 早期 (Jeopardy! 时代)

    • 架构特点:一个高度定制化的、紧密耦合的系统。
    • 核心组件:包括大规模信息检索、深度自然语言处理、复杂的证据整合和置信度计算模块。
    • 目标:在特定知识领域(如百科全书)内,以极高的准确度回答复杂问题,这个阶段的 Watson 更像一个“问答机器人”,而非平台。
  2. 中期 (云服务时代)

    • 架构特点:开始向云平台模块化服务转型,IBM 将 Watson 的核心能力拆分成一系列可独立使用的 API。
    • 核心组件:以 API 形式提供 NLU、NLG、语音、视觉等能力,开发者可以像搭积木一样组合这些 API 来构建自己的应用。
    • 目标:降低 AI 的使用门槛,让更多企业能够利用 Watson 的技术。
  3. 现代 (混合云与 AI 时代)

    • 架构特点:全面拥抱混合云数据/AI 全栈能力,架构更加开放,支持开源框架,并强调 AI 的生命周期治理。
    • 核心组件:以 IBM Watson StudioWatson Machine Learning 为核心,构建了从数据准备、模型构建、模型训练、模型部署到模型监控和治理的完整闭环。
    • 目标:赋能企业成为“AI 原生”组织,不仅使用 AI,更能自主地、负责任地构建和管理自己的 AI 资产。

IBM Watson 的技术架构是一个分层、模块化、云原生的复杂系统,它并非一个单一的技术,而是一个强大的赋能平台

  • 对用户而言,它提供了易于使用的 SaaS 应用和 API,可以快速构建智能应用。
  • 对开发者而言,它提供了从数据到模型再到部署的全套工具和框架,支持端到端的 AI 开发。
  • 对企业而言,它提供了一个安全、可信、可扩展的 AI 基础设施,帮助企业实现数字化转型。

其架构的核心思想是将复杂的 AI 技术封装成标准化的服务和工具,让不同技术背景的人都能参与到 AI 的应用和创造中来,同时通过强大的治理能力确保 AI 的可靠性和伦理性。

分享:
扫描分享到社交APP
上一篇
下一篇