睿诚科技协会

Together Mode技术如何重塑远程协作体验?

什么是 Together Mode?

Together Mode 是一种由微软(Microsoft)在 Teams 中首创并推广的视频会议技术,它的核心理念是:将所有参会者的视频窗口融合到一个共享的虚拟环境中,创造出一种“共处一室”的沉浸式体验,而不是让参与者感觉自己只是面对着一排排孤立的“小盒子”。

Together Mode技术如何重塑远程协作体验?-图1
(图片来源网络,侵删)

它就像一个“虚拟会议室”或“虚拟咖啡厅”,所有人的头像都出现在这个共享空间里,仿佛真的坐在一起开会或交流。

技术原理:它是如何实现的?

Together Mode 的实现依赖于一系列复杂的技术,主要分为以下几个层面:

人工智能与计算机视觉

这是 Together Mode 的核心技术支柱。

  • 人物分割: 这是实现“抠图”效果的关键,系统需要实时地将每个参会者从其背景中分离出来,这通常通过 语义分割 技术实现,AI 模型能够识别出图像中属于“人”的部分,并将其与背景分离开来。
  • 深度估计: 为了让虚拟场景中的“人”看起来更真实,系统需要估算每个人物与摄像头之间的距离(深度信息),这有助于在后续的渲染步骤中,让前排的人物遮挡后排的人物,形成正确的空间层次感。
  • 姿态估计: AI 会分析每个人的身体姿态(如头部位置、肩膀倾斜度等),这使得参会者的头像能够自然地“坐”在虚拟座位上,而不是悬浮在空中,头部也会随着真人头的转动而转动,增强了真实感。

图形渲染与3D技术

将处理过的人物图像放置到虚拟场景中。

Together Mode技术如何重塑远程协作体验?-图2
(图片来源网络,侵删)
  • 3D场景构建: 系统会预先设计好一个或多个精美的3D虚拟环境(如圆形会议室、咖啡馆、演讲厅等),这些场景拥有完整的3D空间信息,包括地面、墙壁、天花板、桌椅等。
  • 图像合成: 通过图形渲染引擎(如游戏引擎 Unity 或 Unreal Engine 的简化版),将经过AI处理后的“人物”图像,根据其深度和姿态信息,实时地“贴”到3D场景的相应座位上。
  • 遮挡处理: 这是实现沉浸感的关键一步,渲染引擎会根据每个人的深度信息,计算他们之间的遮挡关系,一个人转头时,他的脸可能会部分遮挡旁边的人,就像在真实空间里一样。

实时通信与同步

确保所有参会者看到的是同一个、同步的虚拟场景。

  • 视频流处理: 参会者的原始视频流首先被发送到云端服务器。
  • 云端处理: 在云端,AI和渲染引擎对视频流进行处理,将每个人物“抠出”并放入虚拟场景,生成一个完整的、合成好的视频流。
  • 流式传输: 处理好的合成视频流再被实时地推送给所有参会者,这样,无论你身处何地,你看到的都是同一个虚拟会议室的实时画面。

核心优势与价值

Together Mode 不仅仅是一个花哨的视觉效果,它旨在解决传统视频会议的痛点,带来切实的价值。

增强社交临场感

  • 打破“小盒子”隔离感: 传统视频会议中,参会者被一个个小窗口隔开,感觉是“你”在看“他们”,Together Mode 创造了一个共享空间,感觉是“我们”在一起,极大地提升了团队的凝聚力和归属感。
  • 自然的眼神交流: 在虚拟场景中,所有人的头像都朝向中心,更容易实现自然的眼神接触,这有助于非语言信息的传递,让沟通更顺畅。

减少认知负荷

  • 简化界面: 参会者不再需要费力地在多个小窗口之间切换注意力,也不需要担心自己的背景是否得体,统一的背景和清晰的视野降低了大脑处理信息的负担。
  • 提升专注度: 沉浸式的环境可以减少干扰,让参会者更专注于会议内容本身。

提升会议参与度

  • 鼓励发言: 在“共处一室”的感觉下,参会者更愿意主动发言和互动,而不是像在传统会议中那样沉默或只打字。
  • 激发创意: 对于头脑风暴等需要团队协作的场景,Together Mode 提供了更接近线下会议的互动氛围,有助于激发创意。

应用场景

Together Mode 特别适用于以下场景:

  • 团队例会: 让远程和办公室的员工感觉像是在同一个会议室里。
  • 头脑风暴: 创造轻松、开放的交流环境,鼓励自由发言。
  • 培训与教学: 营造教室氛围,增强师生互动。
  • 公司活动: 如虚拟年会、庆祝会等,增强员工之间的情感连接。
  • 客户访谈: 创造更专业、更亲切的沟通氛围。

挑战与局限性

尽管优势明显,Together Mode 也面临一些挑战:

Together Mode技术如何重塑远程协作体验?-图3
(图片来源网络,侵删)
  • 对算力要求高: AI处理和3D渲染需要强大的云端服务器支持,这对服务器的计算能力和网络带宽提出了较高要求。
  • 隐私与背景问题: 虽然Together Mode可以隐藏杂乱的物理背景,但有些人可能不习惯自己的形象被处理并放置在公共虚拟空间中,提供“关闭”选项至关重要。
  • “恐怖谷”效应: 如果技术不够成熟,虚拟人物的头部动作与真人略有差异,可能会产生一种诡异的感觉,反而让部分用户感到不适。
  • 适用性: 对于需要频繁展示PPT、共享屏幕或进行精细文档协作的会议,传统的“画廊视图”可能更实用,Together Mode 更侧重于人与人之间的互动。

未来发展

Together Mode 代表了视频会议的未来发展方向之一,我们可以预见以下趋势:

  • 更多样的虚拟环境: 从会议室扩展到虚拟户外、太空、奇幻世界等更具想象力的场景。
  • 更强的交互性: 参会者可能可以在虚拟空间中自由移动,进行“分组讨论”(走到虚拟白板前或进入一个虚拟小隔间)。
  • 与AR/VR结合: 通过混合现实或虚拟现实设备,参会者可以以虚拟化身的形式进入同一个空间,获得比2D屏幕更极致的沉浸感。
  • 智能化升级: AI不仅能处理人像,还能实时分析会议氛围、识别发言者情绪,甚至提供会议纪要等辅助功能。

Together Mode 是一项利用AI和3D图形技术,将传统视频会议从“多窗口对话”升级为“共享空间互动”的革命性创新。 它通过增强社交临场感、减少认知负荷,极大地改善了远程协作的体验,是未来混合办公和数字通信领域的一项关键技术,虽然目前还存在一些挑战,但它所描绘的“天涯若比邻”的沟通愿景,正在逐步成为现实。

分享:
扫描分享到社交APP
上一篇
下一篇