公司新闻

  • 首页
  • 公司新闻
  • 利用 Salesforce Data Cloud 的 Zero Copy 数据共享到 Amazon

利用 Salesforce Data Cloud 的 Zero Copy 数据共享到 Amazon

2026-01-27 13:17:31

从Salesforce Data Cloud到Amazon Redshift的零拷贝数据共享实现统一分析 第一部分

作者 Rajkumar Irudayaraj Avijit Goswami Michael Chess Ifetayo Stewart Ravi Bhattiprolu Jason Berkowitz 和 Mike Patterson时间 2024年8月27日发布平台 Amazon Redshift Analytics Customer Solutions永久链接

关键要点

Salesforce与亚马逊合作,利用双向零拷贝数据共享在Salesforce Data Cloud和Amazon Redshift之间实现快速的实时数据访问。此文系列分为两部分,第一部分重点介绍在同一区域内的客户数据共享,第二部分将讨论跨区域数据共享。Salesforce Data Cloud提供一个统一的平台,将多个数据源整合为一个360度的客户视图。Amazon Redshift是一款快速、完全托管的大规模数据仓库服务,旨在实现高效的数据分析。

在不断发展的商业环境中,组织需要利用和操作数据以促进分析,产生洞察力,并基于数据做出明智决策,从而提供卓越的客户体验。Salesforce与亚马逊的合作,旨在帮助客户释放统一数据的价值,并通过双向的零拷贝 数据共享,加速洞察的获取,这一过程直接在Salesforce Data Cloud和Amazon Redshift之间进行。

在之前的帖子中,我们介绍了如何使用零拷贝数据联邦来赋能企业在Salesforce Data Cloud中访问Amazon Redshift数据,从而丰富其客户360数据和操作数据。本篇文章将探讨分析团队如何在Amazon Redshift中访问Salesforce Data Cloud中的客户360数据,以在无需提取、转换和加载ETL流程的情况下,基于统一数据生成洞察。本文着重讨论Salesforce Data Cloud与客户在同一区域内的AWS账户之间的数据共享;第二部分将讲述跨区域的数据共享。

什么是Salesforce Data Cloud

Salesforce Data Cloud 是一个数据平台,可以将公司所有数据整合到Salesforce的Einstein 1平台,使每个团队获得360度的客户视图,从而推动自动化、创建分析、个性化互动,并推动可信的人工智能AI。通过将大量分散的数据转化为统一的客户档案,Salesforce Data Cloud创建了一个全面的客户视图,用户可以轻松访问和理解,从而帮助销售、服务和市场团队构建个性化的客户体验,执行数据驱动的行动和工作流程,并安全地推动AI在所有Salesforce应用程序中的应用。

什么是Amazon Redshift

Amazon Redshift是一项快速、完全托管的PB级数据仓库服务,使用户能够使用现有的商业智能BI工具,简单且具成本效益地分析所有数据。它优化了从几百GB到PB的数据集,并在其他数据仓库解决方案中提供更优越的价格性能。凭借完全托管的、AI驱动的、海量并行处理MPP架构,Amazon Redshift使得商业决策的制定变得快捷而经济。Amazon Redshift Spectrum允许用户查询Amazon Simple Storage ServiceAmazon S3中结构化和半结构化的数据,而无需将数据加载到Redshift表中。Redshift Spectrum与AWS Lake Formation的集成使得可以使用数据目录的自动挂载功能,结合AWS身份和访问管理IAM凭证,利用Lake Formation进行权限授予和数据目录视图的访问控制。Salesforce Data Cloud与Amazon Redshift的数据共享利用了AWS Glue数据目录对多引擎视图的支持以及Redshift Spectrum与Lake Formation的集成。

什么是零拷贝数据共享?

零拷贝数据共享使得Amazon Redshift客户能够查询存储在Salesforce Data Cloud中的客户360数据,而无需传统的ETL搬移或拷贝数据。相反,用户可以简单地连接并在原地使用数据,实时获取最新的数据,迅速释放其价值。目前,零拷贝数据共享支持Amazon Redshift Serverless和配置好的RA3集群之间的数据共享。数据可以通过同一区域的Redshift Serverless或配置集群分享,也可以与不同区域的Redshift Serverless集群共享。要了解Salesforce与Amazon Redshift的零拷贝集成,请参阅该Salesforce博客。

解决方案概述

Salesforce Data Cloud提供了一种通过点选体验共享数据到客户的AWS账户。在Lake Formation控制台,用户可以接受数据共享,创建资源链接,将Salesforce Data Cloud对象挂载为数据目录视图,并授权对Amazon Redshift中实时和统一数据的查询权限。

下图展示了通过零拷贝架构,在同一区域内共享Salesforce Data Cloud数据与Amazon Redshift的整体流程。此架构遵循了在跨账户数据共享最佳实践与注意事项中记录的模式。

数据共享设置包括以下高阶步骤:

Salesforce Data Cloud管理员创建数据共享目标,并指定该数据共享的目标账户。Salesforce Data Cloud管理员选择要与Amazon Redshift共享的数据云对象,并创建数据共享。Salesforce Data Cloud管理员将数据共享链接到数据共享目标,并执行以下操作以创建跨账户资源共享:通过调用目录API,为Salesforce Data Cloud Apache Iceberg表创建数据目录视图。使用Lake Formation共享,创建跨账户的数据目录共享。在客户的AWS账户中,Lake Formation管理员登录Lake Formation控制台以接受资源共享,创建资源链接,并授予Redshift角色的访问权限。数据分析师使用合适的角色启动Amazon Redshift查询编辑器,以查询数据共享并与本地Redshift表连接。

前提条件

实现数据共享的前提条件包括:

一个Salesforce Data Cloud账户。一个已启用AWS Glue和Lake Formation的AWS账户。一个Redshift Serverless或一个配置好的RA3实例类型的Redshift集群如ra316xlarge、ra34xlarge、ra3xlplus。不支援DC2或DS2等其他配置好的实例类型,必须在访问数据共享之前设定。如果您没有现成的配置Redshift RA3集群,建议使用Redshift Serverless命名空间以简化操作与维护。Amazon Redshift服务必须在与Salesforce Data Cloud运行的同一区域内运行。Lake Formation和Amazon Redshift的AWS管理员角色:Lake Formation 数据湖管理员,负责接受共享并为用户提供访问权限。更多详情请参阅Lake Formation角色和IAM权限参考。Amazon Redshift Redshift数据库所有者、管理员或超级用户,负责创建数据库并为开发人员或分析师提供访问权限。更多详情请参阅默认数据库用户权限。

创建数据共享目标

完成以下步骤以创建数据共享目标:

在Salesforce Data Cloud中,选择应用启动器并选择数据共享目标。

选择新建,然后选择Amazon Redshift,接着选择下一个。

输入数据共享目标的标签、API名称和账户的详细信息。

选择保存。

保存这些设置后,S3租户文件夹的值将被填充。

选择S3租户文件夹链接并复制验证令牌。

如果您未登录AWS管理控制台,则会被重定向到登录页面。

输入验证令牌并选择保存。

数据共享目标状态变为活动。

创建数据共享

完成以下步骤以创建数据共享:

在Salesforce组织中导航至数据共享标签。选择应用启动器并选择数据共享。

或者,您可以从组织的主页访问数据共享标签。

选择新建,然后选择下一个。

提供标签、名称、数据空间和描述,然后选择下一个。

选择要包含在共享中的对象,并选择保存。

将数据共享目标链接至数据共享

要链接数据共享目标至数据共享,请完成以下步骤:

在数据共享记录主页上,选择链接/取消链接数据共享目标。选择要链接至数据共享的数据共享目标并选择保存。

数据共享必须处于活动状态,您才能在Lake Formation控制台接受资源共享。

在Lake Formation中接受数据共享

本节提供接受数据共享邀请的详细步骤及将数据共享挂载至Amazon Redshift的配置步骤。

在数据共享成功链接至数据共享目标后,导航至Lake Formation控制台。

数据共享邀请横幅将显示。

选择接受并创建。

接受并创建页面显示资源链接,并提供设置IAM权限的选项。

在主体部分,选择IAM用户和角色,以授予数据共享资源链接的默认权限描述和选择。

选择创建。

上一步创建的资源链接出现在Lake Formation控制台的AWS Glue数据库资源分享旁边。

从Redshift Serverless查询数据共享

启动Redshift Serverless查询编辑器,并作为拥有描述和选择资源链接权限的联邦用户登录。

数据共享表会自动挂载,显示在awsdatacatalog下,可以如以下截图所示进行查询。

从配置好的Redshift集群查询数据共享

要从配置好的Redshift集群查询数据共享,作为超级用户登录到该集群。

在编辑器选项卡上,运行以下SQL语句以授予IAM用户对数据目录的访问权限:

sqlGRANT USAGE ON DATABASE awsdatacatalog to IAMmyIAMUser

利用 Salesforce Data Cloud 的 Zero Copy 数据共享到 Amazon

IAMmyIAMUser是您希望授予对数据目录使用权限的IAM用户。或者,您可以为IAM角色授予权限,格式为IAMRmyIAMRole。更多细节请参阅查询AWS Glue数据目录。

使用前一步骤的临时凭证登录角色用户。

您现在应该能够展开awsdatacatalog并查询数据共享表,如以下截图所示。![](https//d2908q

魔方加速器免费正版