数据智能
企业出海服务为何这么难?
当前,新一轮科技革命席卷全球,新一代信息技术迅速发展,加速推进企业数字化转型。对我国而言,根据中国信通院发布的《中国数字经济发展白皮书(2020年)》显示,中国数字经济贡献不断增强,2019年我国数字经济增加值规模达到35.8万亿元,占GDP比重达到36.2%,正在形成数字产业化、产业数字化、数字化治理、数据价值化“四化”的数字经济框架。
随着我国数字经济规模不断扩张,我国拥有现象级的产品、丰富的人才、成熟的技术应用与商业模式,这正是我国互联网企业迈向全球的最佳时机。从国家层面来看,鼓励并提倡企业出海。2013年国家提出“一带一路”,促使更多企业开始走出国门开拓海外市场。2020年新基建迅速成为社会舆论的焦点,其更是将数字经济发展放大,有助于企业突破技术与产业瓶颈,利好企业出海。从企业侧来看,经营诉求的变化,出海成为最佳选择。大致可分为三类:
一、定位国际化的企业:此类企业多为第三代互联网公司,它们基于移动互联网诞生,一方面,资金和技术储备雄厚,易于出海。另一方面,部分企业的初心就是立足国际市场,乐于实践国际化。
二、成熟的企业:产品和技术成熟,但企业整体增速放缓,需要创新动力,希望通过出海保持企业发展动力。
三、初创企业:面对国内互联网下半场红利放缓,一些初创企业则选择转向海外的蓝海市场寻找机会。
部分资料源自《2019中国出海行业研究报告》
“从模仿到创新,从内部扩张到争相出海,中国企业出海欲乘风破浪,数据库服务壁垒需破解!”
企业出海 数据先行
自2020年2月以来,新冠疫情在全球范围内爆发,全球经济尽显疲态,但移动互联网市场却十分火热。具体表现在疫情蔓延促使人们在线寻求娱乐和社交的热情上升。以如今全球范围内最受欢迎的短视频应用为例,根据Sensor Tower公布的数据显示,2020上半年中国短视频/直播应用,在海外下载量及收入ToP20的应用共获得12.7亿次下载,前五大市场分别为为印度 (42.5%),巴西 (8.3%),印尼 (6.2%),美国 (5.2%) 和墨西哥 (3.3%),可见印度、美洲及东南亚地区已成为中国企业出海的热土。
目前,游戏、社交与娱乐应用处于利好之下,我国技术型企业出海恰逢时机,而“孤身”出海的中国企业,数据存储及数据安全则是首要问题。如今的数字经济时代,数据价值凸显,企业消费者分布在世界的各个角落,数据的存储和读取需要漂洋过海,这无疑会给出海企业的用户体验带来诸多挑战。同时“孤军奋战”的出海企业,势必面临高昂的基础设施投入,或许难以到达预期效果。而借助专业的第三方服务,则有助于出海企业的成本控制,并大幅提升数据储存与管理效率。
AWS全球数据库服务赋能企业出海
根据2019年Gartner发布的《The Future of the Database Management System (DBMS) Market Is Cloud》报告指出数据库的未来是云上,其中Amazon Web Services (AWS) 从2016年至2018年始终占据全球云数据库市场份额第一。AWS作为全球云服务的先行者,可提供丰富、稳定、可靠的全球数据库服务。
AWS基础设施覆盖全球,可快速帮助出海企业构建分布在全球的Internet规模应用程序,实现出海企业在世界各地以同样速度和安全性,便捷的使用相同资源。企业无需担心峰值等难题,AWS数据库可自动适应峰值工作负载,从而实现最优的成本节省。AWS可提供关系型数据库、非关系型数据库与数据仓库三种全球性数据库服务。
1、关系数据库:Aurora Global Database(Amazon Aurora全球数据库)
对于出海企业而言,业务的平稳运营是快速获客的必要条件,需要第三方服务提供可靠的数据灾备体系。Aurora Global Database针对全球分布式应用程序而设计,可跨越多区域实现数据服务的灾难恢复,快速实现指向次区域的全局故障转移,帮助出海企业实现数据灾备。
其灾难恢复类解决方案,主要表现在以下两项指标:
• RTO(恢复时间目标)——即灾难发生后,需要多长时间才能恢复正常工作状态。
• RPO(恢复点目标)——灾难事件可能破坏的数据量。
Amazon Aurora全球数据库以更优的恢复点目标(RPO)与恢复时间目标(RTO)处理区域整体故障,可以实现将RPO控制在5秒以内,最大程度保证数据的安全,RTO保持在1分钟以内,缩短系统的停机时间,维持企业业务的正常运行。
如企业的主区域出现性能下降或中断,Amazon Aurora全球数据库可保证在此区域内仍可继续运行,其会快速响应并将次区域提升为主区域,借助全局存储复制功能,新主区域可在1分钟之内执行读取/写入功能,从而大幅降低故障对应用程序正常运行的影响。
此外,海外市场的高延迟是各家企业都无法逃避的现实。就以上文提到的娱乐和社交等应用为例,“内”与“外”用户体验尽可能保持一致始终是最大的挑战,无论是游戏的延迟,还是视频的加载延迟、卡顿等等都直接影响着用户体验。
Amazon Aurora全球数据库除提供灾备功能之外,允许企业将指向主区域的数据读取操作快速转移至次区域,保证以本地级别延迟将内容交付,通常跨地区复制延迟小于1秒。其可在最多5个远程区域中建立Amazon Aurora集群的读取副本,访问位置更接近这些本地区域便为用户带来低延迟的访问,进而实现更佳的体验与参与度。
除了为各区域用户提供更低的读取延迟,Amazon Aurora全球数据库特有的写入转发功能,可让全局应用程序以更少的代码变更在远程区域内轻松执行写入操作,简化应用程序的开发流程,提高开发效率。首先,应用程序先将写入操作发送至本地读取集群,再由该集群以透明方式把写入转发至主区域,即可实现将写入操作发送至任意Aurora全球数据库远程集群。Amazon Aurora兼容MySQL和Postgre SQL开源数据库引擎。
例如,虎牙直播面向海外市场的游戏直播平台Nimo TV,虎牙直播利用Amazon Aurora全球数据库服务,在AWS亚太(新加坡)区域部署数据库,在其它区域建立副本,提高当地用户的使用体验。
2、Amazon DynamoDB Global Tables
Amazon DynamoDB是一种键/值和文档的NoSQL数据库,可提供个位数的毫秒级性能,便于企业储存动态信息。Amazon DynamoDB Global Tables基于DynamoDB的全球覆盖范围构建,可为出海企业提供一个多区域、多主控、完全托管的解决方案。
该数据库在企业的AWS区域中自动复制Amazon DynamoDB表,并采用多主复制确保所有地区的数据保持一致,实现全局分布式应用程序的本地读取 /写入和全局数据访问。解决出海企业在区域之间复制和更新数据的难题,帮助企业将重心放在应用程序的业务逻辑等核心技术领域。
Global Tables简化了复杂的DynamoDB部署和管理全局可用表,企业只需在AWS管理控制台中选择需要复制数据的地区,数据库便会自动执行,保证应用程序通过现有的DynamoDB API和终端节点访问全局表。
目前Amazon DynamoDB Global tables已经在中国区上线,但Global Tables只能用于北京和宁夏之间或global区域之间的DynamoDB表同步,如果企业需要将中国区和global区域的DynamoDB表做双活复制同步,可通过lambda、DynamoDB stream、Kinesis Stream等托管服务实现。但需要企业自行构建解决方案,贴心的AWS也为此类企业提供了几项重要提示,如下:
• 如何捕获源端变化并持续复制到目标端。
• 如何避免循环复制。
• 如何处理同一个item的变更冲突。
• 如何处理网络延迟。
3、Amazon ElastiCache for Redis - Global Datastore
除Amazon Aurora全球数据库及Amazon DynamoDB Global Table之外,AWS还提供Amazon ElastiCache for Redis - Global Datastore服务,其基于Amazon ElastiCache for Redis。自Amazon ElastiCache for Redis推出以来拥有的低延迟流量特性,使其深受全球客户青睐,但随着企业服务需求的增加,需要更加灵活的云基础设施。为此,AWS研发了可在区域之间复制Amazon ElastiCache集群的功能,正式推出了Amazon ElastiCache for Redis - Global Datastore。
借助Global Datastore,企业可在一个区域中写入ElastiCache for Redis集群,并使数据可从其他两个跨区域副本集群中读取,缩短缓存数据与用户之间的地理距离,从而降低跨区域的网络延迟,提升数据的灾难恢复能力。全局数据存储设置相对简单、易操作,但需要提醒的一点是,主集群可以是新建集群,也可以是现有集群,其务必运行Redis 5.06或者更高版本。
数据的安全与合规
由于海外巨大的市场需求、活跃的用户群体与开放的消费习惯让中国企业出海得以乘风破浪,但与此同时数字经济消费潮也带来了全球性数据泄露事件的激增。根据2020年5月Verizon发布的2020年度《数据泄露调查报告》显示,在调查的15个行业中,28%的泄露涉及小型企业,72%的泄露事件涉及大型企业,其中58%的受害者遭到个人信息泄露。庆幸的是,81%的泄露在数天内得到了妥善处理。
随着人们对隐私数据保护意识的不断加强,众多国家及组织相继开始施行严格的安全法律法规,例如:《通用数据保护条例》(欧盟:GDPR)、《加利福尼亚州消费者隐私法案》(美国:CCPA)等,中国企业出海需要充分考虑到全球范围内隐私保护及合规方面的重要性。
但企业面对数据的一“紧”一“松”,确实左右为难。“紧”的一方面,数据助力企业出海,企业需要下大力气保证数据安全,限制数据的“活动范围”。“松”的一方面,企业需要数据为用户提供个性化的服务,出海企业更是需要数据在不同区域内的频繁传输和分析。作为业界的领导服务商,AWS的云安全服务可为出海企业提供全面的数据合规和数据安全保护服务:
• 网络隔离
企业可在AWS提供的Amazon Virtual Private Cloud (Amazon VPC) 服务中构建网络隔离区域运行各种资源。使用Amazon VPC,可帮助企业将数据库隔离在企业自己的虚拟网络中,企业可使用VPN与本地IT基础设施进行连接。
• 资源级权限
AWS全球数据库服务支持与AWS Identity and Access Management (IAM)集成,允许企业控制AWS IAM用户和组对特定资源(例如,数据库实例、数据库快照、数据库参数组、数据库事件订阅、数据库选项组)执行操作。此外,还可配置IAM规则以确保特定访问者仅拥有只读访问权限,而只有管理员可创建、修改和删除资源。
• 加密
企业的所有数据完全处于静态加密之中,通过静态加密,企业可以构建符合加密合规性和相关法律法规要求的安全敏感型应用程序。同时,静态加密与AWS KMS集成创建和控制的密钥加密企业的数据库,有效降低出海企业在保护敏感数据时的复杂程度。
• 合规性
AWS服务可支持包括SOC 1、SOC 2、SOC 3、ISO、MTCS、C5、PCI、HIPAA和FedRAMP等合规性计划。