阿里云上云方案之云原生企业级数据湖,解决数据孤岛问题!
阿里云推出的云原生企业级数据湖基于OSS构建,支持多种数据输入和存储格式,实现数据整合与分析。该方案具备冷热数据分层及生命周期管理功能,有效优化存储成本。适用于面临数据孤岛、需处理海量数据并追求高效分析的企业。
云原生企业级数据湖基于阿里云的对象存储OSS构建,支持多种数据输入和存储格式,实现数据整合与分析。用户可以直接从OSS进行大数据分析,挖掘业务价值。此外,数据湖还提供冷热数据分层和生命周期管理功能,优化存储成本。
适用客户
- 面临数据孤岛问题的企业
- 需处理海量数据并降低成本的企业
- 追求高效数据分析与洞察的企业
方案优势
一份存储、多种引擎
各种类型的数据集中统一存储在对象存储OSS中,解决数据孤岛问题,避免数据分散在多种不同的系统中,极大降低运维管理难度。
数据无需处理、直接存储
支持结构化、半结构化、非结构化等多种类型数据,数据可以按照原始形式直接存储到数据湖,提供便捷的数据接入和数据消费通道。
计算与存储解耦合
提供更灵活的系统架构设计,通过细粒度的权限控制、数据加密和日志记录与审计等机制保障数据安全。
架构与部署
云原生企业级数据湖使用对象存储OSS作为统一存储,可以存储来自不同数据源的各种类型数据。通过多种存储类型实现数据冷热分层,无缝对接EMR、PAI等大数据分析和训练引擎。
结合高性能文件存储CPFS,实现OSS与CPFS之间的数据双向流通。热点训练数据以透明方式同步到CPFS,通过CPFS的文件语义与机器学习平台PAI对接,满足高性能训练场景需求。
部署时长: 80分钟
预估费用: 5元
(假设您选择最低规格资源,且资源运行时间不超过30分钟。如调整了资源规格,请以控制台显示的实际报价以及最终账单为准)
相关云产品
立即部署
应用场景
基于开源生态构建大数据分析
支持Hadoop开源生态构建大数据分析方案,解决了传统Hadoop在扩展性、运维模式、成本优化方面的难题。
海量数据冷热分层
大数据场景中有大量数据累积,并且数据随着时间推移访问热度会大幅降低。解决了数据分散在各个集群的问题,优化长期存储成本。
基于数据湖的人工智能
数据湖支持AI的关键流程,包括数据存储、预处理、特征提取、模型训练和部署,利用机器学习平台的技术优势,提高训练速度。
优惠购买
阿里云为您推荐优惠购买云产品
-
OSS 对象存储-存储包
- 地域:中国内地通用
- 标准 - 本地冗余存储规格:500GB
- 限1件
- ¥118.99 / 1年起
-
CPFS资源包
- 地域:华东1(杭州)
- CPFS基准容量:100GiB
- ¥900.00 / 1年
-
OSS 对象存储-流量包
- 地域:中国大陆
- 下行流量包规格:100GB
- ¥49.00 / 1个月
查看详情:云原生企业级数据湖