定义:
数据湖是把所有不同种类的数据汇聚到一起,打破数据孤岛,并建立元数据目录和数据血缘关系。数据湖具有的特点如下:
1、纳入数据无需预定义的模型;
2、灵活性。可在数据分析时定义模型。
针对痛点:
海量且格式不统一数据缺乏统一管理。如海量的包含结构化、半结构化和非结构化数据。
数据沼泽地。涉及不同数据结构类型,缺乏业务主题管理。
数据湖是把所有不同种类的数据汇聚到一起,打破数据孤岛,并建立元数据目录和数据血缘关系。数据湖具有的特点如下:
1、纳入数据无需预定义的模型;
2、灵活性。可在数据分析时定义模型。
海量且格式不统一数据缺乏统一管理。如海量的包含结构化、半结构化和非结构化数据。
数据沼泽地。涉及不同数据结构类型,缺乏业务主题管理。