如何交流?
微信群: SnappyData中国用户组
支持
该博客由美团旅行-住宿事业部-经营效率组负责写作与维护,欢迎大家加入SnappyData专业中文社区及微信群进行讨论。
SnappyData是什么?
SnappyData是一个开源的内存分布式存储与计算引擎,提供实时的、HTAP(OLTP+OLAP)场景的解决方案,融合了Apache Spark与GemFire数据库,以多种数据模型提供复杂的、实时的、多维度的OLAP分析,完全支持标准SQL与Spark SQL。
分析人员只需通过SQL便可对实时数据进行低延迟且高准确性的分析工作。
SnappyData的特性
1 | 1、分布式存储+计算引擎 |
与TiDB对比
1 | TiDB是基于KV的行存;SnappyData支持列存。 |
SnappyData相比于Spark的优势
1 | Spark的RDD不可变;SnappyData可变(Gemfire),因此SnappyData的数据支持DML |
SnappyData相比于Flink的优势
1 | Flink流处理的API是DataStream,学习成本较高;SnappyData API支持标准SQL与Spark SQL,学习成本较低。 |
SnappyData的劣势
1 | 1、尽管列存支持压缩,从而大幅度减少数据量,同时可以横向扩展,但是内存空间的使用仍然使得成本较高 |