Comparison between Hortonworks and Alibaba

comparison

公司 Hortonworks Alibaba
大数据产品 Ambari (提供 Hadoop 生态的管理、运维、升级等功能)
HDP (提供大部分 Hadoop 相关开源组件)
HDF (提供数据流相关的开源组件)
Dataworks (大数据开发平台,提供在线编辑工具)
Dataphin (新一代大数据平台,为阿里的数据中台业务中台铺路)
QuickBI (提供全面的报表展示服务,为 Martech 助力)
市场占有率 国际市场的三驾马车之一(Cloudera, MapR),18 年底完成与 Cloudera 公司的合并 国际市场占有率低(有一部分 Flink 的原因,Flink16 年出现)
收费模式 100% 开源,提供收费技术支持及培训 具体需要联系售前
产品特点 100% 开源,使用不受任何限制 基础架构及上层服务均需要全套阿里产品,同时数据留存在阿里
技术栈 Hadoop
HDFS
Yarn
Spark2(DataFrame + SQL)
Nifi
Kafka
Kerberos
ZooKeeper
Ranger
Oozie
….
MaxCompute (阿里大数据处理引擎,基于 Hadoop 早期版本定制)
Blink (基于 Flink 的定制版,做 batch 及 streaming 处理)
主要开发语言 Java, Scala, SQL, 部分可视化拖拽(Nifi) 可视化拖拽,SQL
开发成本 高 (需要部署开发环境,同时需要 IDE 开发工具) 低 (配置 + SQL,所有开发均在阿里在线开发环境完成)
运维成本 高 (对 Hadoop 生态的优化需要自己完成)
第三方服务 / 系统对接 容易实现 需要看阿里是否支持
技术支持 有成熟的社区及非常完善的文档,基本上遇到的问题都能解决
同时 Ambari 还提供智能支持的收费服务,也有收费培训等
具体暂不清楚,应该会有对应的技术工程师提供完备的服务,省去了花时间自己找解决方案
数据安全 Kerberos+Ranger 阿里产品
部署方式 基于虚机 / Docker 的部署,微软 Azure 提供深度支持 独立部署(需要有千万级数据的体量)
多租户方式 (适于小体量同时价格便宜)