Comparison between Hortonworks and Alibaba
公司 | Hortonworks | Alibaba |
---|---|---|
大数据产品 | Ambari (提供 Hadoop 生态的管理、运维、升级等功能) HDP (提供大部分 Hadoop 相关开源组件) HDF (提供数据流相关的开源组件) |
Dataworks (大数据开发平台,提供在线编辑工具) Dataphin (新一代大数据平台,为阿里的数据中台业务中台铺路) QuickBI (提供全面的报表展示服务,为 Martech 助力) |
市场占有率 | 国际市场的三驾马车之一(Cloudera, MapR),18 年底完成与 Cloudera 公司的合并 | 国际市场占有率低(有一部分 Flink 的原因,Flink16 年出现) |
收费模式 | 100% 开源,提供收费技术支持及培训 | 具体需要联系售前 |
产品特点 | 100% 开源,使用不受任何限制 | 基础架构及上层服务均需要全套阿里产品,同时数据留存在阿里 |
技术栈 | Hadoop HDFS Yarn Spark2(DataFrame + SQL) Nifi Kafka Kerberos ZooKeeper Ranger Oozie …. |
MaxCompute (阿里大数据处理引擎,基于 Hadoop 早期版本定制) Blink (基于 Flink 的定制版,做 batch 及 streaming 处理) |
主要开发语言 | Java, Scala, SQL, 部分可视化拖拽(Nifi) | 可视化拖拽,SQL |
开发成本 | 高 (需要部署开发环境,同时需要 IDE 开发工具) | 低 (配置 + SQL,所有开发均在阿里在线开发环境完成) |
运维成本 | 高 (对 Hadoop 生态的优化需要自己完成) | 低 |
第三方服务 / 系统对接 | 容易实现 | 需要看阿里是否支持 |
技术支持 | 有成熟的社区及非常完善的文档,基本上遇到的问题都能解决 同时 Ambari 还提供智能支持的收费服务,也有收费培训等 |
具体暂不清楚,应该会有对应的技术工程师提供完备的服务,省去了花时间自己找解决方案 |
数据安全 | Kerberos+Ranger | 阿里产品 |
部署方式 | 基于虚机 / Docker 的部署,微软 Azure 提供深度支持 | 独立部署(需要有千万级数据的体量) 多租户方式 (适于小体量同时价格便宜) |