微信 手机版
首页 > 热点 > 滚动 >
hadoop是什么?Hadoop是用于分布式计算的? 2022-10-08 11:36:37  来源:酷狗科技网

hadoop是什么?

Hadoop是一个由Apache基金会所开发的分布式系统基础架构,一个能够对大量数据进行分布式处理的软件框架; Hadoop以一种可靠、高效、可伸缩的方式进行数据处理;用户可以在不了解分布式底层细节的情况下,开发分布式程序。

Hadoop是用于分布式计算的?

hadoop擅长日志分析,facebook就用Hive来进行日志分析,2009年时facebook就有非编程人员的30%的人使用HiveQL进行数据分析;

淘宝搜索中 的 自定义筛选也使用的Hive;利用Pig还可以做高级的数据处理,包括Twitter、LinkedIn 上用于发现您可能认识的人,可以实现类似Amazon.com的协同过滤的推荐效果。

淘宝的商品推荐也是!在Yahoo!的40%的Hadoop作业是用pig运行的,包括垃圾邮件的识别和过滤,还有用户特征建模。

关键词: hadoop是什么 Hadoop是用于分布式计算的 hadoop有什么技术算法 hadoop包含哪些东西

热点文章
热点 图片