第二节-HDFS简介

# Hadoop分布式文件系统—HDFS

# 一、 HDFS 介绍

HDFSHadoop Distributed File System)是 Hadoop 下的分布式文件系统,具有高容错、高吞吐量等特性,可以部署在低成本的硬件上。

第五节-Hadoop单机环境搭建

# Hadoop单机版环境搭建

# 一、前置条件

Hadoop 的运行依赖 JDK,需要预先安装。

第四节-集群资源管理器-YARN

# 集群资源管理器——YARN

# 一、hadoop yarn 简介

Apache YARN (Yet Another Resource Negotiator) 是 hadoop 2.0 引入的集群资源管理系统。用户可以将各种服务框架部署在 YARN 上,由 YARN 进行统一地管理和资源分配。

img

第三节-分布式计算框架-MapReduce

# 分布式计算框架—MapReduce

# 一、MapReduce概述

Hadoop MapReduce 是一个分布式计算框架,用于编写批处理应用程序。编写好的程序可以提交到 Hadoop 集群上用于并行处理大规模的数据集。

第一节-大数据简介

大数据简介

# 大数据处理流程

img

上图是一个简化的大数据局的处理流程图,大数据处理的主要流程包括数据收集、数据存储、数据处理、数据应用等主要环节。

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×