하둡 분산파일시스템 구축과 빅데이터 병렬처리
₩480,000
₩390,000

빅데이터 분산 저장 및 병렬처리 플랫폼 구축과 이를 기반으로 빅데이터 병렬처리를 하는 방법에 대해 설명합니다.
이 코스는 아래의 내용을 포함합니다.
- 하둡에코시스템과 구성요소
- 서버 가상화
- 싱글모드 및 전체분산모드 하둡 클러스터 구축
- 맵리듀스 애플리케이션에 대한 설명
- 하둡 파일시스템 관리 명령
- 스파크 분석 도구 설치 및 빅데이터 분석 도구 환경 설정
- SQL을 이용한 하둡 클러스터의 데이터 분석
- 파이썬을 이용한 머신러닝 기반 하둡 빅데이터 분석
Course Features
- Lectures 27
- Quizzes 0
- Duration 30 hours
- Skill level Intermediate
- Language 한국어
- Students 1
- Certificate Yes
- Assessments Yes
-
빅데이터 개요
빅데이터의 개요 및 하둡 에코시스템에 대해 설명합니다.
-
하둡의 구성요소와 기본 설정
하둡의 종류와 구성요소, 그리고 하둡 클러스터 구축을 위한 기본 설정에 대해 설명합니다.
-
서버 가상화
PC에서 하둡 클러스터를 설치하려면 서버 가상화를 할 수 있어야 합니다.
-
하둡 클러스터 구축
하둡을 싱글모드로 설치와 전체 분산 모드로 설치하는 방법에 대해 설명합니다.
-
Spark
하둡에 스파크를 설치하고 주피터 노트북을 통해 하둡의 데이터를 불러와 분석하는 방법에 대해 설명합니다.