Hadoop

Hadoop

| 공개

Hadoop

하둡은 빅데이터를 효과적으로 저장하고 분석하기 위한 오픈소스 솔루션입니다. 

교육대상

하둡은 거대 데이터를 분석하는 솔루션입니다. 다시 말해서 큰 규모의 데이터를 저장하거나 분석해야 할 때 하둡을 사용합니다. 그렇기 때문에 하둡의 1차적인 수요자는 규모가 큰 기업이나 단체입니다. 하지만 빅데이터라는 것은 그것을 실제로 사용할 수 있을 때 만들어집니다. 다시 말해서 지금까지 빅데이터가 거대 조직의 전유물이었던 것은 이 데이터를 분석하고 활용할 수 있는 능력을 갖춘 자들이 거대조직 밖에 없었기 때문입니다. 하지만 하둡이나 클라우드 컴퓨팅과 같은 기술이 등장하면서 작은 조직도 빅데이터를 저렴하게 유지하고 분석 할 수 있는 시대가 오고 있습니다. 빅데이터의 저변이 빠른 속도로 넓어질 것임을 암시하는 시대적 분위기라고 할 수 있습니다. 규모가 작아도 더 많은 것을 시도하고 실험해 볼 수 있는 시대가 오고 있는 것입니다. 

선행지식

하둡은 자바로 만들어졌기 때문에 자바와 제일 친합니다. 하지만 하둡을 빅데이터의 저장장치로만 이용할 것이라면 Java를 전혀 몰라도 문제가 되지 않습니다. 하둡을 이용해서 분석을 한다면 자바를 알고 있으면 유리합니다. 하지만 하둡을 이용한 연산에 꼭 자바를 사용해야 하는 것은 아닙니다. PHP, Python, Bash Script,Perl 등을 이용해서도 분석 작업을 할 수 있습니다. 또 Hive와 같은 솔루션을 이용하면 SQL과 거의 비슷한 문법으로 분석작업을 할 수 있습니다. 일단 하둡 수업을 출발점으로 학습 하다가 자신이 하고자하는 일에 맞는 기술을 찾아서 공부할 것을 권합니다.

홈페이지

http://hadoop.apache.org/

댓글

댓글 본문
graphittie 자세히 보기