하둡스트리밍 하둡 스트리밍이란, 기존 자바로 맵리듀스를 실행하던것 외에 스크립트 언어 (파이썬, 루비, 셸스크립트 등)를 하둡에서 실행하게 해주는 인터페이스를 말합니다. 맵리듀스가 일정 시간동안 쌓인 데이터를 한번에 배치처리 하는 개념이었다면, 하둡스트리밍은 그때그때 데이터를 처리해야할 필요가 있을때 많이 쓰는 방식입니다. 하둡스트리밍 패키지 하둡 스트리밍을 실행하기 위해서는 contrib/streaming 디렉터리의 hadoop-streaming-1.2.1.jar 파일이 필요합니다. 이 jar파일을 사용해 스크립트를 실행시키는 구조입니다. 하둡 스트리밍을 사용하기 위한 기본적인 커맨드 문법은 다음과 같습니다. > hadoop jar hadoop-streaming-1.2.1.jar \ -input 입력경..