hadoop 0.18 release
- Posted at 2008/08/27 14:57
- Filed under Dev_diary
|
conf |
Configuration에 hexadecimal 값 추가 가능 | |
|
dfs |
LocatedBlock 내에 corrupt flag가 추가 되었음 Block의 모든 replica가 corrupt 된 경우 true로 설정 | |
|
dfs |
NameNode의 파일 시스템 이미지 정보 관리 향상 NameNode의 이미지 정보가 삭제된 경우 마지막 check point 시점의 이미지 파일을 SecondaryNameNode로부터 복사한다. | |
|
dfs |
fsck 처리 시 write 중인 파일은 무시. Write 중인 파일까지 fsck 할 경우에는 "-openforwrite" 옵션 사용 | |
|
dfs |
CRC가 없는 버전에서 CRC가 있는 버전으로 업그레이드는 지원하지 않음. 따라서 0.13이전 버전은 그 이상의 버전으로 업그레이드 한 다음 0.18로 업그레이드 해야 함. | |
|
dfs |
“fs –ls” 명령의 결과를 Linux format과 비슷하게 변경 | |
|
dfs |
FDDataOutputStream에 sync() 메소드 추가. sync() 메소드는 호출 즉시 버퍼에 있는 내용을 HDFS로 저장. | |
|
dfs |
디스크의 볼륨을 확인하기 위한 “du” 명령을 별도의 thread로 처리. 사용자 작업을 block 시키지 않는다. | |
|
dfs |
hdfs 기본 포트를 8020으로 변경. 기본 포트로 접속할 경우에는 포트는 생략해도 됨(hdfs://example.com/dir/file) | |
|
fs |
getFileCacheHints 메소드 삭제 | |
|
fs |
작은 파일을 하나의 파일로 묶어서 저장할 수 있는 기능 제공(Hadoop Archive, har 포맷) Map&Reduce에서도 사용 가능 | |
|
fuse-dfs |
FUSE 마운트 기능 | |
|
mapred |
Reporter에 다음 메소드 추가 "incrCounter(String group, String counter, long amount)" | |
|
mapred |
DistributedCache에 tar tgz tar.gz 포맷 추가 2GB 까지 가능 | |
|
mapred |
Map-reduce 수행 중에 발생하는 key, value의 메모리 내 복사 향상. | |
|
mapred |
“job –kill” 명령은 RUNNING, PREP 상태의 job만 kill 됨 | |
|
mapred |
Job Tracker log와 Job history로그에 input split에 대한 로그 추가, WEB UI에서도 조회 가능 | |
|
mapred |
Task의 working directory를 task가 종료되자 마자 삭제 (${mapred.local.dir}/taskTracker/jobcache/<jobid>/<task_dir>/work) | |
|
mapred |
Client의 “mapred.system.dir” 값이 job trackker의 값과 틀린 경우 job 수행이 안되도록 수정 | |
|
mapred |
n개의 라인을 하나의 레코드로 인식하는 NLineInputFormat 추가 | |
|
mapred |
Combiner가 여러 번 수행 가능하도록 변경. Combiner는 map의 출력이 sort, merge 될 때 수행된다. Reduce 측에서도 수행 가능한데 data가 merge 될 때 수행된다. 기존 방식을 유지하기 위해서는 다음과 같이 한다. job.setCombineOnlyOnce(true); | |
|
mapred |
Shuffle 향상(shuffle은 reduce에서 map의 결과를 merge 하는 과정인데 기존에는 map이 많은 경우 속도가 많이 느렸음) | |
|
mapred |
Key, value가 raw byte인 경우를 위해 SequenceFileAsBinaryOutputFormat 클래스 추가 | |
|
scripts |
Command line명령에 "job -counter <job-id> <group-name> <counter-name>" 추가 | |
|
util |
Introduced an FTPFileSystem backed by Apache Commons FTPClient to directly store data into HDFS. FTP client를 이용하여 직접 HDFS에 저장 |
Posted by 김형준
- Response
- No Trackback , 1 Comment
Trackback URL : http://www.jaso.co.kr/trackback/282
Comments List
-
안녕하세요. 어제 뒤풀이에서 옆자리에 앉았던 김정현입니다. 만나뵙게 되어서 정말 반가웠습니다.^^






