분산파일시스템을 이용한 프로그램
- Posted at 2007/06/18 23:00
- Filed under project/lucene_hadoop
분산파일시스템만이 가지고 있는 기능의 한계 때문에 Hadoop File System을 이용하여 개발할때 귀찮은 점이 많았다. 하지만 이제는 지원하지 않는 기능은 당연히 없다라고 생각하고 기존 일반 파일시스템을 이용할 때와는 다른 생각으로 프로그램을 하다 보니 그럭저럭 쓸만하다는 것이 개인적인 생각이다.
오늘은 문득 앞으로 많은 프로그램들이 분산파일시스템 기반하에서 운영되도록 만들어지지 않을까 하는 생각도 해본다. 실제 파일을 사용하는 프로그램 중 Random write 기능은 많이 사용되지 않는다. 파일 lock 등도 잘 사용하지 않는다. 다만 append 기능은 자주 사용하고 있는데 지원하지 않는 것이 아쉽다. hadoop에 append 기능을 구현하는 것은 어렵지 않으니 언젠가는 추가 되겠지...
Hadoop와 같은 분산파일시스템을 이용하여 시스템을 개발하면 다음과 같은 장점이 있다.
1. 파일에 대한 백업/복구가 거의 필요 없다.
NAS와 같은 비싼 스토리지를 사용하지 않고도 안정적인 파일 보관이 가능하다.
2. 파일에 대한 공유는 기본이다.
파일의 Global name space를 제공하기 때문에 모든 클라이언트가 파일을 공유할 수 있다.
3. 파일 접근에 bottleneck이 발생하지 않는다.
여러 서버에서 파일 서비스를 하기 때문에 bottleneck이 발생하지 않는다.
4. 파일이 클 경우 Map&Reduce를 이용하여 병렬처리도 할 수 있다.
Posted by 김형준
- Response
- No Trackback , No Comment
Trackback URL : http://www.jaso.co.kr/trackback/170






