Yahoo에서 Hadoop을 적용한 가장 큰 규모의 프로젝트 정보를 아주 조금이지만 오픈 했습니다. Webmap이라고 하는  검색을 위한 웹 페이지 정보를 관리하는 시스템인 것 같습니다.

Some Webmap size data:

  • Number of links between pages in the index: roughly 1 trillion links
  • Size of output: over 300 TB, compressed!
  • Number of cores used to run a single Map-Reduce job: over 10,000
  • Raw disk used in the production cluster: over 5 Petabytes

자세한 내용은 다음 페이지를 참고하세요.
http://developer.yahoo.com/blogs/hadoop/2008/02/yahoo-worlds-largest-production-hadoop.html

크리에이티브 커먼즈 라이센스
Creative Commons License

Posted by 김형준


Trackback URL : http://www.jaso.co.kr/trackback/227

Comments List

  1. typos 2008/02/20 16:43 # M/D Reply Permalink

    ㅎㅎ 공개되는군요.
    공개되었으니 말인데 야후내부에서는 이것으로 링크분석을 하는듯 합니다.
    근데 시간이 생각보다 좀 걸린다는...

    1. 김형준 2008/02/20 17:51 # M/D Permalink

      현재의 속도보다는 linear scalability가 더 중요하겠죠. 현재보다 2배 더 빨라져야 한다면 서버를 추가만 하면 되겠죠... 별도의 프로그램/데이터 수정없이도요.

  2. 고감자 2008/02/22 09:50 # M/D Reply Permalink

    헉... 내부 프로젝트명까지 공개되다니... ㅜㅜ

    1. 김형준 2008/02/22 10:14 # M/D Permalink

      신혼여행 갔다 오셨나 보네요... 수석졸업도 축하합니다.

Leave a comment
« Previous : 1 : ... 200 : 201 : 202 : 203 : 204 : 205 : 206 : 207 : 208 : ... 388 : Next »