apache에서 hadoop 기반 machine learning 알고리즘 프로젝트 시작
- Posted at 2008/01/25 22:13
- Filed under project/lucene_hadoop
apache의 Lucene의 서브 프로젝트로 아파치 라이센스를 가지는 machine learing 알고리즘 구현 프로젝트를 시작한다고 한다.
프로젝트 명은 "Mahout" 입니다. mahout의 의미가 "코끼리를 다루는 사람" 이라는 뜻인데 Hadoop의 로고가 노란 코끼리인 것을 딴 것인지.
암튼 점점 많은 것들이 생겨나고 있는데 그 중심에는 Hadoop이 있고 Hadoop은 소스레벨까지 모두 이해하고 있지만 데이터 마이닝, 선형 대수, 시멘틱웹 등에 대한 지식이 전무한 상태에서는 아무것도 할 수 없다는 현실이 안타깝기만 하다.
올 한해 어쩔수 없이 또 칼을 갈아야 하나 보다.
http://lucene.apache.org/mahout/
다음은 Mahout wiki에 있는 소개 문구
"Apache Mahout is a new Lucene TLP project to create scalable, machine learning algorithms under the Apache license."
그리고 Mahout에서 참고했다는 논문
프로젝트 명은 "Mahout" 입니다. mahout의 의미가 "코끼리를 다루는 사람" 이라는 뜻인데 Hadoop의 로고가 노란 코끼리인 것을 딴 것인지.
암튼 점점 많은 것들이 생겨나고 있는데 그 중심에는 Hadoop이 있고 Hadoop은 소스레벨까지 모두 이해하고 있지만 데이터 마이닝, 선형 대수, 시멘틱웹 등에 대한 지식이 전무한 상태에서는 아무것도 할 수 없다는 현실이 안타깝기만 하다.
올 한해 어쩔수 없이 또 칼을 갈아야 하나 보다.
http://lucene.apache.org/mahout/
다음은 Mahout wiki에 있는 소개 문구
"Apache Mahout is a new Lucene TLP project to create scalable, machine learning algorithms under the Apache license."
그리고 Mahout에서 참고했다는 논문
Posted by 김형준
- Response
- No Trackback , 2 Comments
Trackback URL : http://www.jaso.co.kr/trackback/216
Comments List
-
meta data extract프로젝트가 시작된걸 내심 기대하고 있었는데 하나 더 추가되었군요.
플래폼을 통한 콘텐츠 분석의 분기점을 hadoop이 만들어 주는가 봅니다. -
아주 가까운 데에서 비슷한 일을 하고 계시는 분이 계십니다. ^^
nips06-mapreducemulticore.pdf





