PBS 몇일째 삽질
- Posted at 2006/11/28 11:02
- Filed under Program/Linux
PBS(Portable Batch System)은 여러개의 Node에서 프로그램을 실행 시키고 이들 프로그램들에 대한 스케쥴 관리를 해주는 Job Management System이다.
이거 가지고 몇일째 삽질 중이다.
- 첫번째 삽질 : 설치된 리눅스 장비에서 자체 DNS를 이용하기 위해 named 데몬을 이용하였는데... PBS에서 다음과 같이 node 추가한 후에 node 상태를 확인해보면 대부분 down 이라고 나온다... 쩝...
-----------------------------
qmgr
>create node node01.nodes.com
>create node node02.nodes.com
>q
------------------------------
pbsnodes -a
node01.nodes.com
state = down
np = 1
ntype = cluster
node02.nodes.com
state = down
np = 1
ntype = cluster
이거 해결할려고 갖은 삽질을 다해봤지만 해결한 방법은 /etc/hosts에 node에 대한 정보를 추가하니까 된다. 아직까지 원인은 해결하지 못한 상태...
어떤 경우에는 create node 할때 해당 서버를 찾을 수 없다라는 에러 메세지가 나타나는 경우도 있다.
- 두번째 삽질 : 설치는 되었고 프로그램을 실행시켜 보았다. 우리가 좋아하는 Hello World...
hello.sh
------------------------
echo "hello world"
------------------------
qsub hello.sh ---> queue에 submit 한다.
이렇게 하면 원래는 이것을 실행시킨 node에 xxx.o, xxx.e 와 같이 output과 error에 대한 출력이 각각 저장되어야 한다.
하지만 여러번의 삽질 결과 PBS는 결과를 전송하기 위해 내부적으로 다음과 같이 한다.
/usr/pbs/sbin/pbs_rcp -r resultfile user01@master.nodes.com:/home/user01/hello.sh.o
근데 여기서 내부적으로 rcp 또는 scp를 사용하고 있다는 것...
최근 linux는 기본적으로 설치하면 rcp는 disable 상태이다. scp는 공개키 적용해줘야 암호없이 바로 넘어간다.
rcp enable 하고 다시 도전해보기로 한다. 잘되야 할텐데....
--> rcp enable 하고 테스트한 결과 성공...
--> 그럼 scp로 할려면 어떻게 해야 하나?? PBS compile 옵션에는 ssh enable 해주는 부분이 있던데. 일단은 rcp 가지고 테스트 계속 진행
이거 가지고 몇일째 삽질 중이다.
- 첫번째 삽질 : 설치된 리눅스 장비에서 자체 DNS를 이용하기 위해 named 데몬을 이용하였는데... PBS에서 다음과 같이 node 추가한 후에 node 상태를 확인해보면 대부분 down 이라고 나온다... 쩝...
-----------------------------
qmgr
>create node node01.nodes.com
>create node node02.nodes.com
>q
------------------------------
pbsnodes -a
node01.nodes.com
state = down
np = 1
ntype = cluster
node02.nodes.com
state = down
np = 1
ntype = cluster
이거 해결할려고 갖은 삽질을 다해봤지만 해결한 방법은 /etc/hosts에 node에 대한 정보를 추가하니까 된다. 아직까지 원인은 해결하지 못한 상태...
어떤 경우에는 create node 할때 해당 서버를 찾을 수 없다라는 에러 메세지가 나타나는 경우도 있다.
- 두번째 삽질 : 설치는 되었고 프로그램을 실행시켜 보았다. 우리가 좋아하는 Hello World...
hello.sh
------------------------
echo "hello world"
------------------------
qsub hello.sh ---> queue에 submit 한다.
이렇게 하면 원래는 이것을 실행시킨 node에 xxx.o, xxx.e 와 같이 output과 error에 대한 출력이 각각 저장되어야 한다.
하지만 여러번의 삽질 결과 PBS는 결과를 전송하기 위해 내부적으로 다음과 같이 한다.
/usr/pbs/sbin/pbs_rcp -r resultfile user01@master.nodes.com:/home/user01/hello.sh.o
근데 여기서 내부적으로 rcp 또는 scp를 사용하고 있다는 것...
최근 linux는 기본적으로 설치하면 rcp는 disable 상태이다. scp는 공개키 적용해줘야 암호없이 바로 넘어간다.
rcp enable 하고 다시 도전해보기로 한다. 잘되야 할텐데....
--> rcp enable 하고 테스트한 결과 성공...
--> 그럼 scp로 할려면 어떻게 해야 하나?? PBS compile 옵션에는 ssh enable 해주는 부분이 있던데. 일단은 rcp 가지고 테스트 계속 진행
Posted by 김형준
- Response
- No Trackback , No Comment
Trackback URL : http://www.jaso.co.kr/trackback/127






