PBS 몇일째 삽질

PBS(Portable Batch System)은 여러개의 Node에서 프로그램을 실행 시키고 이들 프로그램들에 대한 스케쥴 관리를 해주는 Job Management System이다.
이거 가지고 몇일째 삽질 중이다.

- 첫번째 삽질 : 설치된 리눅스 장비에서 자체 DNS를 이용하기 위해 named 데몬을 이용하였는데... PBS에서 다음과 같이 node 추가한 후에 node 상태를 확인해보면 대부분 down 이라고 나온다... 쩝...

-----------------------------
qmgr
>create node node01.nodes.com
>create node node02.nodes.com
>q
------------------------------
pbsnodes -a
node01.nodes.com
state = down
np = 1
ntype = cluster

node02.nodes.com
state = down
np = 1
ntype = cluster

이거 해결할려고 갖은 삽질을 다해봤지만 해결한 방법은 /etc/hosts에 node에 대한 정보를 추가하니까 된다. 아직까지 원인은 해결하지 못한 상태...
어떤 경우에는 create node 할때 해당 서버를 찾을 수 없다라는 에러 메세지가 나타나는 경우도 있다.


- 두번째 삽질 : 설치는 되었고 프로그램을 실행시켜 보았다. 우리가 좋아하는 Hello World...

hello.sh
------------------------
echo "hello world"
------------------------

qsub hello.sh ---> queue에 submit 한다.

이렇게 하면 원래는 이것을 실행시킨 node에 xxx.o, xxx.e 와 같이 output과 error에 대한 출력이 각각 저장되어야 한다.
하지만 여러번의 삽질 결과 PBS는 결과를 전송하기 위해 내부적으로 다음과 같이 한다.
/usr/pbs/sbin/pbs_rcp -r resultfile user01@master.nodes.com:/home/user01/hello.sh.o

근데 여기서 내부적으로 rcp 또는 scp를 사용하고 있다는 것...
최근 linux는 기본적으로 설치하면 rcp는 disable 상태이다. scp는 공개키 적용해줘야 암호없이 바로 넘어간다.
rcp enable 하고 다시 도전해보기로 한다. 잘되야 할텐데....

--> rcp enable 하고 테스트한 결과 성공...
--> 그럼 scp로 할려면 어떻게 해야 하나?? PBS compile 옵션에는 ssh enable 해주는 부분이 있던데. 일단은 rcp 가지고 테스트 계속 진행
크리에이티브 커먼즈 라이센스
Creative Commons License

Posted by 김형준


Trackback URL : http://www.jaso.co.kr/trackback/127

Leave a comment
« Previous : 1 : ... 291 : 292 : 293 : 294 : 295 : 296 : 297 : 298 : 299 : ... 388 : Next »