2014년 1월 30일 목요일

[리눅스 시스템 프로그래밍] wait() 시스템 콜

자식 프로세스가 종료될 때 완전히 사라진다면, 부모 프로세스가 참고할 수 있는 정보들이 남지 않는다. 따라서 유닉스의 초기 설계자들은 자식 프로세스가 부모에 앞서 죽으면, 커널이 자식 프로세스를 특수한 프로세스 상태로 들어가게 만들어야 한다고 결정했다. 이런 상태에 있는 프로세스를 좀비라고 한다. 유용할지도 모르는 자료를 포함하는 몇 가지 기본적인 커널자료 구조처럼 프로세스를 지탱하는 최소 뼈대만 보존한다. 부모가 자신의 상태를 조사하도록 이런 특수한 프로세스 상태에 있는 자식 프로세스는 부모 프로세스를 기다린다(이런 자식 프로세스를 좀비 프로세스라고 부른다). 부모가 종료된 자식에 대해 보존된 정보를 획득한 다음에야 공식적으로 자식 프로세스가 종료되고 좀비에서 벗어나게 된다.


위의 프로세스 상태 전이 표에서 우측 상단에서 EXIT_ZOMBIE를 볼 수 있다.

리눅스 커널은 종료된 자식에 대한 정보를 얻기 위한 몇 가지 인터페이스를 제공한다. POSIX에 정의된 가장 단순한 인터페이스로  wait()가 있다.

#include <sys/types.h>
#include <sys/wait.h>

pid_t wait (int *status);

wait()를 호출하면 종료된 자식의 pid를 반환하며, 오류가 발생하면 -1을 반환한다. 자식 프로세스가 종료되지 않았다면 호출은 자식이 종료될 때까지 차단된다. 자식 프로세스가 이미 종료되었으면 호출은 즉시 반환된다. 따라서 SIGCHLD를 받고나서 자식 프로세스가 사망했다는 소식을 접한 다음에 wait()를 호출할 경우 차단(blocking) 없이 즉시 반환된다.

* SIGCHLD - 프로세스가 종료될 때 커널은 SIGCHLD 시그널을 부모에게 보낸다.

오류가 발생하면 다음 두 가지 errno 값 중 하나로 설정된다.

ECHILD 호출한 프로세스에 자식 프로세스가 존재하지 않는다.

EINTR 대기 중에 시그널을 받았으며, 조기에 호출이 반환된다.

NULL이 아닌 status 포인터는 자식에 대한 추가 정보를 포함한다. POSIX는 status에서 확인을 원하는 비트만 정의하도록 구현을 허용하므로, 표준은 이런 매개 변수를 해석하기 위해 매크로 군을 제공한다.

#include <sys/wait.h>

int WIFXITED (status); /* 프로세스가 정상적으로 종료되면 참을 반환. 즉 프로세스가 _exit를 호출한 경우 */
int WIFSIGNALED (status); /* 시그널이 프로세스 종료를 초래했을 경우 참을 반환 */
int WIFSTOPPED (status); /* 프로세스가 중단되거나 */
int WIFCONTINUED (status); /* 진행을 재개할 경우 참을 반환 */

int WEXITSTATUS (status); /* WIFXITED가 참을 반환하면 _exit()로 넘긴 값을 하위 8비트에 담아서 제공 */
int WTERMSIG (status); /* WIFSIGNALED가 참을 반환하면 종료를 초래한 시그널 번호를 반환 */
int WSTOPSIG (status); /* WIFSTOPPED가 참을 반환하면 프로세스를 멈춘 시그널 번호를 제공 */
int WCOREDUMP (status); /* 프로세스가 시그널을 받아서 코어 파일을 만들어낼 경우 참을 반환 */

0이 아닌 값은 참이다.
코어덤프에 대한 내용

자식에게 어떤 일이 일어났는지 파악하기 위해 wait()를 사용하는 예제 프로그램을 살펴보자.

                                                                                                                                  
#include <unistd.h>
#include <stdio.h>
#include <sys/types.h>
#include <sys/wait.h>

int main (void)
{
int status;
pid_t pid;

if (!fork ())         // 호출 성공하면 자식 프로세스는 0을 반환
return 1;            // 자식 프로세스 종료

pid = wait (&status); // status를 설정
if (pid == -1)
perror ("wait");

printf ("pid=%d\n", pid);

if (WIFEXITED (status))
printf ("Normal termination with exit status=%d\n", 
WEXITSTATUS (status));

if (WIFSIGNALED (status))
printf ("Killed by signal=%d%s\n",
WTERMSIG (status),
WCOREDUMP (status) ? " (dumped core)" : "");

if (WIFSTOPPED (status))
printf ("Stopped by signal=%d\n",
WSTOPSIG (status));

if (WIFCONTINUED (status))
printf ("Continued\n");

return 0;
}
                                                                                                                                  

이 프로그램은 자식 프로세스를 fork해서 바로 종료한다. 그리고 나서 부모 프로세스는 wait() 시스템 호출을 수행해서 자식 프로세스 상태를 파악한다. 프로세스는 자식 프로세스 pid와 그것이 어떻게 죽었는지를 출력한다. 이 경우 자식 프로세스는 main()에서 반환되는 방법으로 종료되었기 때문에 다음과 유사한 결과를 얻는다.

                                                                                                                                  
$ ./wait
pid=8520
Normal termination with exit status=1
                                                                                                                                  

프로그래머가 return을 사용하는 대신에 SIGABRT 시그널을 자신에게 보내는 abort()를 호출했을 경우 다음과 유사한 결과를 얻는다.

                                                                                                                                  
$ ./wait
pid=8678
Killed by signal=6
                                                                                                                                  

abort()는 <stdlib.h>에 정의되어 있다.
예제 코드를 다음과 같이 바꾼다.
if (!fork ())
        abort ();


출처 : 리눅스 시스템 프로그래밍, 로버트 러브 지음, 박재호 옮김, 한빛미디어 2009년 펴냄, ISBN: 978-89-7914-679-0 93569

댓글 없음:

댓글 쓰기