2014의 게시물 표시

[리눅스 커널] 시스템 콜

이미지
reference : 리눅스 커널 심층 분석, 로버트 러브 지음, 황정동 옮김 시스템 콜 커널과 통신 시스템 콜은 하드웨어와 사용자 공간 프로세스 사이에 있는 계층이다. 이 계층은 다음과 같은 세 가지 역할을 한다. 첫째, 사용자 공간에 하드웨어 인터페이스를 추상화된 형태로 제공(파일 입출력 시 애플리케이션은 디스크나 저장 매체의 형식이나 파일시스템 형식 같은 것을 신경 쓸 필요가 없다. 둘째, 시스템 콜은 시스템 보안 및 안정성을 제공(커널이 시스템 자원과 사용자 공간 사이에서 중재자 역할을 하기 때문에, 커널이 접근권한과 같은 기준을 적용해 통제할 수 있다. 예를 들면, 하드웨어를 잘못 사용하거나 다른 프로세스의 자원을 빼았는 등의 동작을 막을 수 있다. 셋째, 사용자 공간(user-space)과 기타 시스템 사이에 계층을 둠으로써 프로세스별 가상 시스템 환경을 제공할 수 있다. 만약 애플리케이션이 아무런 제약없이 시스템 자원에 접근할 수 있다면 멀티태스킹이나 갓아 메모리를 구현하는 것은 거의 불가능에 가깝다. 리눅스의 시스템 콜은 사용자 공간에서 커널과 상호작용할 수 있는 유일한 수단이다. 트랩(trap)을 제외하면 시스템 콜은 정상적인 방법으로 커널로 진입하는 유일한 수단이다. 장치파일이나 /proc 파일시스템을 이용하는 다른 인터페이스도 결국은 시스템 호출을 통하게 되어 있다. APIs, POSIX, and the C Library 애플리케이션은 일반적으로 시스템 콜을 직접 사용하지 않고, 사용자 공간에 구현된 애플리케이션 프로그래밍 인터페이스(API, Application Programming Interface)를 이용한다. 이 때문에 애플리케이션이 사용하는 인터페이스와 커널이 제공하는 인터페이스 사이에 직접적인 연관이 없다는 점이 아주 중요하다. API는 애플리케이션이 사용하는 프로그래밍 인터페이스다. 이 인터페이스는 하나 또는 그 이상의 시스템 콜을 사용해 구현되며, 경우에 따라 시스템 콜을...

[리눅스 커널] 커널 자료구조

reference : 리눅스 커널 심층 분석, 로버트 러브 지음, 황정동 옮김 6장 커널 자료구조 1. 연결 리스트 연결 리스트는 노드라고 부르는 가변적인 개수의 데이터를 저장하고 관리하는 기능을 제공한다. 정적 배열과 달리 연결 리스트는 동적으로 데이터를 새엇ㅇ해 리스트에 추가할 수 있다. 그러므로 컴파일 시점에 미리 개수를 알 수 없는 데이터를 관리할 수 있다. 데이터가 한꺼번에 동시에 만들어지지 않으므로, 이 데이터는 인접한 메모리 공간에 모여 있지 않을 수 있다.따라서 데이터를 서로 연결시키는 방법이 있어야 하므로 리스트의 각 데이터에는 다음 데이터의 위치를 가리키는 next 포인터가 들어 있다. 리스트에 데이터를 추가하거나 삭제할 때는 다음 노드를 가리키는 포인터를 조정하면 된다. 단일 연결리스트와 이중 연결 리스트 연결 리스트를 나타내는 가장 단순한 자료구조의 형태는 다음과 같다. /* 연결 리스트의 데이터 항목 */ struct list_element {     void *data;                     /* 항목에 담긴 데이터(payload) */     struct list_element *next; /* 다음 항목을 가리키는 포인터 */ }; 이중 연결 리스트를 나타내는 자료구조의 형태는 다음과 같다. /* 연결 리스트의 데이터 항목 */ struct list_element {     void *data;                     /* 항목에 담긴 데이터(payload) */     struct list_element *next; /* 다음 항목을 가리키는 포인터 */     struct list_eleme...

[리눅스 시스템 프로그래밍] 6 세션과 프로세스 그룹

세션 시스템 호출 셸은 로그인 시점에 새로운 세션을 생성한다. 이러한 작업은 새로운 세션을 쉽게 생성하는 특수 시스템 호출을 사용해서 수행한다. #include <unistd.h> pid_t setsid (void); setsid()는 새로운 세션 내부에 새로운 프로세스 그룹을 생성하며, 호출한 프로세스를 세션과 프로세스 그룹 모두의 리더로 만든다.(새로운 세션에서 제어하는 tty가 없는 유일한 구성원이 된다.) 이는 데몬이나 셸에 유용한 특성이다. 데몬은 세션 구성원과 터미널 제어를 원하지 않으며, 셸은 사용자가 로그인할 때마다 새로운 세션 생성을 원하기 때문이다. 여기서 tty는 유닉스 전문 용어로  tty 는 단순히 읽기와 쓰기를 넘어 몇 가지 추가적인 명령어를 지원하는 디바이스 파일을 뜻합니다. 그리고  터미널 은 사실상 이 tty와 동일한 의미로 사용됩니다. 일부 tty는 하드웨어 디바이스를 위해 커널이 제공하며 그 예로 키보드에서 들어오는 입력과 텍스트 모드 화면으로 나가는 출력, 시리얼 라인을 통해 전송되는 입출력이 있습니다. 그 외의 tty는 씬 커널 레이어를 통해 터미널 에뮬레이터라고 불리는 프로그램으로 제공되며 이런 tty를 pseudo-tty 로 부르기도 합니다. 터미널 에뮬레이터로는 Xterm(X 윈도우 시스템), Screen(프로그램과 다른 터미널 사이에 독립적인 계층을 제공), SSH(한 머신에서 프로그램으로 다른 머신의 터미널에 연결), Expect(스크립팅 터미널 인터랙션용) 등이 있습니다. http://www.myservlab.com/144 성공하면 setsid()는 새롭게 생성된 세션의 세션 ID를 반환한다. 실패하면 호출은 -1을 반환하며 유일하게 가능한 errno 코드는 EPERM이다.(프로세스가 현재 프로세스 그룹 리더라는 사실을 알려준다.) 특정 프로세스가 프로세스 그룹 리더가 되지 않도록 만드는 확실한 방법은 fork이며,  부모 프로세스가 종료된 다음에 자식 프로...

[Security] SSH

Secure Shell Secure Shell  ( SSH ) is a cryptographic  network protocol  for secure  data communication , remote  command-line   login , remote command execution, and other secure  network services  between two networked computers. It connects, via a  secure channel  over an insecure network, a server and a client running  SSH server  and  SSH client  programs, respectively. [1]  The protocol specification distinguishes between two major versions that are referred to as SSH-1 and SSH-2. The best-known application of the protocol is for access to  shell accounts  on  Unix-like  operating systems, but it can also be used in a similar fashion for accounts on  Windows . It was designed as a replacement for  Telnet  and other  insecure  remote  shell  protocols such as the Berkeley  rsh  and  rexec  protocols, which send information, nota...

[Python] 공부 20140505

파이썬은 바이트코드를 생성한다. garbage collection 기능 regular expression 지원 대소문자를 구분한다. divmod(9, 5) (1, 4) 경로 확인방법 $which python vim O : 행 위에 삽입 .py파일의 앞에 #!/usr/bin/python or #!/usr/bin/env python -> 이식성을 위해 파이썬 인터프리터 안(혹은 다른 모듈)에서 모듈 파일을 수행하기 위한 방법은 두 가지가 있다. 1) execfile 이용 >>>execfile('modfile.py') 2) import로 수행 -> 이쪽이 바람직한 듯 >>>import modfile >>>modfile.s      # 모듈 안에 정의된 s를 이용할 수 있다. 연속라인 줄바꾸기 앞의 '\'는 다음 라인을 현재 라인과 연결시켜 주는 역할을 한다. 치환문(assignment), 대입문 >>>a = 1 변수의 형은 우측의 객체에 의해서 결정된다. 한 번에 치환 >>>c, d = 3, 4 >>>x=y=z=0 >>>e=0.3; f=3.4 >>>e, f = f, e        # 값의 교환 이름과 객체 파이썬은 다른 많은 언어와는 달리 변수의 이름과 값 객체가 분리되어 있다. 예를 들어, a = 1이란 문에서 숫자 1이 변수 a에 저장되는 것이 아니다. 파이썬에서는 a를 이름, 숫자 1을 객체라고 하며, 두 개념은 분리되어 있다. 파이썬과 같은 동적인 자료형을 가지는 언어에서는 변수의 생성과 소멸이 언제든지 일어날 수 있기 때문에 이름이 주소로 변환되지 않고 별도의 장소에 이름이 보관되며, 이름과 객체와읭 관계 정보를 추가로 가지고 있다.(소스코드를 기계어 수준으로 번역해서 실행...

[Ubuntu, putty] vim color

putty에서 우분투에 접속할 때 일부 색상이 검은 바탕에 파란 글씨로 나오길래 설정을 바꿨다. vim /home/[user_name]/.vimrc 에서 color desert 를 추가하였다. 다음은 현재 사용중인 shell을 확인하는 명령어 echo $SHELL

[Ubuntu] 하드디스크 새로 추가, 제거, 포맷

이미지
gparted를 받아서 설치하면 됩니다. gparted는 GParted  is a  GTK+  front-end to  GNU Parted  and the official  GNOME  Partition Editor application besides  Disks . It is used for creating, deleting, resizing, moving, checking and copying  partitions , and the  file systems  on them. This is useful for creating space for new operating systems (works with Windows Vista / 7 System & Data partitions), reorganizing disk usage, copying data residing on hard disks and mirroring one partition with another (disk imaging). #  http://en.wikipedia.org/wiki/GParted 이라고 합니다. 즉 GUI로 구현한 디스크 파티션 프로그램입니다. $ sudo apt-get install gparted you must specify the filesystem type had trouble writing out superblocks. 등의 문제를 모두 해결해줍니다. 저는 sdb1을 추가해주려고 했습니다. 1. 오른쪽 상단에서 sdb를 선택 2. 장치(Device) -> 새 파티션 테이블 만들기 3. 아래에서 /dev/sdb 우클릭, 다음으로 포맷 -> ext4 4. 위 메뉴에서 초록색? v(체크표시) 클릭 -> 진행 됩니다. 그리고 $ sudo mkdir /data # 여기서 data는 마운트할 ...

[리눅스 시스템 프로그래밍] wait() 시스템 콜

이미지
자식 프로세스가 종료될 때 완전히 사라진다면, 부모 프로세스가 참고할 수 있는 정보들이 남지 않는다. 따라서 유닉스의 초기 설계자들은 자식 프로세스가 부모에 앞서 죽으면, 커널이 자식 프로세스를 특수한 프로세스 상태로 들어가게 만들어야 한다고 결정했다. 이런 상태에 있는 프로세스를 좀비라고 한다. 유용할지도 모르는 자료를 포함하는 몇 가지 기본적인 커널자료 구조처럼 프로세스를 지탱하는 최소 뼈대만 보존한다. 부모가 자신의 상태를 조사하도록 이런 특수한 프로세스 상태에 있는 자식 프로세스는 부모 프로세스를 기다린다(이런 자식 프로세스를 좀비 프로세스라고 부른다). 부모가 종료된 자식에 대해 보존된 정보를 획득한 다음에야 공식적으로 자식 프로세스가 종료되고 좀비에서 벗어나게 된다. 위의 프로세스 상태 전이 표에서 우측 상단에서 EXIT_ZOMBIE를 볼 수 있다. 리눅스 커널은 종료된 자식에 대한 정보를 얻기 위한 몇 가지 인터페이스를 제공한다. POSIX에 정의된 가장 단순한 인터페이스로  wait()가 있다. #include <sys/types.h> #include <sys/wait.h> pid_t wait (int *status); wait()를 호출하면 종료된 자식의 pid를 반환하며, 오류가 발생하면 -1을 반환한다. 자식 프로세스가 종료되지 않았다면 호출은 자식이 종료될 때까지 차단된다. 자식 프로세스가 이미 종료되었으면 호출은 즉시 반환된다. 따라서 SIGCHLD 를 받고나서 자식 프로세스가 사망했다는 소식을 접한 다음에 wait()를 호출할 경우 차단(blocking) 없이 즉시 반환된다. * SIGCHLD - 프로세스가 종료될 때 커널은 SIGCHLD 시그널을 부모에게 보낸다. 오류가 발생하면 다음 두 가지 errno 값 중 하나로 설정된다. ECHILD 호출한 프로세스에 자식 프로세스가 존재하지 않는다. EINTR 대기 중에 시그널을 받았으...

[리눅스 시스템 프로그래밍] 프로세스 종료 (Terminating a Process)

이미지
#include <stdlib.h> void exit (int status ); exit() 호출은 몇 가지 종료 단계를 수행한 다음에 커널에게 프로세스를 종료하라고 지시한다. status 매개 변수는 프로세스 종료 상태를 지정하기 위해 사용한다. 프로세스를 종료하기에 앞서, C 라이브러리는 다음 종료 단계를 순서대로 수행한다. 1. atexit() 나 on_exit()로 등록된 함수를 등록 순서의 역순으로 호출한다. 2. 모든 표준 입출력 스트림을 강제로 비운다. 3. tmpfile() 함수로 만든 임시 파일을 삭제한다. 이런 단계를 거쳐 사용자 영역에서 프로세스가 수행해야 하는 모든 작업을 마쳤다면, exit()는 시스템 콜인 _exit()를 불러 커널이 프로세스 종료 과정에 필요한 나머지 작업을 수행하게 한다. #include <unistd.h> void_exit (int status); 어플리케이션에서 _exit()를 직접 호출할 수 있지만, 이런 방식은 거의 의미가 없다. 대다수 어플리케이션은 stdout 스트림을 강제로 쓰는 작업(flushing)과 같이(위의 작업 2.) exit가 제공하는 정리 기능 몇 가지를 요구하기 때문이다. 프로그램을 끝내는 전통적인(classic) 방법은 명시적인 시스템 콜이 아니라 단순히 프로그램 '끝까지 진행하는' 방법이다.  C 프로그램에서는 main() 함수가 반환될 때 이런 일이 일어난다. 하지만 '끝까지 진행하는' 방법에서도 여전히 시스템 콜을 부른다. 컴파일러는 독자적인 종료 코드 다음에 암묵적으로 _exit()를 넣어버린다. exit()나 main() 반환값을 사용해서 종료 상태를 명시적으로 반환하도록 프로그램을 작성하는 관례는 바람직하다. 셸은 종료값을 확인해서 명령이 성공했는지 실패했는지를 파악한다. eixt(0)이거나 main() 반환값이 0이면 성공을 나타낸다. 또한 기본 ...

그라데이션

이미지
잠이 안와서 결국 일곱시까지 깨있네요... 그래도 오랜만에 이런 멋진 장면도 보네요.

[리눅스 시스템 프로그래밍] fork() ,exec 시스템 콜의 의미(Meaning of fork() and exec system call)

리눅스 커널 공부를 1년 전 쯤에 했다.  fork(), exec 함수군에 대해서 읽어 봤지만 이건 당최 무슨 소리인지 알 수가 없었다. 요즘「리눅스 시스템 프로그래밍(로버트러브 저)」을 읽으니까 이 함수들이 어떤 역할을 하는지 대충 알 것 같다. 시스템 프로그래밍(여기서 의미하는 것은 시스템 콜)을 먼저 공부하고 커널 공부를 했더라면... 하는 생각이 든다. 커널을 공부하기 위해서는 시스템 콜을 어느정도 알고있어야 된다고 생각한다. 1. fork() 시스템 콜은 현재 프로세스와 동일한 이미지로 동작하는 새로운 프로세스를 만든다. (A new process running the same image as the current one can be created via the fork() system call) 2. exec 함수군(execl(), execlp(), execle(), execv(), execvp(), execve())을 호출하면 path가 가리키는 프로그램을 메모리에 올리는 방법으로 현재 프로세스 이미지를 새로운 프로세스 이미지로 대체한다. (A call to execl() replaces the current process image with a new one by loading into memory the program pointed at by path) "쓰기 후 복사(COW:copy-on-write)는 fork의 경우 더욱 큰 장점을 제공한다. fork 다음에 exec가 뒤따를 확률이 아주 높으므로 부모 주소 공간을 자식 주소 공간으로 복사하는 행위는 종종 완전한 시간 낭비다. 자식이 즉시 새로운 바이너리 이미지를 실행한다면 이전 주소 공간은 완전히 제거된다. COW는 이런 경우를 위해 최적화를 수행한다." (Copy-on-write has yet a bigger benefit in the case of forking. Because a large percentage of forks are fo...