01.18 프로그래밍 언어와 Java의 시작 정리
2023. 1. 18. 20:52ㆍ개발일지
언어의 역사
- 사람은 1 + 3 이라고 하면 바로 이해하고 계산할 수 있지만 컴퓨터는 0과 1로 표현합니다.
- 컴퓨터와 대화를 하기 위해 우리가 눈높이를 낮췄다고 했지만 기계어는 사람의 입장에서는 복잡하고 어렵기 때문에 이를 해결하기 위해 기계 명령어와 일상 용어를 일대일로 매칭하는 기계어와 니모닉의 매칭 코드표를 만들었습니다.
어셈블리어
- 기계 명령어와 일상 용어를 일대일로 매칭하는 기계거와 니모닉의 매칭 코드표 즉 '어셈블리'라고 합니다.
- CPU 마다 실행할 수 있는 기계어가 달랐기 때문에 어셈블리어도 다르게 만들어졌습니다.
- 즉 어셈블리어를 기계어로 번역해 주는 소프트웨어는 '어셈블러'라고 부릅니다.
- 하지만 애드삭 어셈블리어 개발자가 유니박 어셈블리어 프로그래머로 이직을 하려면 유니박용 어셈블리어를 다시 배워야 했습니다. 이를 해결하기 위해 많은 언어들이 등장했지만 대표적으로 알고있는 C언어가 등장합니다.
C언어
- C언어의 등장으로 어셈블리어처럼 기계의 종류만큼 소스파일을 만들어야 했다면 이제는 소스파일을 하나만 만들어도 되는 시대가 됐습니다.
- C언어는 하나의 소스파일을 각 기계어에 맞는 컴파일러로 컴파일 시키며 기계어 목적파일을 만들기 때문에 개발자는 소스파일이 동작하는 기계에 상관없이 개발이 가능해지며, 즉 C언어는 하나의 소스만 작성하면 모든 기종의 컴퓨터에서 실행이 가능합니다.
- 어셈블리어로 개발할때 보다는 매우 편해지긴 했으나 아직도 개선할 점이 있었습니다.
Java의 등장
- Java는 '객체지향 언어'입니다.
- C에 객체지향 개념을 도입한 C++이라는 언어도 존재하지만 Java는 객체지향 언어의 중심에는 클래스(Class)가 있습니다.
- C++은 클래스 없이 개발이 가능하기에 '객체지향지원 언어'라고 부르는 반면에 Java는 클래스 없이는 개발이 불가능합니다. (Java의 개발은 Class시작해서 Class로 끝나게됍니다.)
- main() 메서드로 비교하면 C++은 클래스와는 별개로 존재할 수 있지만 Java는 무조건 클래스 내부에 존재해야 합니다.
- Java의 장점은 단 하나의 소스 파일로 모든 기종의 컴퓨터에서 실행이 가능합니다.
니모닉
- 비유법, 다른 유사한 것에 빗대어 잘 모르는 것을 설명하고자 하는 방법
컴파일
- 컴퓨터의 언어는 0과 1만 있습니다. 우리가 인간의 언어를 컴퓨터에 입력하더라도 이진코드(0과1)로 해석해야 합니다.
- 즉, 쉽게 설명하자면 사람이 이해하는 언어를 컴퓨터가 이해할 수 있도록 언어를 바꿔주는 과정을 컴파일이라고 합니다.
- 또한 주어진 언어로 작성된 컴퓨터 프로그램을 다른 언어의 동등한 프로그램으로 변환하며, 우리가 작성한 원시코드를, 컴퓨터가 이해할 수 있는 목적코드로 번역하는 과정 이 모든 컴파일의 기능을 컴파일러라고 부릅니다.
JDK, JRE, JVM 용어 정리
- JDK : Java Development Kit (자바 개발 도구)
- JRE : Java Runtime Environment (자바 실행 환경)
- JVM : Java Virtual Machine (자바 가상 기계)
Java의 호환성
- Java와 C언어의 차이는하나의 목적파일로 어디든 실행이 가능하냐, 다수의 목적 파일을 만들어서 각 기계에 맞게 사용하냐의 차이입니다.
- 즉, Java를 사용하여 기계의 기종별 운영체제에 구애받지 않고 개발을 할 수 있게 되었습니다.
- 여기서 Java의 목적파일은 반기계어인 바이트코드(.class)인데 이는 운영체제가 아니라 JVM에서 사용됍니다.
- 소스코드를 바이트 코드로 컴파일 해주는게 자바 컴파일러(javac)입니다.
Java의 실행 과정
- 개발자는 자바 소스파일(.java)를 작성
- JDK가 제공하는 javac를 사용하여 소스파일을 컴파일
- JVM의 Class Loader는 컴파일로 생성된 바이트 코드(.class)를 전달 받아 동적 로딩을 통해 실행에 필요한 클래스들을 로딩하여 JVM 내부 Runtime Data Area에 로드
- JVM의 Execution에 의해 기계어로 해석되어 실행
Class Loader
- 작성한 모든 클래스, 변수 및 메서드의 정보를 Method Area에 배치하며, JVM 내부에 바이트 코드를 로드하고 링크를 통해 배치하는 작업을 수행하는 모듈
- 실행될 때 동적으로 클래스를 로드하고 jar 파일 내부에 저장되어 있는 클래스들을 JVM에 로드하며, static(정적) 변수와 메서드는 Heap Area에 배치
Execution(실행 엔진)
- Interpreter는 바이트 코드를 한줄 씩 읽고 번역해 주는데 느리다는 단점이 있어서 보완하기 위해 나온 것이 JIT 컴파일러 입니다.
- JIT 컴파일러는 Interpreter 방식으로 실행을 하다가 적당한 시점에 바이트 코드 전체를 컴파일하여 캐싱합니다.
- 즉, 컴파일된 코드를 저장해 두기 때문에 이 코드들은 Intertpreter를 통해 실행되는 것이 아니라 바로 실행해야 하며, 그렇기 때문에 실행 속도가 매우 빠릅니다.
- Garbage Collector은 사용되지 않는 메모리를 추적하여 비워주는 기능을 가지고 있습니다.
Compile 언어
- 정의 : 소스파일 전체를 컴파일 한 후 기계어를 CPU와 메모리를 통해 읽어서 바로 실행하는 방식
- 종류 : C,C++,Java,C# ...
- 특징 : 소스파일의 크기가 크면 컴파일 과정이 오래 걸리며, 컴파일이 된 후에 기계어로 바로 실행되기에 속도가 빠릅니다. Java는 javac에 의해 바이트코드로 컴파일 되지만 JVM에서는 인터프리터로 실행되며, Compile 언어이지만, Interpreter 언어의 특징을 동시에 가집니다.
Interpreter 언어
- 소스파일을 컴파일하지 않고 Interpreter를 사용하여 소스파일을 한줄 씩 번역하면서 실행하는 방식
- 종류 : Javascript, Ruby,Python ...
- 특징 : 별도의 목적파일이 존재하지 않고 컴파일 과정 없이 바로 실행되기 때문에 수정 및 디버깅 시 편합니다. Interpreter만 존재하면 어디서든 실행이 가능하기 때문에 자유롭고 독립적이지만 실시간으로 번역 되면서 실행하기 때문에 속도가 느립니다.
JVM
- JVM은 Java 프로그램이 실행되는 가상 컴퓨터라고 생각하면 됍니다.
전처리 과정
- 정의 : JRE는 프로그램을 실행하기 전에 먼저 프로그램에 메인 메소드를 포함하고 있는지 확인 후 존재하면 JVM을 부팅시킵니다. 부팅이된 JVM은 전달받은 코드를 실행 시키는데 이때 가장 먼저 하는 일이 전처리라고 하는 과정입니다.
- 모든 Java 프로그램은 반드시 java.lang 패키지를 포함, JRE는 해당 패키지를 Method Area에 배치합니다.
- 프로그램이 사용하기 위해 import한 패키지가 존재할 겁니다. 마찬가지로 Method Area에 배치합니다.
- 작성한 모든 클래스, 변수 및 메서드의 정보를 Method Area에 배치합니다.
- static(정적) 변수와 메소드는 Heap Area에 배치합니다.
Runtime Data Areas를 간단하게 정리해보겠습니다. (Java 8 이후 기준)
- 컴퓨터에서 메모리 같은 역할을 수행하는 영역이며, 자바 프로그램을 실행하여 발생하는 데이터를 저장하는 역할을 하는데, 데이터의 속성에 따라 영역이 분리되어 있습니다.
PC Register
- 스래드가 시작 될때 생성되는 공간으로, 스레드마다 하나씩 존재
- 스래드가 어떤 명령에 의해 실행되어야 할지에 대한 기록을 하는 부분으로 현재 수행을 하고 있는 JVM의 명령 주소를 갖고 있습니다.
Native Method Stack
- 자바 프로그램이 컴파일 되어 생성되는 바이트 코드가 아닌 실제 실행 할 수 있는 기계어로 작성된 프로그램을 실행시키는 영역
- Java Native Interface를 통해 바이트 코드로 전환하여 저장됩니다. 또한 일반 프로그램처럼 커널이 스택을 잡아 독자적으로 프로그램을 실행시키는 영역입니다.
Method Area(Metaspace, Static Area, Class Area)
- 클래스 정보를 처음 메모리 공간에 올릴 때 초기화 되는 대상을 저장하기 위한 공간입니다.
- 클래스의 타입, 변수 및 메소드등의 정보를 가지면서 모든 Thread가 공유합니다.
- Runtime Constant Pool : 상수 자료형을 저장하여 참조하고 중복을 막는 역할을 수행
Heap Area
- 객체(인스턴스)가 생성되는 영역이며, 프로그램을 실행하는 중 생성되는 객체들은 모두 이곳에 생성됩니다.
- Permanent Generation
- 생성된 객체들의 정보의 주소값이 저장된 공간
- 클래스 로더에 의해 로드되는 Class, Method 등에 대한 Meta 정보가 저장되는 영역이며 JVM에 의해 사용
- Reflection을 사용하여 동적으로 클래스가 로딩되는 경우에 사용
- New/Young Generation
- Eben : 객체들이 최초로 생성되는 공간
- Survuvor 0,1 : Eben에서 참조되는 객체들이 저장되는 공간
- 생명 주기가 짧은 객체를 Garbage Collector의 대상으로 하는 영역
- Tenured Generation
- Old : 이곳의 객체들은 Garbage Collector에 의해 삭제
- New/Young Generation에서 일정시간 참조되고 있고 살아남은 객체들이 저장되는 공간
- 생명 주기가 긴 객체를 Garbage Collector의 대상으로 하는 영역
Stack Area
- 프로그램 실행 과정에서 임시로 할당이 되었다가 메서드를 빠져나가면 바로 소멸이 되는 특성의 데이터들을 저장하기 위한 공간
- 실행되는 메서드 및 중괄호 블록(if문등)에 대한 데이터가 저장되는 영역
- 가장 처음 실행되는 메서드(main())가 첫 번째로 메모리에 올라가고 그 다음에 실행되는 메서드들이 위에 쌓이는 구조
- 쌓이는 메서드의 단위를 '스택 프레임'이라고 명칭
(해당 메서드를 실행하기 위한 변수 및 블록이 존재하면 스택 프레임 내부에 스택 프레임이 생길 수 있습니다.) - 가장 큰 특징은 멀티 스레드 환경에서 각 스레드가 고유의 스택 영역을 가진다는 점
프로세스(process) : 실행 중인 프로그램
- 사용자가 작성한 프로그램이 운영체제에 의해 메모리 공간을 할당받아 실행 중인 것을 의미하며, 프로세스는 프로그램에서 사용되는 메모리등의 자원과 스레드로 구성
스레드(thread) : 프로세스 내부에서 실제로 작업을 수행하고 있는 주제
- 2개 이상의 스레드를 가지고 있는 프로세스는 멀티 프로세스(multi-threaded process)라고 명칭
Reflection : 객체를 통해 클래스의 정보를 분석해 내는 프로그래밍 기법
- 구체적인 클래스 타입을 알지 못해도, 컴파일된 바이트 코드를 통해 역으로 클래스의 정보를 알아내어 사용할 수 있습니다.
'개발일지' 카테고리의 다른 글
01.18 연산자 (0) | 2023.01.18 |
---|---|
01.18 변수 (0) | 2023.01.18 |
01.18(정리자료) (0) | 2023.01.18 |
01.14 (0) | 2023.01.18 |
01.18 알고리즘 (0) | 2023.01.18 |