01.18 프로그래밍 언어와 Java의 시작 정리

2023. 1. 18. 20:52개발일지

언어의 역사

  • 사람은 1 + 3 이라고 하면 바로 이해하고 계산할 수 있지만 컴퓨터는 0과 1로 표현합니다.
  • 컴퓨터와 대화를 하기 위해 우리가 눈높이를 낮췄다고 했지만 기계어는 사람의 입장에서는 복잡하고 어렵기 때문에 이를 해결하기 위해 기계 명령어와 일상 용어를 일대일로 매칭하는 기계어와 니모닉의 매칭 코드표를 만들었습니다.

어셈블리어

  • 기계 명령어와 일상 용어를 일대일로 매칭하는 기계거와 니모닉의 매칭 코드표 즉 '어셈블리'라고 합니다.
  • CPU 마다 실행할 수 있는 기계어가 달랐기 때문에 어셈블리어도 다르게 만들어졌습니다.
  • 즉 어셈블리어를 기계어로 번역해 주는 소프트웨어는 '어셈블러'라고 부릅니다.

어셈블리

  • 하지만 애드삭 어셈블리어 개발자가 유니박 어셈블리어 프로그래머로 이직을 하려면 유니박용 어셈블리어를 다시 배워야 했습니다. 이를 해결하기 위해 많은 언어들이 등장했지만 대표적으로 알고있는 C언어가 등장합니다.

C언어

  • C언어의 등장으로 어셈블리어처럼 기계의 종류만큼 소스파일을 만들어야 했다면 이제는 소스파일을 하나만 만들어도 되는 시대가 됐습니다.
  • C언어는 하나의 소스파일을 각 기계어에 맞는 컴파일러로 컴파일 시키며 기계어 목적파일을 만들기 때문에 개발자는 소스파일이 동작하는 기계에 상관없이 개발이 가능해지며, 즉 C언어는 하나의 소스만 작성하면 모든 기종의 컴퓨터에서 실행이 가능합니다.
  • 어셈블리어로 개발할때 보다는 매우 편해지긴 했으나 아직도 개선할 점이 있었습니다.

Java의 등장

  • Java는 '객체지향 언어'입니다.
  • C에 객체지향 개념을 도입한 C++이라는 언어도 존재하지만 Java는 객체지향 언어의 중심에는 클래스(Class)가 있습니다.
  • C++은 클래스 없이 개발이 가능하기에 '객체지향지원 언어'라고 부르는 반면에 Java는 클래스 없이는 개발이 불가능합니다. (Java의 개발은 Class시작해서 Class로 끝나게됍니다.)
  • main() 메서드로 비교하면 C++은 클래스와는 별개로 존재할 수 있지만 Java는 무조건 클래스 내부에 존재해야 합니다.
  • Java의 장점은 단 하나의 소스 파일로 모든 기종의 컴퓨터에서 실행이 가능합니다.

니모닉

  • 비유법, 다른 유사한 것에 빗대어 잘 모르는 것을 설명하고자 하는 방법

컴파일

  • 컴퓨터의 언어는 0과 1만 있습니다. 우리가 인간의 언어를 컴퓨터에 입력하더라도 이진코드(0과1)로 해석해야 합니다.
  • 즉, 쉽게 설명하자면 사람이 이해하는 언어를 컴퓨터가 이해할 수 있도록 언어를 바꿔주는 과정을 컴파일이라고 합니다.
  • 또한 주어진 언어로 작성된 컴퓨터 프로그램을 다른 언어의 동등한 프로그램으로 변환하며, 우리가 작성한 원시코드를, 컴퓨터가 이해할 수 있는 목적코드로 번역하는 과정 이 모든 컴파일의 기능을 컴파일러라고 부릅니다.

JDK, JRE, JVM 용어 정리

  • JDK : Java Development Kit (자바 개발 도구)
  • JRE : Java Runtime Environment (자바 실행 환경)
  • JVM : Java Virtual Machine (자바 가상 기계)

Java의 호환성

  • Java와 C언어의 차이는하나의 목적파일로 어디든 실행이 가능하냐, 다수의 목적 파일을 만들어서 각 기계에 맞게 사용하냐의 차이입니다.
  • 즉, Java를 사용하여 기계의 기종별 운영체제에 구애받지 않고 개발을 할 수 있게 되었습니다.
  • 여기서 Java의 목적파일은 반기계어인 바이트코드(.class)인데 이는 운영체제가 아니라 JVM에서 사용됍니다.
  • 소스코드를 바이트 코드로 컴파일 해주는게 자바 컴파일러(javac)입니다.

Java의 실행 과정

  1. 개발자는 자바 소스파일(.java)를 작성
  2. JDK가 제공하는 javac를 사용하여 소스파일을 컴파일
  3. JVM의 Class Loader는 컴파일로 생성된 바이트 코드(.class)를 전달 받아 동적 로딩을 통해 실행에 필요한 클래스들을 로딩하여 JVM 내부 Runtime Data Area에 로드
  4. JVM의 Execution에 의해 기계어로 해석되어 실행

Java 실행 과정

Class Loader

  • 작성한 모든 클래스, 변수 및 메서드의 정보를 Method Area에 배치하며, JVM 내부에 바이트 코드를 로드하고 링크를 통해 배치하는 작업을 수행하는 모듈
  • 실행될 때 동적으로 클래스를 로드하고 jar 파일 내부에 저장되어 있는 클래스들을 JVM에 로드하며, static(정적) 변수와 메서드는 Heap Area에 배치

Execution(실행 엔진)

  • Interpreter는 바이트 코드를 한줄 씩 읽고 번역해 주는데 느리다는 단점이 있어서 보완하기 위해 나온 것이 JIT 컴파일러 입니다.
  • JIT 컴파일러는 Interpreter 방식으로 실행을 하다가 적당한 시점에 바이트 코드 전체를 컴파일하여 캐싱합니다.
  • 즉, 컴파일된 코드를 저장해 두기 때문에 이 코드들은 Intertpreter를 통해 실행되는 것이 아니라 바로 실행해야 하며, 그렇기 때문에 실행 속도가 매우 빠릅니다.
  • Garbage Collector은 사용되지 않는 메모리를 추적하여 비워주는 기능을 가지고 있습니다.

Compile 언어

  • 정의 : 소스파일 전체를 컴파일 한 후 기계어를 CPU와 메모리를 통해 읽어서 바로 실행하는 방식
  • 종류 : C,C++,Java,C# ...
  • 특징 : 소스파일의 크기가 크면 컴파일 과정이 오래 걸리며, 컴파일이 된 후에 기계어로 바로 실행되기에 속도가 빠릅니다. Java는 javac에 의해 바이트코드로 컴파일 되지만 JVM에서는 인터프리터로 실행되며, Compile 언어이지만, Interpreter 언어의 특징을 동시에 가집니다.

Interpreter 언어

  • 소스파일을 컴파일하지 않고 Interpreter를 사용하여 소스파일을 한줄 씩 번역하면서 실행하는 방식
  • 종류 : Javascript, Ruby,Python ...
  • 특징 : 별도의 목적파일이 존재하지 않고 컴파일 과정 없이 바로 실행되기 때문에 수정 및 디버깅 시 편합니다. Interpreter만 존재하면 어디서든 실행이 가능하기 때문에 자유롭고 독립적이지만 실시간으로 번역 되면서 실행하기 때문에 속도가 느립니다.

인터프리터, 컴파일 정리

JVM

  • JVM은 Java 프로그램이 실행되는 가상 컴퓨터라고 생각하면 됍니다.

전처리 과정

  • 정의 : JRE는 프로그램을 실행하기 전에 먼저 프로그램에 메인 메소드를 포함하고 있는지 확인 후 존재하면 JVM을 부팅시킵니다. 부팅이된 JVM은 전달받은 코드를 실행 시키는데 이때 가장 먼저 하는 일이 전처리라고 하는 과정입니다.
  • 모든 Java 프로그램은 반드시 java.lang 패키지를 포함, JRE는 해당 패키지를 Method Area에 배치합니다.
  • 프로그램이 사용하기 위해 import한 패키지가 존재할 겁니다. 마찬가지로 Method Area에 배치합니다.
  • 작성한 모든 클래스, 변수 및 메서드의 정보를 Method Area에 배치합니다.
  • static(정적) 변수와 메소드는 Heap Area에 배치합니다.

Runtime Data Areas를 간단하게 정리해보겠습니다. (Java 8 이후 기준)

  • 컴퓨터에서 메모리 같은 역할을 수행하는 영역이며, 자바 프로그램을 실행하여 발생하는 데이터를 저장하는 역할을 하는데, 데이터의 속성에 따라 영역이 분리되어 있습니다.

Runtime Data Areas

PC Register

  • 스래드가 시작 될때 생성되는 공간으로, 스레드마다 하나씩 존재
  • 스래드가 어떤 명령에 의해 실행되어야 할지에 대한 기록을 하는 부분으로 현재 수행을 하고 있는 JVM의 명령 주소를 갖고 있습니다.

Native Method Stack

  • 자바 프로그램이 컴파일 되어 생성되는 바이트 코드가 아닌 실제 실행 할 수 있는 기계어로 작성된 프로그램을 실행시키는 영역
  • Java Native Interface를 통해 바이트 코드로 전환하여 저장됩니다. 또한 일반 프로그램처럼 커널이 스택을 잡아 독자적으로 프로그램을 실행시키는 영역입니다.

Method Area(Metaspace, Static Area, Class Area)

  • 클래스 정보를 처음 메모리 공간에 올릴 때 초기화 되는 대상을 저장하기 위한 공간입니다.
  • 클래스의 타입, 변수 및 메소드등의 정보를 가지면서 모든 Thread가 공유합니다.
  • Runtime Constant Pool : 상수 자료형을 저장하여 참조하고 중복을 막는 역할을 수행

Heap Area

  • 객체(인스턴스)가 생성되는 영역이며, 프로그램을 실행하는 중 생성되는 객체들은 모두 이곳에 생성됩니다.
  • Permanent Generation
    • 생성된 객체들의 정보의 주소값이 저장된 공간
    • 클래스 로더에 의해 로드되는 Class, Method 등에 대한 Meta 정보가 저장되는 영역이며 JVM에 의해 사용
    • Reflection을 사용하여 동적으로 클래스가 로딩되는 경우에 사용
  • New/Young Generation
    • Eben : 객체들이 최초로 생성되는 공간
    • Survuvor 0,1 : Eben에서 참조되는 객체들이 저장되는 공간
    • 생명 주기가 짧은 객체를 Garbage Collector의 대상으로 하는 영역
  • Tenured Generation
    • Old : 이곳의 객체들은 Garbage Collector에 의해 삭제
    • New/Young Generation에서 일정시간 참조되고 있고 살아남은 객체들이 저장되는 공간
    • 생명 주기가 긴 객체를 Garbage Collector의 대상으로 하는 영역

Stack Area

  • 프로그램 실행 과정에서 임시로 할당이 되었다가 메서드를 빠져나가면 바로 소멸이 되는 특성의 데이터들을 저장하기 위한 공간
  • 실행되는 메서드 및 중괄호 블록(if문등)에 대한 데이터가 저장되는 영역
  • 가장 처음 실행되는 메서드(main())가 첫 번째로 메모리에 올라가고 그 다음에 실행되는 메서드들이 위에 쌓이는 구조
  • 쌓이는 메서드의 단위를 '스택 프레임'이라고 명칭 
    (해당 메서드를 실행하기 위한 변수 및 블록이 존재하면 스택 프레임 내부에 스택 프레임이 생길 수 있습니다.)
  • 가장 큰 특징은 멀티 스레드 환경에서 각 스레드가 고유의 스택 영역을 가진다는 점

프로세스(process) : 실행 중인 프로그램

  • 사용자가 작성한 프로그램이 운영체제에 의해 메모리 공간을 할당받아 실행 중인 것을 의미하며, 프로세스는 프로그램에서 사용되는 메모리등의 자원과 스레드로 구성

스레드(thread) : 프로세스 내부에서 실제로 작업을 수행하고 있는 주제

  • 2개 이상의 스레드를 가지고 있는 프로세스는 멀티 프로세스(multi-threaded process)라고 명칭

Reflection : 객체를 통해 클래스의 정보를 분석해 내는 프로그래밍 기법

  • 구체적인 클래스 타입을 알지 못해도, 컴파일된 바이트 코드를 통해 역으로 클래스의 정보를 알아내어 사용할 수 있습니다.

'개발일지' 카테고리의 다른 글

01.18 연산자  (0) 2023.01.18
01.18 변수  (0) 2023.01.18
01.18(정리자료)  (0) 2023.01.18
01.14  (0) 2023.01.18
01.18 알고리즘  (0) 2023.01.18