컴퓨터는 0과 1의 이진 데이터 개념으로 구성되므로 일상생활에서 사용되는 문자(텍스트) 즉 영문자, 숫자 문자, 특수 문자등은 0과 1의 문자열에 의해 표현되고 저장됩니다.
문자코드
아스키코드
아스키코드(ASCII, American Standard Code for Information Interchange)는 컴퓨터와 통신 장비 간의 텍스트 데이터를 표준화된 방식으로 교환하기 위해 제정된 문자 인코딩 표준입니다. 1963년에 미국표준협회(ASA, 현재 ANSI)에서 처음 제정되었습니다. 아스키코드는 7비트로 구성되어 있으며, 총 128개의 문자와 제어 코드가 포함됩니다.
아스키코드는 영문 알파벳을 사용하는 대표적인 문자 인코딩입니다. 문자 인코딩은 사용자가 입력한 문자나 기호들을 컴퓨터가 이용할수있는 신호로 만드는것을 의미합니다. 즉, 복잡한 신호를 0과 1의 디지털 신호 (2진수)로 변환하는것입니다. 아스키는 컴퓨터와 통신장비를 비롯한 문자를 사용하는 많은 장치에서 사용되며 대부분의 문자 인코딩이 아스키에 기초를 두고 있습니다.
아스키코드는 33개의 출력 불가능한 제어 문자들과 공백을 비롯한 95개의 출력 가능한 문자들로 128개로 이루어져 있습니다. 제어 문자들은 역사적인 이유로 남아있으며 대부분은 더 이상 사용되지 않습니다. 츨력 가능한 문자들은 52개의 영문 알파벳 대소문자와 10개의 숫자, 32개의 특수 문자, 그리고 하나의 공백문자로 이루어져 있습니다. 아스키 코드는 영문 키보드로 입력할 수 있는 모든 기호들이 할당되어 있는 부호 체계로 매우단순하고 간단하기 때문에 어느 시스템에서도 적용 가능하다는 장점이 있습니다.
BCD 코드(2진화 10진코드)
BCD(이진화 십진법, Binary-Coded Decimal)는 숫자 데이터를 2진수로 표현하는 방식 중 하나로, 각 자리의 10진수 숫자를 4비트의 이진수로 변환하여 나타냅니다. BCD 코드는 주로 디지털 시스템에서 숫자를 보다 직관적이고 쉽게 다룰 수 있게 하기 위해 사용됩니다.
이진화된 십진법
- BCD 코드는 이진수로 표현된 십진수를 나타냅니다.
- 10진수 7은 BCD 코드로 0111로 표현됩니다.
- BCD 코드는 각 자리수마다 8, 4, 2, 1 의 가중치를 가지고 있습니다.
- 이 가중치 때문에 BCD코드는 8421 코드라고도 불립니다.
EBCDIC 코드(확장 2진화 10진코드)
EBCDIC(Extended Binary Coded Decimal Interchange Code, 확장 이진 코딩 십진 교환 코드)는 주로 IBM의 대형 컴퓨터 시스템과 호환 장비에서 사용되는 8비트 문자 인코딩 체계입니다. 1960년대 초에 개발되어, ASCII 코드와는 다른 방식으로 문자와 제어 코드를 표현합니다.
확장 2진화 10진 코드
- EBCDIC 코드는 8개의 비트로 정보를 표현합니다.
- 따라서 2의 8승인 256가지의 서로 다른 문자와 숫자를 표현할 수 있습니다.
- 1개의 패리티 비트를 포함하여 전체 9비트로 이루어집니다.
- 8개의 데이터 비트는 4개의 존비트(Zone bit)와 4개의 숫자 비트(Digit Bit)로 구성됩니다.
유니코드(Unicode)
유니코드(Unicode)는 전 세계의 모든 문자 시스템을 컴퓨터에서 일관되게 표현하고 사용할 수 있도록 설계된 산업 표준입니다. 유니코드는 다양한 언어와 기호를 하나의 통합된 문자 집합 안에 포함시켜, 전 세계적으로 문자 데이터의 교환, 처리, 표시를 용이하게 합니다.
코드 포인트(code point)
- 유니코드는 특정 숫자 코드에 문자를 매핑하는 방식으로 구성됩니다.
- 각 유니코드 문자에는 고유한 16진수 숫자값이 할당되어 이를 코드 포인트라고 합니다.
- 코드 포인트는 U+ 접두어를 붙여 표현하며, 예를 들어 A 문자의 코드 포인트는 U+0041입니다.
