
컴퓨터 세상 속에서 문자 데이터를 표현하는 방법은 여러 방법이 있다. 고등학교 자료구조 책에서는 크게 3개로 분류하고 있다. 가장 먼저 알아보려고 하는 표현 방법은 유니코드이다.
유니코드는 전 세계의 모든 문자를 통일된 부호 체계로 다루도록 설계된 전산 처리 방식이다. 문자 하나당 2바이트를 사용하며 모든 글자를 표현할 수 있다는 장점이 있다.
다음은 ASCII 코드이다. ASCII 코드는 C언어나 프로그래밍을 접한 사람이라면 많이들 들어보았을 것이다. 한 문자를 표현하는 데 사용되며, 대·소문자 구분이 가능하다. 미국의 표준 코드이다.
마지막으로 한글 코드는 말 그대로 한글을 표현한다. 한글 코드에는 완성형과 조합형 코드가 있다. 완성형 코드는 가나다 순서로 완성된 하나의 음절에 코드를 부여하여 2바이트에 표현한다. 조합형 코드는 한글의 초성, 중성, 종성 각각에 5비트를 조합하여 표현한다.
'자료구조' 카테고리의 다른 글
| 빅 데이터의 유망 직종 (0) | 2024.04.09 |
|---|---|
| CRC 체크썸이란 무엇인가? (0) | 2024.04.09 |
| 부동 소수점 데이터 표현 방식 (0) | 2024.03.19 |
| 10진수 표현 방식 (0) | 2024.03.19 |
| 2의 보수를 사용하면 좋은 점 (0) | 2024.03.17 |