자료구조

문자는 어떻게 저장되고 표현될까?

sleepycho 2024. 4. 9. 09:17

'SMILE'. 모두가 함께 웃을 수 있는 세상이 되었으면 좋겠다.

   컴퓨터 세상 속에서 문자 데이터를 표현하는 방법은 여러 방법이 있다. 고등학교 자료구조 책에서는 크게 3개로 분류하고 있다. 가장 먼저 알아보려고 하는 표현 방법은 유니코드이다. 

 

   유니코드는 전 세계의 모든 문자를 통일된 부호 체계로 다루도록 설계된 전산 처리 방식이다. 문자 하나당 2바이트를 사용하며 모든 글자를 표현할 수 있다는 장점이 있다. 

 

다음은 ASCII 코드이다. ASCII 코드는 C언어나 프로그래밍을 접한 사람이라면 많이들 들어보았을 것이다. 한 문자를 표현하는 데 사용되며, 대·소문자 구분이 가능하다. 미국의 표준 코드이다. 

 

마지막으로 한글 코드는 말 그대로 한글을 표현한다. 한글 코드에는 완성형과 조합형 코드가 있다. 완성형 코드는 가나다 순서로 완성된 하나의 음절에 코드를 부여하여 2바이트에 표현한다. 조합형 코드는 한글의 초성, 중성, 종성 각각에 5비트를 조합하여 표현한다.