Computer science/Algorithm

문자의 표현

잔망루피 2021. 3. 2. 16:22

코드체계 : 숫자와 대응 되는 문자 형태로 저장하는 방법

 

ASCII코드(American Standard Code for Information Interchange) : 7비트 코드체계, 

미국에서 네트워크가 발전하기 전 각 지역별로 코드 체계를 정해 사용했었다.

네트워크가 발전 후 서로간의 정보를 오인없이 주고 받기위해 고안함.

 

확장 ASCII 코드 : 1Byte 

표준 문자 이외에 특수 문자, 특수 기호 등을 표현하기 위해 고안됨.

 

유니코드 : 다국어 처리를 위해 고안됨.

정보를 표현하기 위한 글자들의 집합을 문자 집합

문자집합(Character Set)은 UCS-2(Universal Character Set 2)UCS-4(Universal Character Set4)

 

바이트 순서에 대해서는 표준화하지 못해 해석이 달라지는 문제가 생김.

저장하는 바이트 순서가 Little Endian, Big Endian으로 다른 경우다.

작은 단위가 앞에 오는 Little Endian과 큰 단위가 앞에 오는 Big Endian

위의 문제를 해결하기 위해 UTF–8 (in Web), UTF–16(in Windows, Java), UTF-32(in unix)와 같은 유니코드 인코딩 포맷(UTF : Unicode Transformation Format)이 등장

 

 

 

 

참고 : SW expert academy SW 문제해결 Self Study Book 1 6차시

반응형

'Computer science > Algorithm' 카테고리의 다른 글

[C] Stack  (0) 2021.03.08
문자열 검색  (0) 2021.03.05
Selection Sort  (0) 2021.02.24
Binary Search  (0) 2021.02.22
Sequential Search  (0) 2021.02.22