빈티지 테라피

[파이선초보탈출] Python - Unicode System 본문

카테고리 없음

[파이선초보탈출] Python - Unicode System

밍키스튜디오 2023. 11. 16. 07:00
반응형

Python에서 문자열을 다루는 방법 중 하나인 유니코드 시스템에 대해 알아보겠습니다.

목차

  1. 유니코드 시스템 소개
  2. Python에서의 유니코드 사용
  3. 유니코드와 인코딩
  4. 코드 예제


1. 유니코드 시스템 소개

유니코드(Unicode)는 전 세계의 모든 문자를 컴퓨터에서 일관되게 표현하고 다루기 위한 산업 표준입니다. 유니코드는 문자마다 고유의 번호를 할당하는 방식으로 동작하며, 이러한 방식은 문자의 시각적 표현을 분리하여 다양한 언어와 플랫폼에서 일관된 문자 처리를 가능하게 합니다.


2. Python에서의 유니코드 사용

Python 3부터는 모든 문자열이 유니코드로 처리됩니다. 이는 다양한 언어의 문자열을 모두 처리할 수 있음을 의미합니다. 유니코드 문자열은 u 접두사 없이 작은따옴표('') 또는 큰따옴표("")로 생성할 수 있습니다.

s = '안녕하세요'
print(s)  # 출력: 안녕하세요

3. 유니코드와 인코딩

유니코드 문자열을 바이트로 변환하거나 바이트를 유니코드 문자열로 변환하기 위해서는 인코딩과 디코딩이 필요합니다. Python에서는 encodedecode 메소드를 사용하여 이를 수행할 수 있습니다.

s = '안녕하세요'
encoded_s = s.encode('utf-8')  # 인코딩
print(encoded_s)  # 출력: b'\xec\x95\x88\xeb\x85\x95\xed\x95\x98\xec\x84\xb8\xec\x9a\x94'

decoded_s = encoded_s.decode('utf-8')  # 디코딩
print(decoded_s)  # 출력: 안녕하세요

반응형

4. 코드 예제

다음은 Python에서 유니코드 문자열을 다루는 몇 가지 예제입니다.

# 유니코드 문자열 생성
s = '안녕하세요'
print(s)  # 출력: 안녕하세요

# 유니코드 문자열 인코딩
encoded_s = s.encode('utf-8')
print(encoded_s)  # 출력: b'\xec\x95\x88\xeb\x85\x95\xed\x95\x98\xec\x84\xb8\xec\x9a\x94'

# 유니코드 문자열 디코딩
decoded_s = encoded_s.decode('utf-8')
print(decoded_s)  # 출력: 안녕하세요

반응형