원문보기    닫기

메뉴 보기, 닫기

정보기술 - 국제문자부호계(UCS) - 한글 - 제2부 정보교환용 한글 적합성 평가

Information Technology - Universal Multiple-Octet Coded Character Set(UCS) - Hangul - Part2 : Hangul conformance test for information interchange

    KS X 1026-2:2008

  • 조항
    1. 적용범위
    이 표준은 ISO/IEC 10646의 국제문자부호계(Universal Multiple-Octet Coded Character Set, 이하 UCS로 표기)를 이용하여 정보처리 및 데이터를 전송하는 시스템 사이에서 정보 교환에 사용되는 한글의 표현 형식 및 처리 방법을 정의한 KS X 1026-1에 대한 적합성 평가 방법에 대하여 규정한다.
  • 조항
    2. 인용표준
    다음의 인용표준은 이 표준의 적용을 위해 필수적이다. 발행연도가 표기된 인용표준은 인용된 판만을 적용한다. 발행연도가 표기되지 않은 인용표준은 최신판(모든 추록을 포함)을 적용한다.
    KS X 1001:2004, 정보 교환용 부호계(한글 및 한자)
    KS X 1026-1:2007, 정보기술-국제문자부호계(UCS)-한글-제1부:정보교환용 한글 처리지침
    KS X ISO/IEC 10646:2005, 정보기술-국제문자부호계(UCS)-구조 및 다국어 기본 평면, 보충 평면
    ISO/IEC 10646:2003, Information technology-Universal Multiple-Octet Coded Character Set(UCS)-Architecture and Basic Multilingual Plane, Supplementary Planes
    ISO/IEC 10646:2003, Amandement 5
    The Unicode Standard 5.0-The Unicode Standard 5.0
    Unicode Standard Annex 15(UAX #15)-Unicode Normalization
    Unicode Standard Annex 29(UAX #29)-Text Boundaries
  • 조항
    3. 용어와 정의
    이 표준에서 사용되는 주된 용어와 정의는 다음과 같다.
  • 조항
    3.1 정보교환 (information interchange)
    서로 다른 시스템 사이에서도 정보를 이용할 수 있도록 하나의 시스템에서 다른 시스템으로 정보를 전달하는 것.
  • 조항
    3.2 문자 (character)
    정보의 표현이나 제어 등에 쓰이는 유한집합의 요소로서, 도형문자와 제어문자로 분류된다.
  • 조항
    3.3 한글 낱자 (Hangul Jamo)
    한글 글자마디를 이루는 닿소리(자음), 홀소리(모음) 글자 또는 첫소리(초성), 가운뎃소리(중성), 끝소리(종성) 글자("ᄓ"이나 "ㅘ" 같은 겹글자도 하나의 낱자로 여긴다.)를 가리킨다. 이 표준에서는 한글 낱자와 한글 자모는 같은 의미로 사용된다.
  • 조항
    3.4 한글 글자마디 (Hangul syllable)
    첫소리와 가운뎃소리 글자, 또는 첫소리, 가운뎃소리, 끝소리 글자로 이루어진 한글의 단위. 한글 음절이라고도 지칭한다.
  • 조항
    3.5 현대한글 (modern Hangul)
    한글 맞춤법에서 정한 한글 낱자나 한글 글자마디를 지칭한다. UCS에 포함된 전체 현대한글의 글자마디는 11 172자이다.
  • 조항
    3.6 옛한글 (old Hangul)
    훈민정음 창제 이후 근대(주로 19세기 말 또는 20세기 초까지)까지 사용되어 왔던 한글 중에서 한글 맞춤법에서 사용하지 않는 한글 낱자나 한글 글자마디를 지칭한다.
  • 조항
    3.7 정규화 (normalization)
    UCS에서, 어떤 문자에 대해서는 여러 가지 이진 표현(binary representation)이 가능하기 때문에 검색, 정렬, 비교 및 기타 연산이 복잡해진다. 따라서 UCS에서는 문자의 동일한 이진 표현 중 어느 것을 전달해도 단일의 이진 표현을 반환하는 정규화라는 절차를 정의하였다.
  • 조항
    3.8 문자 집합 (character set)
    컴퓨터의 화면과 인쇄기로 출력할 수 있는 문자의 집합. 보통 영 숫자와 특수 기호로 되어 있는데, 모든 컴퓨터는 그 구성상 허용하는 문자 수가 정해져 있으며, 각각 상이한 문자의 집합과 부호 구성을 갖고 있다.
  • 조항
    3.9 화면 캡처 (screen capture)
    컴퓨터 화면의 일부분을 잘라내거나, 텍스트 문자열이나 그래픽 파일로 변환하는 등 편집이나 저장을 위해 화면에 나타난 일부 정보를 선택하는 것을 말한다.
  • 조항
    4. 적합성 평가 환경 요구사항 및 대상
  • 조항
    4.1 적합성 평가 환경 요구사항
  • 조항
    4.1.1 하드웨어(hardware) 환경
    a) 컴퓨터:소프트웨어를 올바로 설치하고 운영할 수 있는 컴퓨터
    b) 그 밖의 장치:소프트웨어를 제대로 실행하는 데 필요한 장치들
  • 조항
    4.1.2 소프트웨어(software) 환경
    a) 평가 대상 소프트웨어가 제대로 설치되어 있어야 한다.
    b) 평가 대상 소프트웨어가 올바로 실행되는 데 필요한 다른 소프트웨어들도 설치되어 있어야 한다.
  • 조항
    4.2 적합성 평가 대상
    UCS를 적용한 소프트웨어 및 하드웨어 제품 중, KS X 1026-1에 적합성 유무를 평가받고자 하는 제품을 적합성 평가 대상으로 한다.
    각 제품에 대해 해당 기능이 있을 경우만 적합성 평가를 하고, 해당 기능이 없으면 평가하지 않는다.
  • 조항
    5. 적합성 평가를 위한 기본 요구사항
    적합성 평가 대상 제품이 KS X 1026-1을 충족시키기 위해서는 다음 요건에 부합해야 한다.
  • 조항
    5.1 문자 집합의 완전성
    문자 집합의 범위는 KS X 1026-1(최신 표준 문서 적용)의 4., "한글 문자의 종류"에서 정의된 것으로 다음과 같다.
    a) 조합 한글 낱자
    b) 호환 한글 낱자
    c) 반각 한글 낱자
    d) 완성형 한글 글자마디
    e) 한글 포함 기호
    f) 방점
  • 조항
    5.2 동작의 정확성
    적합성 평가 대상 제품은 5.1에서 정의된 한글이 포함된 임의의 텍스트 데이터(text data)에 대해서 다음의 기능이 항상 요구대로 동작해야 한다.
    a) 텍스트를 읽어서 화면 표시(display) 및 인쇄하기(print)
    b) 텍스트를 읽어서 파일(file)로 저장하기
    c) 화면에서의 편집(자판 입력, 클립보드를 통한 입출력)
    d) 검색
  • 조항
    5.3 문자처리의 무결성
    적합성 평가 대상 제품은 5.1에서 정의된 한글이 포함된 데이터가 KS X 1026-1에 부합하도록 처리해야 하여, 원본 데이터의 훼손(loss)이 없어야 한다.
    a) KS X 1026-1의 5. 한글 표현 형식(5.1 한글 낱자의 표현, 5.2 현대 한글 글자마디의 표현, 5.3 옛한글 글자마디의 표현)
    b) KS X 1026-1의 6. 한글의 정규화(6.1 한글 코드의 정규화, 6.4 한글 글자마디의 정규화)
    c) KS X 1026-1의 7. 한글 글자마디 분리(7.2 현대 한글 글자마디, 한글 낱자 분리 규칙, 7.3 옛한글 글자마디 분리 규칙, 7.8 한글 표현 형식을 따르지 않는 글자마디의 처리)
  • 조항
    6. 적합성 평가 순서
  • 조항
    6.1 문자 집합의 완전성에 대한 평가
    평가용 데이터(test vectors)는 5.1에 정의된 한글이 포함된, 평가를 위한 파일들이다(평가용 견본 데이터는 부속서 A 참조). 문자 집합의 완전성에 대한 평가 순서는 다음과 같다.
    a) 평가를 위한 소프트웨어를 설치한다.
    b) 평가 대상 소프트웨어가 평가용 데이터를 읽고, 화면에 출력하거나 인쇄 동작을 시행한다.
    c) 화면 표시 및 인쇄 출력 결과는 평가를 위한 기초 데이터로 사용한다.
  • 조항
    6.2 동작의 정확성에 대한 평가
    동작의 정확성에 대한 평가 순서는 다음과 같다.
    a) 평가용 데이터를 읽어서 화면 표시/인쇄 출력한 내용을 저장한다(화면 캡처).
    b) 평가용 데이터를 읽어서 파일로 저장한다.
    c) 편집할 동안의 결과를 저장한다(파일 저장 또는 화면 캡처).
    d) 검색 결과를 저장한다(파일 저장 또는 화면 캡처).
  • 조항
    6.3 적합성 평가 결과 처리 기준
    평가 결과의 등급별 처리 기준은 다음과 같다. 기준을 만족하지 못하는 경우에는 평가를 통과하지 못한 것으로 본다.
    a) 1등급(Class 1):적합성 평가 대상 제품이 5.1에서 정의된 한글 문자 집합에 대하여 6.16.2의 평가를 모두 만족하는 경우로 옛한글 글자마디의 화면 출력이나 인쇄가 일반적으로 특별한 설정 없이 가능하여야만 한다.
    보기 옛한글 글꼴을 같이 설치하는 문서 편집 프로그램(워드프로세서) 등
    b) 2등급(Class 2):적합성 평가 대상 제품이 5.1에서 정의된 한글 문자 집합에 대하여 6.16.2의 평가를 모두 만족하는 경우. 다만, 옛한글 글자마디의 화면 출력이나 인쇄를 위하여 특별한 글꼴의 설치와 사용 글꼴의 대치 등의 도움을 받아야 하는 경우이다.
    보기 옛한글 글꼴을 내장하지 않는 응용프로그램, 운영체제 등
  • 조항
    7. 적합성 평가 신청 방법 및 평가 결과 처리 절차
    적합성 평가 기관은 한국인정기구(KOLAS, Korea Laboratory Accreditation Scheme)가 인정한 기관 또는 국제적으로 인정되었거나 기술표준원장이 평가능력을 갖추었다고 인정하는 국내 시험 평가기관이 대상이 된다. 국내시험 평가기관이 적합성 평가를 수행하는 경우, 이 표준에 맞는 적합성 평가 신청방법 및 평가결과에 대한 처리절차는 해당기관에서 별도로 정할 수 있다.
  • 부속서 A(규정)
  • 평가 방법 및 평가용 데이터의 예
  • 조항
    A.1 평가 방법의 예
  • 조항
    A.1.1 한글 낱자의 표현
    KS X 1026-1의 5.1에서 규정한 한글 낱자의 표현 방법에 대한 평가 방법의 예이다.
  • 조항
    A.1.1.1 첫소리 글자의 표현
    a) 다음의 부호값을 가진 문자를 파일 혹은 클립보드를 통하여 입력받는다.
    부호) U+1100 U+1160 U+1101 U+1160 U+1102 U+1160
    b) 다음과 같이 3개의 글자마디로 표시되어야 하며, 키보드를 통해 글자마디 단위로 캐럿(혹은 커서) 이동과 선택이 가능해야 한다.
    표시) ᄀ ᄁ ᄂ
  • 조항
    A.1.1.2 가운뎃소리 글자의 표현
    a) 다음의 부호값을 가진 문자를 파일 혹은 클립보드를 통하여 입력받는다.
    부호) U+115F U+1161 U+115F U+1162 U+115F U+1163
    b) 다음과 같이 3개의 글자마디로 표시되어야 하며, 키보드를 통해 글자마디 단위로 캐럿(혹은 커서) 이동과 선택이 가능해야 한다.
    표시) ᅡ ᅢ ᅣ
  • 조항
    A.1.1.3 끝소리 글자의 표현
    a) 다음의 부호값을 가진 문자를 파일 혹은 클립보드를 통하여 입력받는다.
    부호) U+115F U+1160 U+11A8 U+115F U+1160 U+11A9 U+115F U+1160 U+11AA
    b) 다음과 같이 3개의 글자마디로 표시되어야 하며, 키보드를 통해 글자마디 단위로 캐럿(혹은 커서) 이동과 선택이 가능해야 한다.
    표시) ᆨ ᆩ ᆪ
  • 조항
    A.1.2 현대한글 글자마디의 표현
    KS X 1026-1의 5.2에서 규정한 현대한글 글자마디의 표현 방법에 대한 평가 방법의 예이다. 다만, 전체 현대한글 글자마디를 모두 입력 받을 수 없을 경우, 입력 가능한 만큼만 받아서 검사한다.
    a) 다음의 부호값을 가진 문자를 파일 혹은 클립보드를 통하여 입력받는다.
    부호) U+AC00 U+AC01 U+AC02 …… U+D7A1 U+D7A2 U+D7A3
    b) 다음과 같이 11 172개의 글자마디로 표시되어야 하며, 키보드를 통해 글자마디 단위로 캐럿(혹은 커서) 이동과 선택이 가능해야 한다.
    표시) 가각각 …… 힡힢힣
    c) 현대한글 글자마디를 키보드 등을 통하여 입력 받은 경우 그 부호값을 클립보드를 통한 출력 등의 방법으로 역으로 검사한다.
  • 조항
    A.1.3 옛한글 글자마디의 표현
    KS X 1026-1의 5.3에서 규정한 옛한글 글자마디의 표현 방법에 대한 평가 방법의 예이다. 다만, 모든 옛한글 글자마디를 모두 입력받을 수 없으면, 입력 가능한 만큼만 받아서 검사한다.
    a) 다음의 부호값을 가진 문자를 파일 혹은 클립보드를 통하여 입력받는다.
    부호) U+1112 U+119E U+1112 U+119E U+11AB U+115F U+1161 U+11AE
    b) 다음과 같이 3개의 글자마디로 표시되어야 하며, 키보드를 통해 글자마디 단위로 캐럿(혹은 커서) 이동과 선택이 가능해야 한다.
    표시)
    c) 옛한글 글자마디를 키보드 등을 통하여 입력 받은 경우 그 부호값을 클립보드를 통한 출력 등의 방법으로 역으로 검사한다.
  • 조항
    A.1.4 금지 규정에 대한 평가
    KS X 1026-1의 5.3에서 규정한 옛한글 글자마디의 표현 방법에서 금지한 규정에 대한 평가 방법의 예이다.
  • 조항
    A.1.4.1 낱자 여러 개로 겹글자 표기 금지
    a) 다음의 부호값을 가진 문자를 파일 혹은 클립보드를 통하여 입력받는다.
    부호) U+1100 U+1100 U+119E U+1100 U+1103 U+1169 U+1103 U+1169 U+1163 U+1100 U+1103 U+1169 U+1163 U+11A8 U+11AB
    b) 다음과 같이 14개의 글자마디로 표시되어야 하며, 키보드를 통해 글자마디 단위로 캐럿(혹은 커서) 이동과 선택이 가능해야 한다.
    표시)
  • 조항
    A.1.4.2 옛한글의 일부로 완성형 현대한글 글자마디 사용 금지
    a) 다음의 부호값을 가진 문자를 파일 혹은 클립보드를 통하여 입력받는다.
    부호) U+1100 U+B2E4 U+1100 U+B2E4 U+11EB U+B2E4 U+11EB
    b) 다음과 같이 7개의 글자마디로 표시되어야 하며, 키보드를 통해 글자마디 단위로 캐럿(혹은 커서) 이동과 선택이 가능해야 한다.
    표시) ㄱ다ㄱ다△다△
  • 조항
    A.1.4.3 조합형 현대한글 글자마디
    a) 다음의 부호값을 가진 문자를 파일 혹은 클립보드를 통하여 입력받는다.
    부호) U+1100 U+1161 U+1100 U+1161 U+11A8 U+1100 U+1161 U+11A9
    b) 다음과 같이 6개의 글자마디로 표시되어야 하며, 키보드를 통해 글자마디 단위로 캐럿(혹은 커서) 이동과 선택이 가능해야 한다.
    표시) ㄱㅏㄷㅏㅂㅏ
  • 조항
    A.2 평가용 데이터(test vectors)의 예
  • 조항
    A.2.1 전체 문자 집합
    (5.1)에서 정의한 전체 한글이 포함된 문자 집합을 담은 "표시1_한글문자집합.txt" 파일을 참조한다.
  • 조항
    A.2.2 한글 낱자의 표현
    전체 한글 낱자를 각각 표현하는 부호값을 담은 "표시2_한글낱자표현.txt" 파일을 참조한다.
  • 조항
    A.2.3 현대한글 글자마디의 표현
    전체 11 172자의 완성형 현대한글 글자마디를 표현하는 부호값을 담은 "표시3_현대한글글자마디.txt" 파일을 참조한다.
  • 조항
    A.2.4 옛한글 글자마디의 표현
    용비어천가를 담은 "표시4_용비어천가.txt" 파일과 임의의 옛한글 글자마디를 담은 "표시5_옛한글글자마디.txt" 파일을 참조한다.
  • 조항
    A.2.5 낱자 여러 개로 겹글자 표기 금지
    허용되지 않는 겹글자에 대한 조합을 담은 "금지1_겹글자쓰기.txt" 파일을 참조한다.
  • 조항
    A.2.6 옛한글의 일부로 완성형 현대한글 글자마디 사용 금지
    허용되지 않는 옛한글 글자마디 조합을 담은 "금지2_옛한글글자마디.txt" 파일을 참조한다.
  • 조항
    A.2.7 조합형 현대한글 글자마디
    허용되지 않는 조합형 현대한글 글자마디 11 172자를 담은 "금지3_조합형현대한글.txt" 파일을 참조한다.