Что обозначает данный символ по iso

10.19.1 Таблицы символьных кодов стандарта ISO/IEC 8859

Семенов Ю.А. (ИТЭФ-МФТИ)
Yu. Semenov (ITEP-MIPT)

Кодовый набор ISO/IEC 8859 является совместным стандартом ISO/IEC 8859 на 8-битовые коды символов. Стандарт предназначен для надежного информационного обмена, а не для типографий, где требуется много дополнительных кодов-символов (например, опционные лигатуры)Стандарт делится на несколько частей, которые описывают отдельные символьные субнаборы, например, ISO 8859-1. В настоящее время он содержит в себе 15 таких субнаборов (ISO 8859-n). Первоначально стандарт был разработан ISO. Рабочая группа ISO/IEC, ответственная за все 8-битовые символьные наборы в июне 2004 года переключила внимание на UCS (Universal Character Set) и Unicode. К набору UCS относятся UTF-8 и UTF-16, которые приобретают все более широкое поле применения. Хотя набор из 95 печатных ASCII символов достаточно для информационного обмена для любых языков, использующих латинский алфавит, многие языки требуют дополнительных символов.

Кодовый набор ISO 8859-1 (Latin-1) базировался на мультинациональном шрифтовом наборе, использованном компанией DEC в популярном терминале VT220. Он был разработан в рамках ECMA (European Computer Manufecturers Association) и опубликован в марте 1985 года (ECMA-94). Второе издание ECMA (июнь 1986) включало в себя ISO 8859-2, ISO 8859-3, и ISO 8859-4.

Хотя ISO/IEC 8859-1 содержит в себе достаточно символов для большинства французских текстов, нескольких букв все же не хватает, нет там и символа евро и некоторых других, да и при транскрипции некоторых имен в финском приходится использовать две буквы вместо одной. Для того чтобы пополнить шрифровое многообразие был разработан набор ISO/IEC 8859-15 (удалены некоторые редко используемые символы, например, ¤ ¦ ¨ ´ ¸ ¼ ½ ¾). Дополненный символами с шестнадцатиричными кодами между 0x80 и 0x9F он стал основой двух известных стандартов ISO-8859-1 и Windows-1252.

Кодовый набор ISO 8859-1 использует исключительно 8-битовое представление и содержит в себе 191 символ и используется в наибольшем числе стран.

Этот шрифтовой набор используется в следующих современных языках:

африкаансгалицийскийOccitan
албанскийнемецкийпортугальский
баскскийисландскийрето-романский
бретонскийирландскийшотландский
каталонскийитальянскийиспанский
английскийлюксембургскийсуахили
Faroeseнорвежскийвалонский

Таблица кодов символов ISO/IEC 8859-1

ISO/IEC 8859-1
x0x1x2x3x4x5x6x7x8x9xAxBxCxDxExF
0xНе используется
1x
2xSP!«#$%&()*+,./
3x0123456789:;?
4x@ABCDEFGHIJKLMNO
5xPQRSTUVWXYZ[\]^_
6x`abcdefghijklmno
7xpqrstuvwxyz <|>
8xНе используется
9x
Axnbsp¡¢£¤¥¦§¨©ª«¬shy®¯
Bxº±²³´µ·¸¹º»¼½¾¿
CxÀÁÂÃÄÅÆÇÈÉÊËÌÍÎÏ
DxÐÑÒÓÔÕÖרÙÚÛÜÝÞß
Exàáâãäåæçèéêëìíîï
Fxðñòóôõö÷øùúûüýþÿ

В документах, кодированных с использованием ISO/IEC 8859-1, не используются ESC-последовательности (ISO/IEC 6429 или ISO/IEC 2022).

Синонимами ISO/IEC 8859-1 являются ISO_8859-1, ISO-8859-1, is0-ir-100, csISOLatin1, l1, IBM819 и CP819.. Набор ISO/IEC 8859-1 включается в качестве первых 256 символов в стандарт ISO/IEC 10646 и Unicode.

Заметим, что большинство управляющих символов не предназначено для использования в чисто текстовых документах (plain text). Они ориентированы на применение в протоколах или приборах, исключение составляет несколько стандартизованных символов: TAB (09), LF (0A), CR (0D), NEL (85) и может быть FF (0C). Некоторые символьные наборы допускают использование BS (08).

Символьный набор Windows-1252 предполагает использование кодов между 0x80 и 0х9F для букв и пунктуации, в то время как в ISO/IEC 8859-1 они выполняют функцию управляющих кодов.

Таблица управляющих кодов

Code
point
Control
character
Abbreviation
00Null characterNUL
01Start of HeadingSOH
02Start of TextSTX
03End of TextETX
04End of TransmissionEOT
05EnquiryENQ
06AcknowledgeACK
07Bell characterBEL
08BackspaceBS
09TabTAB
0ALine FeedLF
0BVertical TabVT
0CForm FeedFF
0DCarriage ReturnCR
0EShift OutSO
0FShift InSI
10Data Link EscapeDLE
11Device Control 1DC1
12Device Control 2DC2
13Device Control 3DC3
14Device Control 4DC4
15Negative-acknowledge
character
NAK
16Synchronous IdleSYN
17End of Transmission
Block
ETB:
18Cancel characterCAN
19End of MediumEM
1ASubstitute (character)SUB
1BEscape characterESC
1CFile SeparatorFS
1DGroup SeparatorGS
1ERecord SeparatorRS
1FUnit SeparatorUS
7FDeleteDEL
Code
point
Control
character
Abbrevi-ation
80Padding CharacterPAD
81High Octet PresetHOP
82Break Permitted HereBPH
83No Break HereNBH
84IndexIND
85Next LineNEL
86Start of Selected AreaSSA
87End of Selected AreaESA
88Character Tabulation SetHTS
89Character Tabulation
with Justification
HTJ
8ALine Tabulation SetVTS
8BPartial Line ForwardPLD
8CPartial Line BackwardPLU
8DReverse Line FeedRI
8ESingle Shift 2SS2
8FSingle Shift 3SS3
90Device Control StringDCS
91Private Use 1PU1
92Private Use 2PU2
93Set Transmit StateSTS
94Cancel CharacterCCH
95Message WaitingMW
96Start of Guarded AreaSPA
97End of Guarded AreaEPA
98Start of StringSOS
99Single Graphic Character
Introducer
SGCI
9ASingle Character
Introducer
SCI
9BControl Sequence
Introducer
CSI
9CString TerminatorST
9DOperating System
Command
OSC
9EPrivacy MessagePM
9FApplication Program
Command
APC

Символьный набор ISO/IEC 8859-3 (Latin-3) предназначен для южно-европейских языков: турецкий, мальтийский и эспиранто. Синонимами этого набора являются названия iso-ir-109, ISO_8859-3, latin3, l3 и csISOLatin3.

Таблица кодов символов ISO/IEC 8859-3

ISO/IEC 8859-3
x0x1x2x3x4x5x6x7x8x9xAxBxCxDxExF
0xНе используется
1x
2xSP!«#$%&()*+,./
3x0123456789:;?
4x@ABCDEFGHIJKLMNO
5xPQRSTUVWXYZ[\]^_
6x`abcdefghijklmno
7xpqrstuvwxyz <|>
8xНе используется
9x
AxnbspĦˇ£¤Ĥ§¨İŞĞĴshyŻ
Bxºħ²³´µĥ·¸ışğĴ½ż
CxÀÁÂÄĊĈÇÈÉÊËÌÍÎÏ
DxÑÒÓÔĠÖ×ĜÙÚÛÜŬŜß
Exàáâãäåæçèéêëìíîï
Fxñòóôġö÷ĝùúûüŭŝ˙

Набор символов ISO/IEC 8859-5 называется кириллическим (8-битовым), он ориентирован на использование в текстах на болгарском, белоруском, русском и украинском языках, хотя в нем нет нескольких символов, необходимых для украинского языка.

Набор ISO_8859-5:1988 более известен как ISO-8859-5 является символьным набором IANA. В него добавлены некоторые управляющие коды из ISO/IEC 6429. ESC-последовательности в рмках данного набора не интерпретируются. Этот набор идентичен наборам iso-ir-144, ISO_8859-5, cyrillic и csISOLatinCyrilic.

Символьные 8-битовые наборы KOI8-R и KOI8-U, CP866, а также Windows-1251 (для Microsoft Windows) используются пожалуй даже чаще. Другим способом отображения русских текстов является Unicode.

Таблица кодов символов ISO/IEC 8859-5

ISO/IEC 8859-5
x0x1x2x3x4x5x6x7x8x9xAxBxCxDxExF
0xНе используется
1x
2xSP!«#$%&()*+,./
3x0123456789:;?
4x@ABCDEFGHIJKLMNO
5xPQRSTUVWXYZ[\]^_
6x`abcdefghijklmno
7xpqrstuvwxyz <|>
8xНе используется
9x
AxnbspËЂЃЄSIΪJЉЊЋЌshyЎЏ
BxАБВГДЕЖЗИЙКЛМНОП
CxРСТУФХЦЧШЩЪЫЬЭЮЯ
Dxабвгдежзийклмноп
Exрстуфхцчшщъыьэюя
Fxёђѓєsiϊjљњћќ§ўџ

Источник

HTML ISO-8859-1 Справочник

ISO-8859-1

ISO-8859-1 был кодировкой по умолчанию в HTML 4.01.

Различные варианты ISO-8859 перечислены ниже на этой странице.

ISO-8859-1 Набор символов

Для более детального ознакомления, пожалуйста, изучите наш Полный справочник ASCII.

126tilde127Control character

ISO-8859-1 и Windows-1252

ISO-8859-1 очень похож на Windows-1252.

В ISO-8859-1 символы от 128 до 159 не определены.

В Windows-1252 символы от 128 до 159 используются для некоторых полезных символов.

Для более подробного ознакомления, пожалуйста, изучите наш Полный справочник ANSI (Windows-1252).

Поскольку многие веб-сайты декларируют ISO-8859-1 и используют значения от 128 до 159, как если бы они использовали Windows-1252, большинство браузеров будут отображать эти символы из набора символов Windows-1252 вместо ничего.

СимволЧислоСимвольное имяОписание
128euro sign
129NOT USED
130single low-9 quotation mark
ƒ131ƒLatin small letter f with hook
132double low-9 quotation mark
133horizontal ellipsis
134dagger
135double dagger
ˆ136ˆmodifier letter circumflex accent
137per mille sign
Š138ŠLatin capital letter S with caron
139single left-pointing angle quotation mark
Œ140ŒLatin capital ligature OE
141NOT USED
Ž142ŽLatin capital letter Z with caron
143NOT USED
144NOT USED
145left single quotation mark
146right single quotation mark
147left double quotation mark
148right double quotation mark
149bullet
150en dash
151em dash
˜152˜small tilde
153trade mark sign
š154šLatin small letter s with caron
155single right-pointing angle quotation mark
œ156œLatin small ligature oe
157NOT USED
ž158žLatin small letter z with caron
Ÿ159ŸLatin capital letter Y with diaeresis

ISO-8859-1 Символы

Следующая часть ISO-8859-1 (коды от 160-191) содержит часто используемые специальные символы.

СимволСимвольное числоСимвольное имяОписание
 non-breaking space
¡¡¡inverted exclamation mark
¢¢¢cent
£££pound
¤¤¤currency
¥¥¥yen
¦¦¦broken vertical bar
§§§section
¨¨¨spacing diaeresis
©©©copyright
ªªªfeminine ordinal indicator
«««angle quotation mark (left)
¬¬¬negation
­­­soft hyphen
®®®registered trademark
¯¯¯spacing macron
°°°degree
±±±plus-or-minus
²²²superscript 2
³³³superscript 3
´´´spacing acute
µµµmicro
paragraph
···middle dot
¸¸¸spacing cedilla
¹¹¹superscript 1
ºººmasculine ordinal indicator
»»»angle quotation mark (right)
¼¼¼fraction 1/4
½½½fraction 1/2
¾¾¾fraction 3/4
¿¿¿inverted question mark

ISO-8859-1 Символы

Верхняя часть ISO-8859-1 (коды от 192-255, кроме 215 и 247) содержит символы, используемые в странах Западной Европы.

Источник

HTML кодировки

Чтобы правильно отобразить html-документ, браузер должен знать какая кодировка символов использовалась при создании документа.
ASCII — одна из самых старых компьютерных кодировок, в которой каждому символу соответствует строго определенное число. Например, символу «a» соответствует число 97, а символу «A» — число 65.
Эта аббревиатура расшифровывается как American Standard Code for Information Interchange (американская стандартная кодировочная таблица для печатных символов и некоторых специальных кодов).
ASCII — это однобайтовая кодировка, в которую изначально заложено всего 128 символов: буквы латинского алфавита, арабские цифры и т.д.
Вы можете посмотреть на полный комплект Печатаемых символов ASCII.

Позже ASCII была расширена (изначально она не использовала все 8 бит), поэтому появилась возможность использовать уже не 128, а 256 (2 в 8 степени) различных символов, которые можно закодировать в одном байте информации.
Такое усовершенствование позволило добавлять в кодировку ASCII символы национальных языков разных стран, помимо уже существующей латиницы.
Вариантов расширенной кодировки ASCII существует очень много по причине того, что языков в мире тоже немало. Думаю, что многие из вас слышали о такой кодировке, как KOI8 (Код Обмена Информацией, 8 бит) — это тоже расширенная кодировка ASCII. KOI8 включала в себя цифры, буквы латинского и русского алфавита, а также знаки пунктуации, спецсимволы и псевдографику.

Кодировка ISO

Организация Международных стандартов (International Standards Organization) создала диапазон кодировок для различных алфавитов/языков.

Кодировки серии ISO 8859

КодировкаОписаниеISO 8859-1 (Latin-1)Расширенная латиница, включающая символы большинства западноевропейских языков (английский, датский, ирландский, исландский, испанский, итальянский, немецкий, норвежский, португальский, ретороманский, фарерский, шведский, шотландский (гэльский) и частично голландский, финский, французский), а также некоторых восточноевропейских (албанский) и африканских языков (африкаанс, суахили). В Latin-1 отсутствуют знак евро и заглавная буква Ÿ. Эта кодовая страница считается кодировкой по умолчанию для HTML-документов и сообщений электронной почты. Также этой кодовой странице соответствуют первые 256 символов Юникода.ISO 8859-2 (Latin-2)Расширенная латиница, включающая символы центральноевропейских и восточноевропейских языков (боснийский, венгерский, польский, словацкий, словенский, хорватский, чешский). В Latin-2, как и в Latin-1, отсутствуют знак евро.ISO 8859-3 (Latin-3)Расширенная латиница, включающая символы южноевропейских языков (мальтийский, турецкий и эсперанто).ISO 8859-4 (Latin-4)Расширенная латиница, включающая символы североевропейских языков (гренландский, эстонский, латышский, литовский и саамские языки).ISO 8859-5 (Latin/Cyrillic)Кириллица, включающая символы славянских языков (белорусский, болгарский, македонский, русский, сербский и частично украинский).ISO 8859-6 (Latin/Arabic)Символы, используемые в арабском языке. Символы других языков с письмом на основе арабского не поддерживаются. Для корректного отображения текста в кодировке ISO 8859-6 требуется поддержка двунаправленного письма и контекстно-зависимых форм символов.ISO 8859-7 (Latin/Greek)Символы современного греческого языка. Может использоваться также для записи древнегреческих текстов в монотонической орфографии.ISO 8859-8 (Latin/Hebrew)Символы современного иврита. Используется в двух вариантах: с логическим порядком следования символов (требует поддержки двунаправленного письма) и с визуальным порядком следования символов.ISO 8859-9 (Latin-5)Вариант Latin-1, в котором редко используемые символы исландского языка заменены на турецкие. Используется для турецкого и курдского языков.ISO 8859-10 (Latin-6)Вариант Latin-4, более удобный для скандинавских языков.ISO 8859-11 (Latin/Thai)Символы тайского языка.ISO 8859-13 (Latin-7)Вариант Latin-4, более удобный для балтийских языков.ISO 8859-14 (Latin-8)Расширенная латиница, включающая символы кельтских языков, таких как шотландский (гэльский) и бретонский.ISO 8859-15 (Latin-9)Вариант Latin-1, в котором редко используемые символы заменены на необходимые для полной поддержки финского, французского и эстонского языков. Кроме того, в Latin-9 был добавлен знак евро.ISO 8859-16 (Latin-10)Расширенная латиница, включающая символы южноевропейских и восточноевропейских (албанский, венгерский, итальянский, польский, румынский, словенский, хорватский), а также некоторых западноевропейских языков (ирландский в новой орфографии, немецкий, финский, французский). Как и в Latin-9, в Latin-10 был добавлен знак евро.

Для документов на английском и большинстве других западноевропейских языков, широко поддерживается кодирование ISO-8859-1.

Для HTML4:

Для HTML5:

Примером ANSI-кодировки является всем известная Windows-1251.

Windows-1251 выгодно отличается от других 8 битных кириллических кодировок (таких как CP866 и ISO 8859-5) наличием практически всех символов, использующихся в русской типографике для обычного текста (отсутствует только знак ударения). Она также содержит все символы для других славянских языков: украинского, белорусского, сербского, македонского и болгарского.
Ниже приведены десятичные значения символов кодировки Windows-1251.

Для отображения символов таблицы в HTML-документе воспользуйтесь следующим синтаксисом:

Кодировка Windows-1251 (CP1251)

.0.1.2.3.4.5.6.7.8.9.A.B.C.D.E.F8.Ђ
402Ѓ
403
201Aѓ
453
201E
2026
2020
2021
20AC
2030Љ
409
2039Њ
40AЌ
40CЋ
40BЏ
40F9.ђ
452
2018
2019
201C
201D
2022
2013
2014
2122љ
459
203Aњ
45Aќ
45Cћ
45Bџ
45FA.A0Ў
40Eў
45EЈ
408¤
A4Ґ
490¦
A6§
A7Ё
401©
A9Є
404«
AB¬
AC­
AD®
AEЇ
407B.°
B0±
B1І
406і
456ґ
491µ
B5
B6·
B7ё
451
2116є
454»
BBј
458Ѕ
405ѕ
455ї
457C.А
410Б
411В
412Г
413Д
414Е
415Ж
416З
417И
418Й
419К
41AЛ
41BМ
41CН
41DО
41EП
41FD.Р
420С
421Т
422У
423Ф
424Х
425Ц
426Ч
427Ш
428Щ
429Ъ
42AЫ
42BЬ
42CЭ
42DЮ
42EЯ
42FE.а
430б
431в
432г
433д
434е
435ж
436з
437и
438й
439к
43Aл
43Bм
43Cн
43Dо
43Eп
43FF.р
440с
441т
442у
443ф
444х
445ц
446ч
447ш
448щ
449ъ
44Aы
44Bь
44Cэ
44Dю
44Eя
44F

Кодировки стандарта UNICODE

Кодировка UTF-8 является универсальной и имеет внушительный резерв на будущее. Это делает ее наиболее удобной кодировкой для использования в интернете.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *