Что обозначает данный символ по iso
10.19.1 Таблицы символьных кодов стандарта ISO/IEC 8859
Семенов Ю.А. (ИТЭФ-МФТИ)
Yu. Semenov (ITEP-MIPT)
Кодовый набор ISO/IEC 8859 является совместным стандартом ISO/IEC 8859 на 8-битовые коды символов. Стандарт предназначен для надежного информационного обмена, а не для типографий, где требуется много дополнительных кодов-символов (например, опционные лигатуры)Стандарт делится на несколько частей, которые описывают отдельные символьные субнаборы, например, ISO 8859-1. В настоящее время он содержит в себе 15 таких субнаборов (ISO 8859-n). Первоначально стандарт был разработан ISO. Рабочая группа ISO/IEC, ответственная за все 8-битовые символьные наборы в июне 2004 года переключила внимание на UCS (Universal Character Set) и Unicode. К набору UCS относятся UTF-8 и UTF-16, которые приобретают все более широкое поле применения. Хотя набор из 95 печатных ASCII символов достаточно для информационного обмена для любых языков, использующих латинский алфавит, многие языки требуют дополнительных символов.
Кодовый набор ISO 8859-1 (Latin-1) базировался на мультинациональном шрифтовом наборе, использованном компанией DEC в популярном терминале VT220. Он был разработан в рамках ECMA (European Computer Manufecturers Association) и опубликован в марте 1985 года (ECMA-94). Второе издание ECMA (июнь 1986) включало в себя ISO 8859-2, ISO 8859-3, и ISO 8859-4.
Хотя ISO/IEC 8859-1 содержит в себе достаточно символов для большинства французских текстов, нескольких букв все же не хватает, нет там и символа евро и некоторых других, да и при транскрипции некоторых имен в финском приходится использовать две буквы вместо одной. Для того чтобы пополнить шрифровое многообразие был разработан набор ISO/IEC 8859-15 (удалены некоторые редко используемые символы, например, ¤ ¦ ¨ ´ ¸ ¼ ½ ¾). Дополненный символами с шестнадцатиричными кодами между 0x80 и 0x9F он стал основой двух известных стандартов ISO-8859-1 и Windows-1252.
Кодовый набор ISO 8859-1 использует исключительно 8-битовое представление и содержит в себе 191 символ и используется в наибольшем числе стран.
Этот шрифтовой набор используется в следующих современных языках:
◊ | африкаанс | ◊ | галицийский | ◊ | Occitan |
◊ | албанский | ◊ | немецкий | ◊ | португальский |
◊ | баскский | ◊ | исландский | ◊ | рето-романский |
◊ | бретонский | ◊ | ирландский | ◊ | шотландский |
◊ | каталонский | ◊ | итальянский | ◊ | испанский |
◊ | английский | ◊ | люксембургский | ◊ | суахили |
◊ | Faroese | ◊ | норвежский | ◊ | валонский |
Таблица кодов символов ISO/IEC 8859-1
ISO/IEC 8859-1 | ||||||||||||||||
x0 | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 | xA | xB | xC | xD | xE | xF | |
0x | Не используется | |||||||||||||||
1x | ||||||||||||||||
2x | SP | ! | « | # | $ | % | & | ‘ | ( | ) | * | + | , | — | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | ? | |||
4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7x | p | q | r | s | t | u | v | w | x | y | z | < | | | > | ||
8x | Не используется | |||||||||||||||
9x | ||||||||||||||||
Ax | nbsp | ¡ | ¢ | £ | ¤ | ¥ | ¦ | § | ¨ | © | ª | « | ¬ | shy | ® | ¯ |
Bx | º | ± | ² | ³ | ´ | µ | ¶ | · | ¸ | ¹ | º | » | ¼ | ½ | ¾ | ¿ |
Cx | À | Á | Â | Ã | Ä | Å | Æ | Ç | È | É | Ê | Ë | Ì | Í | Î | Ï |
Dx | Ð | Ñ | Ò | Ó | Ô | Õ | Ö | × | Ø | Ù | Ú | Û | Ü | Ý | Þ | ß |
Ex | à | á | â | ã | ä | å | æ | ç | è | é | ê | ë | ì | í | î | ï |
Fx | ð | ñ | ò | ó | ô | õ | ö | ÷ | ø | ù | ú | û | ü | ý | þ | ÿ |
В документах, кодированных с использованием ISO/IEC 8859-1, не используются ESC-последовательности (ISO/IEC 6429 или ISO/IEC 2022).
Синонимами ISO/IEC 8859-1 являются ISO_8859-1, ISO-8859-1, is0-ir-100, csISOLatin1, l1, IBM819 и CP819.. Набор ISO/IEC 8859-1 включается в качестве первых 256 символов в стандарт ISO/IEC 10646 и Unicode.
Заметим, что большинство управляющих символов не предназначено для использования в чисто текстовых документах (plain text). Они ориентированы на применение в протоколах или приборах, исключение составляет несколько стандартизованных символов: TAB (09), LF (0A), CR (0D), NEL (85) и может быть FF (0C). Некоторые символьные наборы допускают использование BS (08).
Символьный набор Windows-1252 предполагает использование кодов между 0x80 и 0х9F для букв и пунктуации, в то время как в ISO/IEC 8859-1 они выполняют функцию управляющих кодов.
Таблица управляющих кодов
|
|
Символьный набор ISO/IEC 8859-3 (Latin-3) предназначен для южно-европейских языков: турецкий, мальтийский и эспиранто. Синонимами этого набора являются названия iso-ir-109, ISO_8859-3, latin3, l3 и csISOLatin3.
Таблица кодов символов ISO/IEC 8859-3
ISO/IEC 8859-3 | ||||||||||||||||
x0 | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 | xA | xB | xC | xD | xE | xF | |
0x | Не используется | |||||||||||||||
1x | ||||||||||||||||
2x | SP | ! | « | # | $ | % | & | ‘ | ( | ) | * | + | , | — | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | ? | |||
4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7x | p | q | r | s | t | u | v | w | x | y | z | < | | | > | ||
8x | Не используется | |||||||||||||||
9x | ||||||||||||||||
Ax | nbsp | Ħ | ˇ | £ | ¤ | Ĥ | § | ¨ | İ | Ş | Ğ | Ĵ | shy | Ż | ||
Bx | º | ħ | ² | ³ | ´ | µ | ĥ | · | ¸ | ı | ş | ğ | Ĵ | ½ | ż | |
Cx | À | Á | Â | Ä | Ċ | Ĉ | Ç | È | É | Ê | Ë | Ì | Í | Î | Ï | |
Dx | Ñ | Ò | Ó | Ô | Ġ | Ö | × | Ĝ | Ù | Ú | Û | Ü | Ŭ | Ŝ | ß | |
Ex | à | á | â | ã | ä | å | æ | ç | è | é | ê | ë | ì | í | î | ï |
Fx | ñ | ò | ó | ô | ġ | ö | ÷ | ĝ | ù | ú | û | ü | ŭ | ŝ | ˙ |
Набор символов ISO/IEC 8859-5 называется кириллическим (8-битовым), он ориентирован на использование в текстах на болгарском, белоруском, русском и украинском языках, хотя в нем нет нескольких символов, необходимых для украинского языка.
Набор ISO_8859-5:1988 более известен как ISO-8859-5 является символьным набором IANA. В него добавлены некоторые управляющие коды из ISO/IEC 6429. ESC-последовательности в рмках данного набора не интерпретируются. Этот набор идентичен наборам iso-ir-144, ISO_8859-5, cyrillic и csISOLatinCyrilic.
Символьные 8-битовые наборы KOI8-R и KOI8-U, CP866, а также Windows-1251 (для Microsoft Windows) используются пожалуй даже чаще. Другим способом отображения русских текстов является Unicode.
Таблица кодов символов ISO/IEC 8859-5
ISO/IEC 8859-5 | ||||||||||||||||
x0 | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 | xA | xB | xC | xD | xE | xF | |
0x | Не используется | |||||||||||||||
1x | ||||||||||||||||
2x | SP | ! | « | # | $ | % | & | ‘ | ( | ) | * | + | , | — | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | ? | |||
4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7x | p | q | r | s | t | u | v | w | x | y | z | < | | | > | ||
8x | Не используется | |||||||||||||||
9x | ||||||||||||||||
Ax | nbsp | Ë | Ђ | Ѓ | Є | S | I | Ϊ | J | Љ | Њ | Ћ | Ќ | shy | Ў | Џ |
Bx | А | Б | В | Г | Д | Е | Ж | З | И | Й | К | Л | М | Н | О | П |
Cx | Р | С | Т | У | Ф | Х | Ц | Ч | Ш | Щ | Ъ | Ы | Ь | Э | Ю | Я |
Dx | а | б | в | г | д | е | ж | з | и | й | к | л | м | н | о | п |
Ex | р | с | т | у | ф | х | ц | ч | ш | щ | ъ | ы | ь | э | ю | я |
Fx | № | ё | ђ | ѓ | є | s | i | ϊ | j | љ | њ | ћ | ќ | § | ў | џ |
HTML ISO-8859-1 Справочник
ISO-8859-1
ISO-8859-1 был кодировкой по умолчанию в HTML 4.01.
Различные варианты ISO-8859 перечислены ниже на этой странице.
ISO-8859-1 Набор символов
Для более детального ознакомления, пожалуйста, изучите наш Полный справочник ASCII.
ISO-8859-1 и Windows-1252
ISO-8859-1 очень похож на Windows-1252.
В ISO-8859-1 символы от 128 до 159 не определены.
В Windows-1252 символы от 128 до 159 используются для некоторых полезных символов.
Для более подробного ознакомления, пожалуйста, изучите наш Полный справочник ANSI (Windows-1252).
Поскольку многие веб-сайты декларируют ISO-8859-1 и используют значения от 128 до 159, как если бы они использовали Windows-1252, большинство браузеров будут отображать эти символы из набора символов Windows-1252 вместо ничего.
Символ | Число | Символьное имя | Описание |
---|---|---|---|
€ | 128 | € | euro sign |
129 | NOT USED | ||
‚ | 130 | ‚ | single low-9 quotation mark |
ƒ | 131 | ƒ | Latin small letter f with hook |
„ | 132 | „ | double low-9 quotation mark |
… | 133 | … | horizontal ellipsis |
† | 134 | † | dagger |
‡ | 135 | ‡ | double dagger |
ˆ | 136 | ˆ | modifier letter circumflex accent |
‰ | 137 | ‰ | per mille sign |
Š | 138 | Š | Latin capital letter S with caron |
‹ | 139 | ‹ | single left-pointing angle quotation mark |
Œ | 140 | Œ | Latin capital ligature OE |
141 | NOT USED | ||
Ž | 142 | Ž | Latin capital letter Z with caron |
143 | NOT USED | ||
144 | NOT USED | ||
‘ | 145 | ‘ | left single quotation mark |
’ | 146 | ’ | right single quotation mark |
“ | 147 | “ | left double quotation mark |
” | 148 | ” | right double quotation mark |
• | 149 | • | bullet |
– | 150 | – | en dash |
— | 151 | — | em dash |
˜ | 152 | ˜ | small tilde |
™ | 153 | ™ | trade mark sign |
š | 154 | š | Latin small letter s with caron |
› | 155 | › | single right-pointing angle quotation mark |
œ | 156 | œ | Latin small ligature oe |
157 | NOT USED | ||
ž | 158 | ž | Latin small letter z with caron |
Ÿ | 159 | Ÿ | Latin capital letter Y with diaeresis |
ISO-8859-1 Символы
Следующая часть ISO-8859-1 (коды от 160-191) содержит часто используемые специальные символы.
Символ | Символьное число | Символьное имя | Описание |
---|---|---|---|
non-breaking space | |||
¡ | ¡ | ¡ | inverted exclamation mark |
¢ | ¢ | ¢ | cent |
£ | £ | £ | pound |
¤ | ¤ | ¤ | currency |
¥ | ¥ | ¥ | yen |
¦ | ¦ | ¦ | broken vertical bar |
§ | § | § | section |
¨ | ¨ | ¨ | spacing diaeresis |
© | © | © | copyright |
ª | ª | ª | feminine ordinal indicator |
« | « | « | angle quotation mark (left) |
¬ | ¬ | ¬ | negation |
| | | soft hyphen |
® | ® | ® | registered trademark |
¯ | ¯ | ¯ | spacing macron |
° | ° | ° | degree |
± | ± | ± | plus-or-minus |
² | ² | ² | superscript 2 |
³ | ³ | ³ | superscript 3 |
´ | ´ | ´ | spacing acute |
µ | µ | µ | micro |
¶ | ¶ | ¶ | paragraph |
· | · | · | middle dot |
¸ | ¸ | ¸ | spacing cedilla |
¹ | ¹ | ¹ | superscript 1 |
º | º | º | masculine ordinal indicator |
» | » | » | angle quotation mark (right) |
¼ | ¼ | ¼ | fraction 1/4 |
½ | ½ | ½ | fraction 1/2 |
¾ | ¾ | ¾ | fraction 3/4 |
¿ | ¿ | ¿ | inverted question mark |
ISO-8859-1 Символы
Верхняя часть ISO-8859-1 (коды от 192-255, кроме 215 и 247) содержит символы, используемые в странах Западной Европы.
HTML кодировки
Чтобы правильно отобразить html-документ, браузер должен знать какая кодировка символов использовалась при создании документа.
ASCII — одна из самых старых компьютерных кодировок, в которой каждому символу соответствует строго определенное число. Например, символу «a» соответствует число 97, а символу «A» — число 65.
Эта аббревиатура расшифровывается как American Standard Code for Information Interchange (американская стандартная кодировочная таблица для печатных символов и некоторых специальных кодов).
ASCII — это однобайтовая кодировка, в которую изначально заложено всего 128 символов: буквы латинского алфавита, арабские цифры и т.д.
Вы можете посмотреть на полный комплект Печатаемых символов ASCII.
Позже ASCII была расширена (изначально она не использовала все 8 бит), поэтому появилась возможность использовать уже не 128, а 256 (2 в 8 степени) различных символов, которые можно закодировать в одном байте информации.
Такое усовершенствование позволило добавлять в кодировку ASCII символы национальных языков разных стран, помимо уже существующей латиницы.
Вариантов расширенной кодировки ASCII существует очень много по причине того, что языков в мире тоже немало. Думаю, что многие из вас слышали о такой кодировке, как KOI8 (Код Обмена Информацией, 8 бит) — это тоже расширенная кодировка ASCII. KOI8 включала в себя цифры, буквы латинского и русского алфавита, а также знаки пунктуации, спецсимволы и псевдографику.
Кодировка ISO
Организация Международных стандартов (International Standards Organization) создала диапазон кодировок для различных алфавитов/языков.
Кодировки серии ISO 8859
Для документов на английском и большинстве других западноевропейских языков, широко поддерживается кодирование ISO-8859-1.
Для HTML4:
Для HTML5:
Примером ANSI-кодировки является всем известная Windows-1251.
Windows-1251 выгодно отличается от других 8 битных кириллических кодировок (таких как CP866 и ISO 8859-5) наличием практически всех символов, использующихся в русской типографике для обычного текста (отсутствует только знак ударения). Она также содержит все символы для других славянских языков: украинского, белорусского, сербского, македонского и болгарского.
Ниже приведены десятичные значения символов кодировки Windows-1251.
Для отображения символов таблицы в HTML-документе воспользуйтесь следующим синтаксисом:
Кодировка Windows-1251 (CP1251)
402
403
201A
453
201E
2026
2020
2021
20AC
2030
409
2039
40A
40C
40B
40F
452
2018
2019
201C
201D
2022
2013
2014
2122
459
203A
45A
45C
45B
45F
40E
45E
408
A4
490
A6
A7
401
A9
404
AB
AC
AD
AE
407
B0
B1
406
456
491
B5
B6
B7
451
2116
454
BB
458
405
455
457
410
411
412
413
414
415
416
417
418
419
41A
41B
41C
41D
41E
41F
420
421
422
423
424
425
426
427
428
429
42A
42B
42C
42D
42E
42F
430
431
432
433
434
435
436
437
438
439
43A
43B
43C
43D
43E
43F
440
441
442
443
444
445
446
447
448
449
44A
44B
44C
44D
44E
44F
Кодировки стандарта UNICODE
Кодировка UTF-8 является универсальной и имеет внушительный резерв на будущее. Это делает ее наиболее удобной кодировкой для использования в интернете.