Чем измеряется количество информации при синтаксическом подходе к ее оценке

Оценка экономической информации

При оценке экономической информации используются различные подходы: синтаксический, семантический, прагматический и структурный. Для оценки информации используют различные параметры: количество информации, объем данных и качество информации, рис.1.1.

Чем измеряется количество информации при синтаксическом подходе к ее оценке. Смотреть фото Чем измеряется количество информации при синтаксическом подходе к ее оценке. Смотреть картинку Чем измеряется количество информации при синтаксическом подходе к ее оценке. Картинка про Чем измеряется количество информации при синтаксическом подходе к ее оценке. Фото Чем измеряется количество информации при синтаксическом подходе к ее оценке

Рис. 1.1.Меры оценки экономической информации

Синтаксический подход к оценке экономической информации связан со способом представления информации, способом передачи и хранения. При синтаксическом подходе не рассматривается смысловое содержание информации.

Экономическую информацию, рассматриваемую с точки зрения синтаксического подхода называют данными, так как при этом смысловая сторона информации не имеет значения.

Синтаксический подход к оценке информации нередко называется статистическим, как его назвал Клод Шеннон, опубликовавший в 1948 г. книгу по математической теории связи.

Для измерения количества информации в синтаксическом подходе используют энтропийный подход.

К. Шеннон ввел понятие «количество информации» как меры неопределенности состояния системы, снимаемой при получении информации.

Энтропия – это количественно выраженная неопределенность состояния системы, которая уменьшается при получении информации. Очевидно, что чем больше информации получает наблюдатель, тем больше снижается неопределенность и энтропия системы сокращается.

Таким образом, количество информации при синтаксическом подходе измеряется уменьшением (изменением) неопределенности состояния системы.

Тогда информацию можно трактовать как меру уменьшения неопределенности при совершении какого-либо события, и чем менее вероятно сообщение, тем больше информации оно содержит.

Количество информации, поступающей от источника к получателю оценивается как разность энтропий:

где I(x) – количество полученной информации после получения некоторого сообщения;

H1(x) – энтропия системы X до получения сообщения;

H2(x) – энтропия системы X после получения сообщения.

Поскольку обработка и обмен информацией в вычислительных машинах осуществляется в двоичной системе счисления, то за основание логарифма принято 2, и количество информации измеряется в двоичных единицах или битах (двоичный разряд).

Единица количества информациибит – это такое количество информации, которое содержит сообщение, уменьшающее неопределенность знаний в 2 раза. Бит является наименьшей единицей измерения информации.

Семантический подход к оценке экономической информации предполагает учет смыслового содержания информации.

При семантическом подходе к измерению смыслового содержания информации используется тезаурусная мера, предложенная российским ученым Ю. Шнедером.

Тезаурус – это систематизированная совокупность сведений и знаний, с указанием смысловых связей между ними, которыми располагает пользователь или система.

Тезаурусная мера связывает семантические свойства информации со способностью пользователя принимать и понимать поступившее сообщение. Так, для понимания и использования полученной информации получатель должен обладать определенным запасом знаний. Если получатель информации не понимает принятое сообщение, то количество воспринимаемой им информации равняется нулю, и наоборот, если пользователь информации знает абсолютно все о предмете, то сообщение не даст ему ничего нового и количество информации также будет равно нулю.

Следовательно, под семантической (смысловой) ценностью информации понимается мера расширения, развития тезариуса воспринимаемой стороной при приеме и интерпретации сообщения.

Тезаурусный метод подтверждает факт, что информация обладает свойством относительности. Количество семантической информации, то есть количество новых знаний, получаемых пользователем является величиной относительной.

Прагматический подход к оценке экономической информации связанс определением ценности, полезности использования информации при выработке потребителем решения для достижения своей цели.

Прагматическая ценность информации определяет ее полезность для достижения поставленной цели. Эта характеристика информации достаточно условна поскольку определяется способностями использования данных в конкретной системе. При этом рассматриваются такие свойства информации, как достаточность, актуальность, доступность, своевременность, достоверность, точность и др.

Прагматический подход анализирует потребительские свойства информации, соответствие информации цели управления. При оценке количества информации в прагматическом аспекте учитывают временную зависимость информации от момента принятия решения. Так как в экономических системах управления ценность информации со временем может настолько понизиться, что информация будет совершенно бесполезной для принятия решения.

В экономических системах управления прагматический подход к оценке экономической информации является наиболее важным, так как при этом анализируется полезность информации с точки зрения реализации процессов управления. Семантический и синтаксический подходы к оценке информации имеют подчиненное значение.

При структурном подходе происходит абстрагирование от содержательности и ценности информации, основной упор делается на количественные характеристики ее составляющих информационных единиц.

Существует несколько подходов к структуризации информации. Так, с позиции экономического содержания ведущее место занимает иерархический подход, который предполагает многоуровневое построение информационных единиц исходя из организации управленческого процесса. Из простых информационных единиц образуются сложные, составные.

С точки зрения этого подхода структурными единицами экономической информации являются: реквизиты, показатели, массивы, информационная база. Элементарными неделимыми единицами экономической информации являются реквизиты, отражающие определенные свойства объекта или процесса.

Таким образом, количество информации при структурном подходе зависит от правильно выбранной структуры информации.

Важной, стороной оценки информации является определение ее качества.

Качество информации, особенно при принятии управленческих решений, обусловливается целым рядом свойств, таких как содержательность, репрезентативность, доступность, достаточность, актуальность, своевременность, точность, достоверность и др.

Содержательность информации отражает ее семантическую емкость, выражаемую в отношении количества семантической информации в сообщении к объему обрабатываемых данных. Чем выше это отношение, тем больше пропускная способность информационной системы, т.е. для получения одних и тех же сведений нужно обрабатывать меньший объем данных.

Репрезентативность информации заключается в выборе механизма ее отбора и формирования в целях адекватного отражения свойств объекта.

Доступность информации проявляется в понимании ее пользователем.

Достаточность информации означает, что она содержит тот набор показателей, который достаточен для принятия управленческого решения.

Актуальность информации оценивается степенью сохранения ее ценности для управления в момент использования.

Своевременность информации означает ее поступление не позже назначенного времени совершения события (решения задачи).

Точность информации определяется степенью близости получаемой информации к реальному состоянию объекта или протекающего процесса.

Сочетание вышеперечисленных основных параметров позволяет говорить о ценности, надежности и эффективности информационных систем экономических и прочих объектов управления.

Вопросы для самоконтроля

1. Что является объектом изучения информатики как научного
направления?

2. Чем вызвано появление и развитие информатики?

3. Назовите основные черты информационного общества.

4. В чем состоят принципиальные различия между информацией
и данными?

5. Какие особенности присущи экономической информации?

6. Назовите основные признаки классификации экономической
информации.

7. В каких аспектах рассматривается экономическая информация?

8. Что понимается под логической структурой экономической ин
формации?

9. В чем состоит принципиальное различие между реквизитом-
признаком и реквизитом-основанием?

10. Чем измеряется количество информации при синтаксическом
подходе к ее оценке?

11. Какие свойства информации оценивают ее качество?

Источник

Меры информации синтаксического уровня.

Чем измеряется количество информации при синтаксическом подходе к ее оценке. Смотреть фото Чем измеряется количество информации при синтаксическом подходе к ее оценке. Смотреть картинку Чем измеряется количество информации при синтаксическом подходе к ее оценке. Картинка про Чем измеряется количество информации при синтаксическом подходе к ее оценке. Фото Чем измеряется количество информации при синтаксическом подходе к ее оценке Чем измеряется количество информации при синтаксическом подходе к ее оценке. Смотреть фото Чем измеряется количество информации при синтаксическом подходе к ее оценке. Смотреть картинку Чем измеряется количество информации при синтаксическом подходе к ее оценке. Картинка про Чем измеряется количество информации при синтаксическом подходе к ее оценке. Фото Чем измеряется количество информации при синтаксическом подходе к ее оценке Чем измеряется количество информации при синтаксическом подходе к ее оценке. Смотреть фото Чем измеряется количество информации при синтаксическом подходе к ее оценке. Смотреть картинку Чем измеряется количество информации при синтаксическом подходе к ее оценке. Картинка про Чем измеряется количество информации при синтаксическом подходе к ее оценке. Фото Чем измеряется количество информации при синтаксическом подходе к ее оценке Чем измеряется количество информации при синтаксическом подходе к ее оценке. Смотреть фото Чем измеряется количество информации при синтаксическом подходе к ее оценке. Смотреть картинку Чем измеряется количество информации при синтаксическом подходе к ее оценке. Картинка про Чем измеряется количество информации при синтаксическом подходе к ее оценке. Фото Чем измеряется количество информации при синтаксическом подходе к ее оценке

Меры и единицы количества и объема информации.

При реализации информационных процессов всегда происходит перенос информации в пространстве и времени от источника информации к приемнику (получателю). При этом для передачи информации используют различные знаки или символы, например естественного или искусственного (формального) языка, позволяющие выразить ее в некоторой форме, называемой сообщением.

Сообщение – форма представления информации в виде совокупности знаков (символов), используемая для передачи.

Сообщение как совокупность знаков с точки зрения семиотики (от греч. setneion — знак, признак) – науки, занимающейся исследованием свойств знаков и знаковых систем, — может изучаться на трех уровнях:

1) синтаксическом, где рассматриваются внутренние свойства сообщений, т. е. отношения между знаками, отражающие структуру данной знаковой системы. Внешние свойства изучают на семантическом и прагматическом уровнях. На этом уровне рассматривают проблемы доставки получателю сообщений как совокупности знаков, учитывая при этом тип носителя и способ представления информации, скорость передачи и обработки, размеры кодов представления информации, надежность и точность преобразования этих кодов и т. п., полностью абстрагируясь от смыслового содержания сообщений и их целевого предназначения. На этом уровне информацию, рассматриваемую только с синтаксических позиций, обычно называют данными, так как смысловая сторона при этом не имеет значения.

Современная теория информации исследует в основном проблемы именно этого уровня. Она опирается на понятие «количество информации», являющееся мерой частоты употребления знаков, которая никак не отражает ни смысла, ни важности передаваемых сообщений. В связи с этим иногда говорят, что современная теория информации находится на синтаксическом уровне.

2) семантическом, где анализируются отношения между знаками и обозначаемыми ими предметами, действиями, качествами, т. е. смысловое содержание сообщения, его отношение к источнику информации. Проблемы семантического уровня связаны с формализацией и учетом смысла передаваемой информации, определения степени соответствия образа объекта и самого объекта. На данном уровне анализируются те сведения, которые отражает информация, рассматриваются смысловые связи, формируются понятия и представления, выявляется смысл, содержание информации, осуществляется ее обобщение.

3) прагматическом, где рассматриваются отношения между сообщением и получателем, т. е. потребительское содержание сообщения, его отношение к получателю.

На этом уровне интересуют последствия от получения и использования данной информации потребителем. Проблемы этого уровня связаны с определением ценности и полезности использования информации при выработке потребителем решения для достижения своей цели. Основная сложность здесь состоит в том, что ценность, полезность информации может быть совершенно различной для различных получателей и, кроме того, она зависит от ряда факторов, таких, например, как своевременность ее доставки и использования.

Для каждого из рассмотренных выше уровней проблем передачи информации существуют свои подходы к измерению количества информации и свои меры информации. Различают соответственно меры информации синтаксического уровня, семантического уроня и прагматического уровня.

Меры информации синтаксического уровня.

Количественная оценка информации этого уровня не связана с содержательной стороной информации, а оперирует с обезличенной информацией, не выражающей смыслового отношения к объекту. В связи с этим данная мера дает возможность оценки информационных потоков в таких разных по своей природе объектах, как системы связи, вычислительные машины, системы управления, нервная система живого организма и т. п.

Для измерения информации на синтаксическом уровне вводятся два параметра: объем информации (данных) – Vд (объемный подход) и количество информации – I(энтропийный подход).

Объем информацииVд (объемный подход). При реализации информационных процессов информация передается в виде сообщения, представляющего собой совокупность символов какого-либо алфавита. При этом каждый новый символ в сообщении увеличивает количество информации, представленной последовательностью символов данного алфавита. Если теперь количество информации, содержащейся в сообщении из одного символа, принять за единицу, то объем информации (данных) Vд в любом другом сообщении будет равен количеству символов (разрядов) в этом сообщении. Так как одна и та же информация может быть представлена многими разными способами (с использованием разных алфавитов), то и единица измерения информации (данных) соответственно будет меняться.

Чем измеряется количество информации при синтаксическом подходе к ее оценке. Смотреть фото Чем измеряется количество информации при синтаксическом подходе к ее оценке. Смотреть картинку Чем измеряется количество информации при синтаксическом подходе к ее оценке. Картинка про Чем измеряется количество информации при синтаксическом подходе к ее оценке. Фото Чем измеряется количество информации при синтаксическом подходе к ее оценке

Так, в десятичной системе счисления один разряд имеет вес, равный 10, и соответственно единицей измерения информации будет дит (десятичный разряд). В этом случае сообщение в виде п-разрядного числа имеет объем данных Vд = п дит. Например, четырехразрядное число 2009 имеет объем данных Vд = 4 дит.

В двоичной системе счисления один разряд имеет вес, равный 2, и соответственно единицей измерения информации будет бит (bit (binary digit) – двоичный разряд). В этом случае сообщение в виде n-разрядного числа имеет объем данных Vд = п бит. Например, восьмиразрядный двоичный код 11001011 имеет объем данных Vд = 8 бит.

В современной вычислительной технике наряду с минимальной единицей измерения данных бит широко используется укрупненная единица измерения байт, равная 8 бит. Именно восемь битов требуется для того, чтобы закодировать любой из 256 символов алфавита клавиатуры компьютера (256=2 8 ).

При работе с большими объемами информации для подсчета ее количества применяют более крупные единицы измерения:

1 Килобайт (Кбайт) = 1024 байт = 2 10 байт,

1 Мегабайт (Мбайт) = 1024 Кбайт = 2 20 байт = 1 048 576 байт;

1 Гигабайт (Гбайт) = 1024 Мбайт = 2 30 байт = 1 073 741 824 байт;

В последнее время в связи с увеличением объёмов обрабатываемой информации входят в употребление такие производные единицы, как:

1 Терабайт (Тбайт) = 1024 Гбайт = 2 40 байт = 1 099 511 627 776 байт;

1 Петабайт (Пбайт) = 1024 Тбайт = 2 50 байт = 1 125 899 906 842 624 байт.

Следует обратить внимание, что в системе измерения двоичной (компьютерной) информации, в отличие от метрической системы, единицы с приставками «кило», «мега» и т. д. получаются путем умножения основной единицы не на 10 3 = 1000, 10 6 = 1 000 000 и т. д., а на 2 10 = 1024, 2 20 = 1 048 576 и т. д.

Количество информации I (энтропийный подход). В теории информации и кодирования принят энтропийный подход к измерению информации. Этот подход основан на том, что факт получения информации всегда связан с уменьшением разнообразия или неопределенности (энтропии) системы. Исходя из этого, количество информации в сообщении определяется как мера уменьшения неопределенности состояния данной системы после получения сообщения. Неопределенность может быть интерпретирована в смысле того, насколько мало известно наблюдателю о данной системе. Как только наблюдатель выявил что-нибудь в физической системе, энтропия системы снизилась, так как для наблюдателя система стала более упорядоченной.

Таким образом, при энтропийном подходе под информацией понимается количественная величина исчезнувшей в ходе какого-либо процесса (испытания, измерения и т.д.) неопределенности. При этом в качестве меры неопределенности вводится энтропия Н, а количество информации равно:

где, Hapr – априорная энтропия о состоянии исследуемой системы или процесса;

Haps – апостериорная энтропия.

Апостериори (от лат. a posteriori – из последующего) – происходящее из опыта (испытания, измерения).

Априори (от лат. a priori – из предшествующего) – понятие, характеризующее знание, предшествующее опыту (испытанию), и независимое от него.

В случае, когда в ходе испытания имевшаяся неопределенность снята (получен конкретный результат, т. е. Н = 0), количество полученной информации совпадает с первоначальной энтропией

Рассмотрим в качестве исследуемой системы дискретный источник информации (источник дискретных сообщений), под которым будем понимать физическую систему, имеющую конечное множество возможных состояний <аi>, i = Чем измеряется количество информации при синтаксическом подходе к ее оценке. Смотреть фото Чем измеряется количество информации при синтаксическом подходе к ее оценке. Смотреть картинку Чем измеряется количество информации при синтаксическом подходе к ее оценке. Картинка про Чем измеряется количество информации при синтаксическом подходе к ее оценке. Фото Чем измеряется количество информации при синтаксическом подходе к ее оценке.

Отдельные состояния a1, а2. аn называют буквами или символами алфавита.

Такая система может в каждый момент времени случайным образом принять одно из конечных множеств возможных состояний ai. При этом говорят, что различные состояния реализуются вследствие выбора их источником.

Получатель информации (сообщения) имеет определенное представление о возможных наступлениях некоторых событий. Эти представления в общем случае недостоверны и выражаются вероятностями, с которыми он ожидает то или иное событие. Общая мера неопределенности (энтропия) характеризуется некоторой математической зависимостью от этих вероятностей, количество информации в сообщении определяется тем, насколько уменьшается мера неопределенности после получения сообщения.

Поясним эту идею на примере.

Пусть у нас имеется 32 различные карты. Возможность выбора одной карты из колоды – 32. До произведения выбора, естественно предложить, что шансы выбрать некоторую определенную карту, одинаковы для всех карт. Произведя выбор, мы устраняем эту неопределенность. При этом неопределенность можно охарактеризовать количеством возможных равновероятностных выборов. Если теперь определить количество информации как меру устранения неопределенности, то полученную в результате выбора информацию можно охарактеризовать числом 32. Однако удобнее использовать не само это число, а логарифм от полученной выше оценки по основанию 2:

где m – число возможных равновероятных выборов (При m=2, получим информацию в один бит). То есть в нашем случае

Изложенный подход принадлежит английскому математику Р. Хартли (1928 г.). Он имеет любопытную интерпретацию. Он характеризуется числом вопросов с ответами «да» или «нет», позволяющим определить, какую карту выбрал человек. Таких вопросов достаточно 5.

Если при выборе карты, возможность появления каждой карты не одинаковы (разновероятны), то получим статистический подход к измерению информации, предложенный К. Шенноном (1948 г.). В этом случае мера информации измеряется по формуле:

Чем измеряется количество информации при синтаксическом подходе к ее оценке. Смотреть фото Чем измеряется количество информации при синтаксическом подходе к ее оценке. Смотреть картинку Чем измеряется количество информации при синтаксическом подходе к ее оценке. Картинка про Чем измеряется количество информации при синтаксическом подходе к ее оценке. Фото Чем измеряется количество информации при синтаксическом подходе к ее оценке

где pi – вероятность выбора i-го символа алфавита.

Меры информации семантического уровня.Для измерения смыслового содержания информации, т. е. ее количества на семантическом уровне, наибольшее распространение получила тезаурусная мера, которая связывает семантические свойства информации со способностью пользователя принимать поступившее сообщение. Действительно, для понимания и использования полученной информации получатель должен обладать определенным запасом знаний. Полное незнание предмета не позволяет извлечь полезную информацию из принятого сообщения об этом предмете. По мере роста знаний о предмете растет и количество полезной информации, извлекаемой из сообщения.

Если назвать имеющиеся у получателя знания о данном предмете тезаурусом (т. е. неким сводом слов, понятий, названий объектов, связанных смысловыми связями), то количество информации, содержащееся в некотором сообщении, можно оценить степенью изменения индивидуального тезауруса под воздействием данного сообщения.

Тезаурус — совокупность сведений, которыми располагает пользователь или система.

Иными словами, количество семантической информации, извлекаемой получателем из поступающих сообщений, зависит от степени подготовленности его тезауруса для восприятия такой информации.

В зависимости от соотношений между смысловым содержанием информации S и тезаурусом пользователя Sp изменяется количество семантической информации Iс, воспринимаемой пользователем и включаемой им в дальнейшем в свой тезаурус. Характер такой зависимости показан на рис. 2.1. Рассмотрим два предельных случая, когда количество семантической информации Iс равно 0:

а) при Sp = 0 пользователь не воспринимает (не понимает) поступающую информацию;

б) при S —> ∞ пользователь «все знает», и поступающая информация ему не нужна.

Чем измеряется количество информации при синтаксическом подходе к ее оценке. Смотреть фото Чем измеряется количество информации при синтаксическом подходе к ее оценке. Смотреть картинку Чем измеряется количество информации при синтаксическом подходе к ее оценке. Картинка про Чем измеряется количество информации при синтаксическом подходе к ее оценке. Фото Чем измеряется количество информации при синтаксическом подходе к ее оценке

Рис. 1.2. Зависимость количества семантической информации,

воспринимаемой потребителем, от его тезауруса Ic=f(Sp)

Максимальное количество семантической информации потребитель приобретает при согласовании ее смыслового содержания S со своим тезаурусом Sp (S = Sp opt), когда поступающая информация понятна пользователю и несет ему ранее неизвестные (отсутствующие в его тезаурусе) сведения.

Следовательно, количество семантической информации в сообщении, количество новых знаний, получаемых пользователем, является величиной относительной. Одно и то же сообщение может иметь смысловое содержание для компетентного пользователя и быть бессмысленным для пользователя некомпетентного.

При оценке семантического (содержательного) аспекта информации необходимо стремиться к согласованию величин S и Sp.

Относительной мерой количества семантической информации может служить коэффициент содержательности С, который определяется как отношение количества семантической информации к ее объему:

Меры информации прагматического уровня.Эта мера определяет полезность информации для достижения пользователем поставленной цели. Эта мера также величина относительная, обусловленная особенностями использования этой информации в той или иной системе.

Одним из первых российских ученых к проблеме оценки информации прагматического уровня обратился А.А. Харкевич, который предложил принять за меру ценности информации количество информации, необходимое для достижения поставленной цели, т. е. рассчитывать приращение вероятности достижения цели. Так, если до получения информации вероятность достижения цели равнялась р0, а после ее получения – p1 то ценность информации определяется как логарифм отношения p1/p0:

Таким образом, ценность информации при этом измеряется в единицах информации, в данном случае в битах.

Кодирование текстовой информации

Чем измеряется количество информации при синтаксическом подходе к ее оценке. Смотреть фото Чем измеряется количество информации при синтаксическом подходе к ее оценке. Смотреть картинку Чем измеряется количество информации при синтаксическом подходе к ее оценке. Картинка про Чем измеряется количество информации при синтаксическом подходе к ее оценке. Фото Чем измеряется количество информации при синтаксическом подходе к ее оценкеС точки зрения ЭВМ текст состоит из отдельных символов. К числу символов принадлежат не только буквы (заглавные или строчные, латинские или русские), но и цифры, знаки препинания, спецсимволы типа «=», «(«, «&» и т.п. и даже (обратите особое внимание!) пробелы между словами. Да, не удивляйтесь: пустое место в тексте тоже должно иметь свое обозначение.

Вспомним некоторые известные нам факты:

Множество символов, с помощью которых записывается текст, называется алфавитом.

Число символов в алфавите – это его мощность.

Формула определения количества информации: N = 2 b ,

где N – мощность алфавита (количество символов),

b – количество бит (информационный вес символа).

В алфавит мощностью 256 символов можно поместить практически все необходимые символы. Такой алфавит называется достаточным.

Единице измерения 8 бит присвоили название 1 байт:

Двоичный код каждого символа в компьютерном тексте занимает 1 байт памяти.

Каким же образом текстовая информация представлена в памяти компьютера?

Теперь возникает вопрос, какой именно восьмиразрядный двоичный код поставить в соответствие каждому символу.

Понятно, что это дело условное, можно придумать множество способов кодировки.

Все символы компьютерного алфавита пронумерованы от 0 до 255. Каждому номеру соответствует восьмиразрядный двоичный код от 00000000 до 11111111. Этот код просто порядковый номер символа в двоичной системе счисления.

Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки.

Для разных типов ЭВМ используются различные таблицы кодировки.

Международным стандартом для ПК стала таблица ASCII (читается аски) (Американский стандартный код для информационного обмена).

Таблица кодов ASCII делится на две части.

Международным стандартом является лишь первая половина таблицы, т.е. символы с номерами от 0 (00000000), до 127 (01111111).

Структура таблицы кодировки ASCII

Первая половина таблицы кодов ASCII

Чем измеряется количество информации при синтаксическом подходе к ее оценке. Смотреть фото Чем измеряется количество информации при синтаксическом подходе к ее оценке. Смотреть картинку Чем измеряется количество информации при синтаксическом подходе к ее оценке. Картинка про Чем измеряется количество информации при синтаксическом подходе к ее оценке. Фото Чем измеряется количество информации при синтаксическом подходе к ее оценке

Обращаю ваше внимание на то, что в таблице кодировки буквы (прописные и строчные) располагаются в алфавитном порядке, а цифры упорядочены по возрастанию значений. Такое соблюдение лексикографического порядка в расположении символов называется принципом последовательного кодирования алфавита.

Для букв русского алфавита также соблюдается принцип последовательного кодирования.

Вторая половина таблицы кодов ASCII

Чем измеряется количество информации при синтаксическом подходе к ее оценке. Смотреть фото Чем измеряется количество информации при синтаксическом подходе к ее оценке. Смотреть картинку Чем измеряется количество информации при синтаксическом подходе к ее оценке. Картинка про Чем измеряется количество информации при синтаксическом подходе к ее оценке. Фото Чем измеряется количество информации при синтаксическом подходе к ее оценке

К сожалению, в настоящее время существуют пять различных кодировок кириллицы (КОИ8-Р, Windows. MS-DOS, Macintosh и ISO). Из-за этого часто возникают проблемы с переносом русского текста с одного компьютера на другой, из одной программной системы в другую.

Хронологически одним из первых стандартов кодирования русских букв на компьютерах был КОИ8 («Код обмена информацией, 8-битный»). Эта кодировка применялась еще в 70-ые годы на компьютерах серии ЕС ЭВМ, а с середины 80-х стала использоваться в первых русифицированных версиях операционной системы UNIX.

От начала 90-х годов, времени господства операционной системы MS DOS, остается кодировка CP866 («CP» означает «Code Page», «кодовая страница»).

Компьютеры фирмы Apple, работающие под управлением операционной системы Mac OS, используют свою собственную кодировку Mac.

Кроме того, Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку под названием ISO 8859-5.

Наиболее распространенной в настоящее время является кодировка Microsoft Windows, обозначаемая сокращением CP1251.

С конца 90-х годов проблема стандартизации символьного кодирования решается введением нового международного стандарта, который называетсяUnicode. Это 16-разрядная кодировка, т.е. в ней на каждый символ отводится 2 байта памяти. Конечно, при этом объем занимаемой памяти увеличивается в 2 раза. Но зато такая кодовая таблица допускает включение до 65536 символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *