Что означает машиночитаемый формат данных
В Соединенных Штатах Закон об открытых правительственных данных от 14 января 2019 года определяет машиночитаемые данные как «данные в формате, который может легко обрабатываться компьютером без вмешательства человека, при этом не теряется семантическое значение». Закон предписывает федеральным агентствам США публиковать общедоступные данные таким образом, чтобы «любые общедоступные данные агентства были машиночитаемыми».
Расширяемый язык разметки (XML) предназначен для чтения как человеком, так и машиной, а преобразование расширяемого языка таблиц стилей (XSLT) используется для улучшения представления данных для удобства чтения человеком. Например, XSLT можно использовать для автоматической визуализации XML в формате переносимого документа (PDF). Машиночитаемые данные могут быть автоматически преобразованы для удобства чтения человеком, но, вообще говоря, обратное неверно.
В целях реализации Закона о модернизации Закона о деятельности и результатах правительства (GPRA) Управление управления и бюджета (OMB) определяет «машиночитаемый формат» следующим образом: «Формат на стандартном компьютерном языке (не английский текст), который может быть автоматически читаются веб-браузером или компьютерной системой (например, xml). Традиционные документы текстовых редакторов и файлы в формате переносимых документов (PDF) легко читаются людьми, но обычно их трудно интерпретировать машинами. Другие форматы, такие как расширяемый язык разметки ( XML), (JSON) или электронные таблицы со столбцами заголовков, которые можно экспортировать как значения, разделенные запятыми (CSV), являются машиночитаемыми форматами. Поскольку HTML является структурным языком разметки, незаметно маркируя части документа, компьютеры могут собирать компоненты документа. для составления оглавлений, схем, библиографий для поиска по литературе и т. д. Можно сделать традиционные текстовые документы и другие форматы машиночитаемыми, но документы должны включать улучшенные структурные элементы «.
Смотрите также
использованная литература
Определение
Машиночитаемость имеет как минимум четыре аспекта:
Еще в 1983 году Счетная палата правительства США (GAO) начала подчеркивать преимущества машиночитаемой информации. Еще раньше, в 1981 году, GAO начало сообщать о проблеме неадекватной практики ведения документации в федеральном правительстве США. Такие недостатки присущи не только правительству, а достижения в области информационных технологий означают, что большая часть информации теперь «рождается в цифровом виде» и, следовательно, потенциально гораздо легче управлять с помощью автоматизированных средств. Однако в показаниях Конгрессу в 2010 году GAO подчеркнуло проблемы с управлением электронными записями, и совсем недавно, в 2015 году, GAO продолжало сообщать о несоответствиях в деятельности агентств исполнительной ветви в соблюдении требований к управлению записями. Более того, более чем через два десятилетия после того, как крупная и ранее весьма уважаемая аудиторская компания Arthur Andersen прекратила свое существование из-за скандала с уничтожением документации, практика ведения документации стала центральным вопросом на президентских выборах 2016 года.
4 января 2011 года президент Обама подписал HR 2142, Закон о модернизации деятельности и результатах правительства (GPRA) от 2010 года (GPRAMA), в качестве закона PL 111-352. Раздел 10 GPRAMA требует, чтобы федеральные агентства США публиковали свои стратегические и производственные планы и отчеты в машиночитаемом формате с возможностью поиска. Кроме того, в 2013 году, он издал правительственное распоряжение 13642, Изготовление Открыть и машиносчитываемой Новое По умолчанию для правительственной информации в целом. 28 июля 2016 г. Управление по управлению и бюджету (OMB) включило в пересмотренный выпуск Циркуляра A-130 указание агентствам использовать открытые машиночитаемые форматы и публиковать «общедоступную информацию в Интернете способом». который способствует анализу и повторному использованию для максимально широкого круга целей «, что означает, что информация является общедоступной и машиночитаемой. 14 января 2019 года президент Трамп подписал закон HR 4174, Закон об открытых государственных данных (OGDA), который закрепляет в законе требование к агентствам предоставлять свои общедоступные информационные активы в машиночитаемом формате. 28 июня 2019 г. в Циркуляре A-11 OMB выразило намерение начать соблюдать раздел 10 GPRAMA.
Машиночитаемый формат библиографической записи: структура, назначение, технология ввода в электронный каталог (ЭК)
Основу ЭК составляют MARC-записи или машиночитаемые библиографические записи.
В настоящее время MARC является стандартом формата обмена библиотечными данными, и его разработка сделала возможным само существование электронного каталога.
Для того чтобы создать ЭК не достаточно ввести в компьютер информацию, которая содержится на каталожной карточке.
MARC-формат решает задачу интерпретации данных для компьютеров. Формат позволяет компьютеру:
1)Во-первых, структурировать и в дальнейшем правильно интерпретировать библиографическую информацию;
2)Во-вторых, обеспечивает более компактное хранение информации;
3)В-третьих, позволяет библиотека осуществлять обмен информацией. Машиночитаемый библиографический формат, представляет собой совокупность взаимосвязанных элементов данных, который служит для создания и обмена библиографическими записями в машиночитаемой форме.
Машиночитаемая библиографическая запись содержит традиционное библиографическое описание, предметные рубрики, индексы классификационных систем, а также содержит и другие данные обеспечивающие автоматическую обработку записи, более точный поиск.
Первоначальный вариант MARC-формата был разработан библиотекой Конгресса США в середине 60-х годов. Целью было исследование возможностей получения библиографических данных в машиночитаемой форме. Первый формат носил название MARC-I (65-66 года). Аналогичная работа также проводилась в Великобритании. Эти параллельные исследования легли в основу создания в 1968 году проекта MARC II, в которой были заложены возможности использования формата MARC в качестве коммуникационного формата (обменный формат).
Коммуникационный формат обеспечивает:
1) Возможность его применения для всех видов библиотечных документов;
2) Решение разнообразных задач в дополнении к библиографированию;
3) Удобство применения в различных автоматизированных системах.
Различия в содержании данных в этих форматах вызвали необходимость редактирования записей до обмена ими. Для преодоления не совместимости форматов был разработан международный формат UNIMARC, который позволил принимать библиографические записи, составленные в любом формате MARC (1977г. под игидой ИФЛА разработан и опубликован).
В 1987 году вышла новое описание формата.
В 90-х годах европейский союз признает формат UNIMARC в качестве официального обменного формата стран членов СЭЗ. UNIMARC и форматы созданные на его основе MARC 21 (объединенные USMARC и CANMARC).
На основе формата UNIMARC в отдельных странах изданы национальные версии. Российский вариант разработан и опубликован в 1998 году RUSMARC.
Создание MARC-записи включает следующие этапы:
1) Анализ документа;
2)Отбор и организация библиографических данных в соответствии с правилами каталогизации и локальной практикой библиографирующего учреждения;
3)Выбор элементов MARC-записей (полей и подполей) для каждого фрагмента библиографических данных:
4Ввод библиографических данных в систему.
В автоматизированных системах MARC-запись обеспечивает возможность вывода информации на экран в любом удобном для пользователя виде:
— краткий формат (автор, заглавие, дата издания..);
— в формате каталожной карточки;
— в полном формате (шифр, издательство и так далее);
Структура MARC-записи. Библиографическая запись в формате MARC характеризуется тремя элементами:
1. Структура записи
2. Определитель содержания (назначение структуры элементов)
3. Содержание записи (т.е. библиографические сведения) Библиографическая запись в российском машиночитаемом формате состоит из трехкомпонентов:
Маркер записи обязательная область располагается в начале каждой машиночитаемой записи. Содержит общие данные, используется для обработки записей. Маркер не содержит библиографические сведения о документе. Маркер содержит код записи равный 24 символам. Он определяет длину записи, статус записи, тип записи, библиографический уровень, иерархический уровень, дополнительно определение записи (степень полноты и
Справочник, следует за маркером, определяет наличие и последовательность полей в записи. Содержит код записи равный 12 символам для каждого поля и включает три характеристики поля: метку поля (3-х цифровой символ для каждого поля); длину каждого поля (4 символа); позиции начального символа, относящегося к первому поля данных.
Поля данных распределены по 10 блокам:
В каждый блок входит разное количество полей.
Взаимосвязь форматов представления различных типов данных (система форматов). Формирование библиографических записей включает три основных составляющих:
1. Создание библиографического описания
2. Формирование контролируемых точек доступа (с использованием авторитетных файлов)
3. Приведение сведений об экземплярности и места положения.
Для данных каждой из этих составляющих создается свой формат. Поэтому форматы, которые мы знаем как MARC 21, UNIMARC, RUSMARC представляют собой системы взаимосвязанных форматов, каждый из которых выполняет свою функцию в рамках общей задачи обеспечивать создания и обмена библиографической информацией. Система форматов MARC 21 включает:
1. Форматы представления библиографических данных
2. Форматы представления авторитетных данных
3. Форматы представления классификационных данных
4. Формат для описания не библиографических ресурсов
5. Формат представления холдинговых данных Система форматов UNIMARC включает:
1. Форматы представления библиографических данных
2. Форматы представления авторитетных данных
3. Формат представления холдинговых данных
4. Форматы представления классификационных данных
RUSMARC также является системой форматов для библиографических данных, для авторитетных данных, для классификационных данных, для машиночитаемой каталогизации.
Российский коммуникационный формат представления библиографических записей опубликованные в 1998 году обеспечивает возможность обмена готовыми библиографическими записями между библиотеками России.
Российский коммуникационный формат представления авторитетных записей опубликован в 1998году обеспечивает обмен авторитетными или нормативными, а также ссылочными и справочными записями между библиографическими учреждениями России.
Российский формат машиночитаемой каталогизации, опубликован в 2000 году. Наличие рекомендаций по наполнению машиночитаемых записей в библиографических базах данных для обеспечивания их соответствия правилам составления библиографического описания, методикам индексирования, коммуникационным форматам по структуре и наполнению согласован с российским коммуникационным форматом представления библиографических записей и российским коммуникационным форматом представления авторитетных записей.
Российский коммуникационный формат представления классификационных записей, как и другие форматы системы RUSMARC, формат классификационных данных разработан на базе UNIMARC. В 2005 году завершена работа, определены три основных вида записей:
— Запись основных таблиц
— Запись вспомогательных таблиц
— Запись терминала индексирования, выражается понятием. Аналог справочной карточки с алфавитно-предметном указателем.
Машиночитаемые форматы представления данных (MARC): история и современное состояние
История возникновение и виды MARC-форматов, опыт зарубежной каталогизации. Назначение и структура форматов машиночитаемых данных. Анализ развития машиночитаемой каталогизации в библиотеках России. Программа ЛИБНЕТ и ее роль в развитии каталогизации.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 08.10.2017 |
Размер файла | 71,8 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru
Министерство культуры Российской Федерации
Федеральное государственное бюджетное образовательное учреждение
высшего профессионального образования
«САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ ИНСТИТУТ КУЛЬТУРЫ»
КАФЕДРА ДОКУМЕНТОВЕДЕНИЯ И ИНФОРМАЦИОННОЙ АНАЛИТИКИ
ВЫПУСКНАЯ КВАЛИФИКАЦИОННАЯ РАБОТА
Машиночитаемые форматы представления данных (MARC): история и современное состояние
Блинова Софья Владимировна
Жабко Елена Викторовна
Актуальность темы. Внедрение в библиотеки электронной формы каталога и появившаяся возможность использования телекоммуникаций для создания и обмена БЗ привели к переменам, заставившим пересмотреть основополагающие принципы каталогизации. Качество и эффективность электронного каталога обусловлены комплексом методов и средств, определяющих технологию его создания и использования. Работа по внедрению формализованных и унифицированных записей в формате MARC в электронные каталоги библиотек продолжается до сих пор.
1. Представить историю создания машиночитаемого формата MARC, раскрыть его назначение и структуру.
2. Рассмотреть виды MARC- формата.
3. Отобразить историю развития машиночитаемой каталогизации России. Рассмотреть положения программы ЛИБНЕТ.
4. Представить систему форматов RUSMARC.
5. Рассмотреть работу НИБЦ ЛИБНЕТ как центр организации корпоративной каталогизации в России.
6. Отобразить технологию формирования машиночитаемых записей в формате RUSMARC.
7. Провести исследование в Сводном каталоге библиотек России по поиску документов с применением полей формата RUSMARC.
Методы исследования: анализ и обобщение информации, представленной в литературе по рассматриваемой тематике, исследование на базе Сводного каталога библиотек России.
Структура работы. Работа состоит из введения, двух глав основной части, выводов (заключения), списка литературы и приложений.
Практическая направленность работы заключается в разработке рекомендаций по совершенствованию лингвистических средств электронного каталога и технологии поиска документов в СКБР для пользователей.
Во введении рассмотрена актуальность выбора темы, определена цель, предмет, объект и соответствующие задачи, приведены методы исследования, показана практическая значимость.
В первой главе рассматривается возникновение MARC- формата, его назначение, виды, структура и опыт использования в зарубежной каталогизации.
Во второй главе рассматривается развитие машиночитаемой каталогизации в России: развитие и роль программы ЛИБНЕТ, история и причины создания формата RUSMARC, значение работы центра ЛИБНЕТ в корпоративной каталогизации в России. Создается технология создания машиночитаемых записей в формате RUSMARC, а так же проводится анализ поисковых возможностей Сводного каталога библиотек России.
ГЛАВА 1. ВОЗНИКНОВЕНИЕ MARC-ФОРМАТОВ: ОПЫТ ЗАРУБЕЖНОЙ КАТАЛОГИЗАЦИИ
1.1 Форматы машиночитаемых данных: история, назначение и структура
Формат MARC обеспечивает удобный способ хранения библиографических данных и обмена ими. При этом он характеризуется возможностью применения его для всех видов библиотечных документов, гибкостью для решения разнообразных задач в дополнение к основной и удобством применения в различных автоматизированных системах. MARC- это акроним названия Machine-Readable Catalogue or Cataloging ( машиночитаемый каталог или каталогизация). [40, с. 44].
Принципы, заложенные в MARC II, оставались неизменными на протяжении многих лет: ориентация формата на все виды документов, решение разнообразных информационно-библиотечных задач, включая каталогизацию и возможность применения его в различных автоматизированных системах.
Программа-конвертор состояла из 3 блоков: в первом блоке программа-конвертор считывает те данные из файла, которые необходимо конвертировать; второй блок является основным и самым сложным (в нём, собственно, и происходит конвертирование данных, происходит перестраивание маркера, конвертирование справочника, перевод всех меток полей, подполей и индикаторов, которые не совпадают); в третьем блоке новая запись записывается в новый файл, который и будет отображать форму записи нового формата. [5,.С. 122].
2. Теги полей и индикаторы MARC 21 интерпретируются как атрибуты. Это позволило радикально сократить количество элементов первого уровня в MARC XML. Нужны только три базовых элемента, относящихся к формату: ( заголовок),
( контрольное поле) и ( поле данных).
имеет один дочерний элемент, ( подполе), который повторяется для каждого подполя, а имеет атрибут для определения кода подполя.
3. Содержимое каждого теги MARC 001-009 рассматривается как строка. Это значит, что для MARC 008, для которого кодированные элементы определяются по рапсположению символа, все 40 байтов из 008 трансформируются в XML, включая пробелы. XML имеет простую спецификацию схемы, которая не допускает сжатия пробелов или какого-либо иного их искажения, что необходимо для работы с некоторыми контрольными полями, как и со строками.
Пример: 931129s1994 wauab 001 0 eng
4. (заголовок) также рассматривается как строка. Поскольку некоторая информация заголовка существенна только для записи ISO2709, то она просто переносится в тех случаях, когда при дальнейших трансформациях легко ее учитывать.
Основные согласованные между собой форматы MARC являются широко распространёнными в мире стандартами для представления и обмена библиографическими, классификационными, авторитетными и холдинговыми данными в машиночитаемой форме.
Структура МАRС-записи определяет физическое представление и расположение данных в записи в форме цепочек символов, которые называются поля; структура записи полностью соответствует положениям международного стандарта ISO 2709.
Запись MARC состоит из трех элементов: структуры записи, определения содержания и содержания данных записи.
Структура записи предназначена для контроля над представлением данных при хранении их в форме символьных строк, называемых полями. Все данные в записи должны храниться с использованием одного или более наборов символов. Поскольку компьютеры могут хранить и обрабатывать только цифровую информацию, каждому символу (например, алфавитному) присваивается цифровое значение в соответствии с правилами определённого набора символов. Структура записи, установленная в формате MARC, является реализацией международного стандарта Format for bibliographic information interchange on magnetic tape (ISO 2709).
В основном, MARC обеспечивает определение содержания лишь для тех данных, которые относятся ко всем видам копий определенной работы. Однако информация, относящаяся к отдельным или даже одному виду копий, может представлять интерес не только для организации-хранителя. В таких случаях в формате MARC принимаются специальные поля для приведения более детальной информации.
Содержание данных записи. Под содержанием понимаются данные, которые хранятся в полях записи. Данные могут быть кодированными или библиографическими:
— Кодированные данные используются для представления таких элементов, как контрольные номера, тип публикации и основной язык текста, а также для представления характеристик специальных видов документов таких, например, как нотные издания.
— Библиографические данные определяются правилами Международного стандартного библиографического описания для конкретных видов документов. Кроме того, каждая запись может содержать индекс классификации и предметные рубрики. [1, с. 62].
Содержание элементов данных, которые составляют запись MARC, обычно устанавливается в соответствии со следующими правилами и стандартами: International Standard Bibliographic Description (ISBD) (Международный стандарт на библиографическое описание), Anglo-American Cataloguing Rules, 2-nd ed.(AACR2) (Англо-американские правила каталогизации, 2-е изд.) или другими регламентирующими документами, которые используются организацией, составляющей запись. [15, с. 73].
Запись MARC содержит такие указатели данных: Поле, Метка, Индикатор, Подполе, Код подполя и Определитель содержания.
Эти поля подразделяются на одно или несколько «подполей». Текстовые наименования полей слишком длинные, чтобы их приводить в каждой записи MARC. Вместо этого поля представляются 3-х цифровыми метками.
Метка: Каждое поле ассоциируется с трёхцифровым числом, которое называется меткой. Метка идентифицирует поле (тип данных), которое следует после неё. Даже если на экране дисплея сразу после метки выведены ещё и индикаторы (таким образом, может появиться число из 4 или 5 цифр), метка всегда представляет собой первые три цифры.
В МАRС-формате установлены две позиции индикаторов. Они располагаются непосредственно после метки поля. Индикаторы могут иметь цифровое значение, либо знак пробела, если значение индикатора в формате не установлено [10, с. 39].
Каждое поле состоит из Маркера и Справочника:
Коды в маркере определяют статус записи, тип записи, библиографический уровень документа, положение в иерархии уровней, степень полноты информации в записи, использование правил ISBD. Значение символа в маркере определяется позицией символа. [10, с. 40].
Поля переменной длины. Данные записи в формате MARC распределены по полям переменной длины, каждое из которых идентифицировано меткой поля, состоящей из трёх цифр и хранящейся в статье Справочника для этого поля. Каждое поле заканчивается символом конца поля. Последнее переменное поле заканчивается символами как конца поля, так и конца записи. Существует два типа полей переменной длины:
Содержательная часть записи MARC была условно разделена на две группы полей: поля каталогизационной информации; поля дополнительной (преимущественно, кодированной) информации.
Первую из названных групп в MARC составляют поля, которые сгруппированы в так называемые блоки описательной информации, примечаний, взаимосвязанных заглавий, определения тематики и интеллектуальной ответственности. Вторую группу представляют блоки кодированной информации и международного использования. Некоторые блоки UNIMARC содержат поля как каталогизационной, так и дополнительной информации (блоки идентификации и связи описаний) [15, с. 74].
Коды подполей предназначены для идентификации элементов данных, а не для их упорядочения. Порядок следования подполей обычно определяется применяемыми стандартами, такими как правила каталогизации. [15, с. 76].
Каждый элемент данных в формате MARC идентифицируется для выполнения информационного поиска. Используя компьютерное программное обеспечение, можно вести поиск по большинству полей и подполей записи MARC.
Например: ключевые слова; предметные заголовки (рубрики); автор; имя/наименование, наименование темы, географическое название в качестве предметной рубрики; заглавие и заглавие серий; стандартные номера (ISBN, ISSN и т.п.) и номера, присвоенные специальными службами (службой национальной библиографии, правительственной службой печати и т.п.); индексы классификации; издатель; дата и тип издания; акронимы, составленные из слов имени/наименования и заглавия; кодированные данные.
Поскольку каждая запись MARC является самостоятельной единицей, каталог, содержащий множество таких записей, представляет собой усовершенствованную базу данных, соответствующую широким поисковым стратегиям. Разнообразие поисковых вариантов зависит от применяемого программного обеспечения. [36, с. 31].
Следует учитывать различие между коммуникативным форматом и форматом каталогизации. Отличие коммуникативного формата от формата каталогизации заключается в том, что коммуникативный формат регламентирует только набор данных, включая определители содержания (поля, подполя, индикаторы). В нем не оговорена форма, содержание или структура записи локальных систем. С другой стороны, некоторые- спецификации коммуникативного формата могут быть излишними для формата каталогизации. [10, с. 42].
Коммуникативный формат MARC должен обеспечивать:
· возможность его применения для всех видов библиотечных документов;
· достаточную гибкость для решения разнообразных задач в дополнение к каталогизации;
· удобство применения в различных автоматизированных системах. [36, c. 32].
Форматы можно классифицировать по следующим параметрам:
1. Коммуникативные (обменные) форматы, обеспечивающие возможности обмена данными между системами. Эти форматы являются результатом соглашения, которое касается описания структуры и характера записей в массивах баз данных, предназначенных для обмена. Их принято делить по статусу (области распространения):
· Международные (UNIMARC, MARC 21).
· Государственные (USMARC, RUSMARC, Monocle, UNISIST).
· Корпоративные (обеспечивают обмен данными внутри группы организаций).
2. Внутрисистемные форматы, предназначенные для решения служебных и пользовательских задач конкретной системы. Их принято делить по содержанию записываемых данных:
· формат для данных о фонде;
Согласованность коммуникативных форматов, входящих в систему, определяется тремя основными составляющими машиночитаемых записей:
3. содержанием записи, т.е. данными, предназначенным для обмена.
Это обеспечивает возможность совместного использования библиографических, авторитетных, классификационных записей в библиотечных системах [10, с. 43].
Формат предоставляет информацию о фондах трех типов библиографических единиц, которые идентифицируются кодами в Маркере:
• однотомная единица, завершенная в одном физическом томе, например, картографический материал, партитура, однотомная книга, компьютерный файл;
• многотомная единица, завершенная или завершение которой планируется в определенном количестве физических единиц, например, набор картографических материалов, музыкальных партитур и частей, многотомная энциклопедия, подборка работ на нескольких носителях, собрание рукописей;
• сериальная единица, выпускаемая последовательными частями с регулярными или нерегулярными интервалами, публиковать которую предполагается в течение неопределенного периода времени, например, журнал, сериальное приложение к отдельно издаваемой публикации.
В отличие от элементов данных, которые используются в обычном библиографическом описании этих типов единиц, информация о фондах может включать:
— информацию о конкретном экземпляре единицы;
— информацию, относящуюся к организации-хранителю определенного фонда;
— информацию, необходимую для локальной обработки, технического контроля или хранения единицы;
— вариантную информацию (например, представленную в другой форме) [1].
В Формате идентифицируются три вида классификационных записей:
В Формате идентифицируются следующие пять видов записей:
Рассмотрим международный коммуникативный формат UNIMARC. Т.к. он получил широчайшее распространение в мире, его использует большое количество организаций, на его основе созданы многие национальные коммуникативные форматы.
В 70-х годах появляются такие форматы, предназначенные для международного обмена, как UNIMARC (Библиотека Конгресса), UNISIST Reference Manual (UNESCO), МЕКОФ-2 (СЭВ), USSR-US Common Communication Format (Совет Министров СССР, Государственный комитет по Науке и Технике, ГПНТБ СССР).
В апреле 1978 года представительный форум в Таормине (Сицилия), с участием UNESCO, IFLA, ISO, принимает решение о необходимости создания общего коммуникативного формата (CCF) на базе всех перечисленных выше форматов. Первое руководство по CCF появляется в 1984 году. Но уже в 1987 году под эгидой IFLA выходит руководство по формату UNIMARC.
UNIMARC становится официальным форматом, поддерживаемым IFLA.
С 1991 года формат CCF практически не развивается.
Ряд европейских стран, такие как Греция, Италия, Литва, Португалия, Россия, Франция, Хорватия, Чехия внедряют формат UNIMARC на национальном уровне. В 2001 году во Франции создан Национальный комитет по формату UNIMARC.
В Азербайджане создан Комитет по формату AZMARC, который ставит своей целью внедрение формата UNIMARC в качестве национального формата как обменного, так и формата каталогизации. Грузия и Армения, кажется, также остановили свой выбор на формате UNIMARC [43, с. 132].
Формат UNIMARC имеет универсальный характер и распространяется на все виды информационных продуктов. UNIMARC является реализацией международного стандарта ISO-2709, определяющего структуру записей, содержащих библиографические данные. Составление библиографической записи базируется на международном стандарте по библиографическому описанию ISBD [15, с. 75].
UNIMARC как представитель семейства MARC-форматов является обменным форматом и включает три основных компонента:
• Определенная физическая структура: правила размещения в памяти компьютера данных, предназначенных для обмена. Ее можно сравнить с контейнером или носителем, в который помещены данные. Носитель остается неизменным, а данные меняются от записи к записи.
• Определители содержания: коды, идентифицирующие различные элементы данных в записи (например, автор, заглавие, дата начала издания журнала, носитель информации); определители полей и подполей.
• Содержание записи, регламентируемое правилами представления элементов данных и тесно связанное с п. 2.
В UNIMARC имеются средства связывания записей (не поддерживаемые некоторыми MARC-форматами), позволяющие устанавливать связи между библиографическими записями, такими, как описание статьи и описание журнала, в котором она опубликована, или между записями авторитетных файлов и библиографическими записями [53, с. 34].
Формат постоянно дорабатывается и совершенствуется. Создан Постоянный комитет по UNIMARC, на который возложена обязанность контроля над развитием и ведением формата. При ведении формата особое внимание уделяется обеспечению совместимости вносимых изменений с ранее разработанными моделями, так чтобы записи, составленные до внесения изменений, не становились ошибочными.
У UNIMARC есть очевидные преимущества: наличие блока связей, наличие кодируемых полей, перекрестные ссылки, готовые словари, кроме того есть описание на русском языке (авторский коллектив под руководством А.Земскова и Я.Шрайберга), есть возможность получить консультации и методические указания (в Москве в ГПНТБ и в комитете по UNIMARC в IFLA) [1, с. 64].
1.3 Формат для представления библиографических данных
Формат для библиографических данных, разработан с целью получения каталогизированного описания в машиночитаемой форме. Объектом описания с его применением стали практически все виды документов. Он предусматривает получение основного и всех видов добавочных описаний, а также раскрытие содержания документа [23, с.58]
Формат призван быть посредником при осуществлении обмена библиографическими записями и способствовать решению следующих задач:
а. Улучшение доступности библиографической информации
б. Создание сводных каталогов
в. Сокращение затрат при каталогизации
Структура формата библиографических данных:
Российский коммуникативный формат, как и UNIMARC, реализует библиографическую запись в машиночитаемой форме в структуре международного стандарта ISO 2709. Каждая библиографическая запись, подготовленная для обмена, должна содержать:
— Маркер записи, состоящий из 24-х символов;
— Справочник, состоящий из 3-х цифровой метки для каждого поля данных, указания длины поля и позиции начального символа, относящегося к первому полю данных;
— Поля данных переменной длины, отделенные друг от друга разделителем поля.
Переменные поля. Поля данных переменной длины следуют за справочником и содержат библиографические данные (в отличие от данных общей обработки, содержащихся в маркере). Метки не содержатся в полях данных, а приводятся только в справочнике. Каждое подполе начинается с идентификатора подполя, который состоит из разделителя подполя и кода подполя (буквенного или цифрового символа), идентифицирующего подполе.
Поля, обязательные для всех записей:
001 Идентификатор записи
100 Данные общей обработки
801 Источник записи
Функциональные блоки формата:
001 Идентификатор записи:
Индикаторы: В соответствии с ISO 2709 это поле не имеет индикаторов.
005 Идентификатор версии:
Индикаторы: не определены
Подполя: Данные вводятся в формате стандарта ISO 8601-2004 для дат: ГГГГММДД
Пример: ##$a5-7744-0001-8$dб. ц.$910000 экз.
010 Международный стандартный номер книги (ISBN):
Индикаторы: не определены
021 Номер государственной регистрации:
Индикаторы: не определены
Пример: ##$a19970630d1995#### y0rusy0179####ca
100 Данные общей обработки:
Индикаторы: не определены
Подполя: $a Данные общей обработки; y= транслитерация не используется ca=
Индикаторы: 0- Документ на языке(ках) оригинала. Индикатор 2: # ( не определен)
Подполя: $a Язык текста, звукозаписи и т.д.
102 Страна публикации или производства:
Индикаторы: не определены
105 Поле кодированных данных: текстовые материалы, монографические:
Индикаторы: не определены
Подполя: $a Кодированные данные о монографическом текстовом документе
Пример: 1#$aКружок «Сочини сказку»$fТумина Л. Е.
200 Заглавие и сведения об ответственности:
Индикаторы: 0— Является точкой доступа. Индикатор 2: # (не определен)
Подполя: $a Основное заглавие; $f Первые сведения об ответственности
Пример: ##$aМосква$cИзд-во УЦ «Перспектива»$d1995
210 Публикация, распространение и др.:
Индикаторы: Индикатор 1: определяет является ли имя издателя, распространителя, место и дата издания, записанные в поле # не применимо. Индикатор 2: определяет тип публикации\ производства #- документ произведен в определенном количестве экземпляров
Пример: ##$a373 с.$cил.$d20 см$eприл. (1 л. ил.)
215 Физическая характеристика:
Индикаторы: не определены
Подполя: $a Специфическое обозначение материала и объем; $c Содержит сведения об иллюстрациях, материале, из которого изготовлен объект описания; $d Размеры;
$e Сопроводительный материал
Пример: ##$aЗагл. обл.: Сочини сказку
300 Общие примечания:
Индикаторы: не определены
Пример: ##$aБиблиогр.: с. 365-373
320 Примечания о наличии в документе библиографии / указателя:
Индикаторы: не определены
Пример: 1#$aСочини сказку
512 Заглавие обложки:
Индикаторы: 1- Заглавие является точкой доступа. Индикатор 2: # (не определен)
Подобные документы
Редактирование аналоговых и цифровых изображений. Описание графических форматов файла. Алгоритм отображения файла и реализации эффектов. Программа для работы с графическими форматами. Назначение и взаимодействие модулей. Перечень процедур и функций.
курсовая работа [516,8 K], добавлен 28.05.2013
Изучение базовых команд ПК на базе МП i286 и их форматов. Изучение прямых способов адресации данных. Наработка практических навыков работы с командами. Разработка регистровой модели выполнения операций передачи данных. Программа реализации команд.
контрольная работа [42,2 K], добавлен 12.03.2011
Растровые, векторные и комплексные графические форматы. Классификация графических форматов по допустимому объему данных, параметрам изображения, хранению палитры и методике сжатия. Разновидности метода Фурье. Метод преобразования Karhunen-Loeve.
курсовая работа [46,0 K], добавлен 22.12.2014
Анализ двоичной, восьмеричной и шестнадцатеричной систем счисления и перевода десятичных чисел. Форматы хранения чисел с плавающей точкой. Программа для преобразования массива констант в формат числа с плавающей точкой на эмуляторе микро-ЭВМ СМ-1800.
курсовая работа [266,9 K], добавлен 24.12.2013
Общая характеристика растровых и векторных графических форматов: поддержка графическими редакторами, применение и отличия друг от друга. Специфика алгоритмов кодирования данных в исследуемых форматах, их совместимость с программным обеспечением.
презентация [25,2 K], добавлен 06.01.2014