Что означает английское сокращение ocr в информатике
Что означает английское сокращение ocr в информатике
Смотреть что такое «OCR» в других словарях:
OCR-A — Schriftart OCR A Kategorie Grotesk Erstellung … Deutsch Wikipedia
OCR-B — Schriftart OCR B Kategorie Grotesk … Deutsch Wikipedia
OCR-B — Category Sans serif Designer(s) Adrian Frutiger Date released 1968 The OCR B is a set of mono … Wikipedia
OCR-B — OCR B, eine 1968 entworfene Schrift zur maschinellen optischen Zeichenerkennung (OCR). Im Unterschied zur OCR A Schrift ist die Linienführung runder, wodurch die Schrift für das menschliche Auge leichter lesbar ist, einem OCR Programm aber… … Universal-Lexikon
OCR-A — OCR A, eine 1968 entworfene Schrift zur maschinellen optischen Zeichenerkennung (OCR). Die Schrift wirkt durch ihre kantige Linienführung sehr technisch, ist aber für OCR Programme leicht zu interpretieren. Man findet sie beispielsweise in der… … Universal-Lexikon
OCR-H — OCR H, eine Schrift zur maschinellen optischen Zeichenerkennung (OCR), die als Vergleichsgrundlage für handgeschriebene Blockschrift eingesetzt wird. Ein OCR Programm vergleicht dabei die eingelesenen Zeichen mit der OCR Schrift und kann so… … Universal-Lexikon
OCR — noun COMPUTING optical character recognition; a computer system for automatically recognizing letters and numbers that have been printed or written by hand on paper: • the scanner s built in OCR software * * * OCR UK US /ˌəʊsiːˈɑːr/ noun [U] IT ► … Financial and business terms
OCR — may refer to: Optical character recognition, conversion of images of text into characters The OCR A font, designed to simplify character recognition The similar OCR B font Transvaginal oocyte retrieval, a technique used in in vitro fertilization… … Wikipedia
.ocr — ocr, von einigen Programmen zum Fax oder Bildschirmdruck erzeugte Dateierweiterung, die anzeigt, dass diese Datei mit einem Zeichenerkennungsprogramm (OCR) bearbeitet werden kann … Universal-Lexikon
OCR — DEFINICIJA krat. inform. postupak kojim računalo prepoznaje slova, znakove i brojke skenirane optičkim čitačem u obliku slike [OCR softver] ETIMOLOGIJA engl. Optical Character Recognition … Hrvatski jezični portal
OCR — sigla ES ingl. Optical Character Recognition, lettura ottica di caratteri … Dizionario italiano
Что означает английское сокращение ocr в информатике
1 OCR-A
2 OCR-B
3 OCR
Тематики
масляный автоматический выключатель с устройством повторного включения
—
[Я.Н.Лугинский, М.С.Фези-Жилинская, Ю.С.Кабиров. Англо-русский словарь по электротехнике и электроэнергетике, Москва]
Тематики
Тематики
оптическое распознавание символов
Системы оптического распознавания символов, предназначенные для автоматического ввода документов в ПК. Это может быть книга, газета, журнал, факс – любой документ, который надо перевести в электронный формат.
[ http://www.morepc.ru/dict/]
Тематики
оптическое устройство (для) считывания
—
[Е.С.Алексеев, А.А.Мячев. Англо-русский толковый словарь по системотехнике ЭВМ. Москва 1993]
Тематики
распознавание оптических знаков
Распознавание знаков, использующее оптические средства для идентификации графических знаков.
[ ГОСТ 25868-91]
Тематики
ядерный реактор с органическим теплоносителем
—
[А.С.Гольдберг. Англо-русский энергетический словарь. 2006 г.]
Тематики
4 OCR
5 OCR
6 OCR
7 ocr
8 ocr
9 OCR
10 OCR
11 ocr
12 OCR
13 OCR
14 OCR
15 OCR
16 OCR V2
17 OCR/CS
18 OCR
19 OCR
20 OCR
См. также в других словарях:
OCR-A — Schriftart OCR A Kategorie Grotesk Erstellung … Deutsch Wikipedia
OCR-B — Schriftart OCR B Kategorie Grotesk … Deutsch Wikipedia
OCR-B — Category Sans serif Designer(s) Adrian Frutiger Date released 1968 The OCR B is a set of mono … Wikipedia
OCR-B — OCR B, eine 1968 entworfene Schrift zur maschinellen optischen Zeichenerkennung (OCR). Im Unterschied zur OCR A Schrift ist die Linienführung runder, wodurch die Schrift für das menschliche Auge leichter lesbar ist, einem OCR Programm aber… … Universal-Lexikon
OCR-A — OCR A, eine 1968 entworfene Schrift zur maschinellen optischen Zeichenerkennung (OCR). Die Schrift wirkt durch ihre kantige Linienführung sehr technisch, ist aber für OCR Programme leicht zu interpretieren. Man findet sie beispielsweise in der… … Universal-Lexikon
OCR-H — OCR H, eine Schrift zur maschinellen optischen Zeichenerkennung (OCR), die als Vergleichsgrundlage für handgeschriebene Blockschrift eingesetzt wird. Ein OCR Programm vergleicht dabei die eingelesenen Zeichen mit der OCR Schrift und kann so… … Universal-Lexikon
OCR — noun COMPUTING optical character recognition; a computer system for automatically recognizing letters and numbers that have been printed or written by hand on paper: • the scanner s built in OCR software * * * OCR UK US /ˌəʊsiːˈɑːr/ noun [U] IT ► … Financial and business terms
OCR — may refer to: Optical character recognition, conversion of images of text into characters The OCR A font, designed to simplify character recognition The similar OCR B font Transvaginal oocyte retrieval, a technique used in in vitro fertilization… … Wikipedia
.ocr — ocr, von einigen Programmen zum Fax oder Bildschirmdruck erzeugte Dateierweiterung, die anzeigt, dass diese Datei mit einem Zeichenerkennungsprogramm (OCR) bearbeitet werden kann … Universal-Lexikon
OCR — DEFINICIJA krat. inform. postupak kojim računalo prepoznaje slova, znakove i brojke skenirane optičkim čitačem u obliku slike [OCR softver] ETIMOLOGIJA engl. Optical Character Recognition … Hrvatski jezični portal
OCR — sigla ES ingl. Optical Character Recognition, lettura ottica di caratteri … Dizionario italiano
Update
Медиа о технологиях в бизнесе
Что такое OCR и как оно помогает ускорить бизнес-процессы
Технология оптического распознавания символов (OCR) умеет преобразовывать бумажные документы в доступный для чтения и редактирования формат. Также OCR упрощает рутину бухгалтеров, юристов и HR-сотрудников: может распознать документы и перенести информацию в учетные системы.
Как компьютер распознает текст
OCR (англ. optical character recognition) — технология автоматического анализа текста и превращения его в данные, которые может обработать компьютер. Человек распознает символы с помощью глаз и мозга. Компьютер использует камеру сканера, которая создает графическое изображение текстовой страницы. Для компьютера нет разницы между сканом текстового документа и фотографией: и то, и другое — набор пикселей.
Человек легко поймет, что на картинке изображен текст. Для компьютера есть два способа: распознавать символы целостно, то есть распознавать паттерн, или выделять отдельные черты, из которых состоит символ — выявлять признаки.
Метод распознавания паттерна
В 1968 году компания American Type Founders, которая с конца 19 века занималась созданием печатных шрифтов, придумала шрифт OCR-A с буквами одинаковой ширины. В основном шрифт использовали в банковских чеках, а для его чтения компьютером было создано специальное программное обеспечение.
Поскольку шрифт был стандартизирован, его распознавание стало относительно простой задачей. Программы «знали» OCR-A и могли переводить информацию с чеков в машиночитаемую форму. Однако в случае ошибки живой человек мог вмешаться в процесс и также прочитать банковский чек. Следующим шагом стало обучение программ OCR распознавать символы еще в нескольких самых распространенных шрифтах.
Выявление признаков
Этот способ еще называют интеллектуальным распознаванием символов — ICR. Программа, работающая с выявлением паттернов, не сможет определить символы, если шрифты ей неизвестны. Вместо распознавания паттерна ICR выделяет характерные индивидуальные черты, из которых состоит символ.
Большинство современных OCR-программ работают по этому принципу. Чаще всего в них используются классификаторы на основе машинного обучения, но в последнее время некоторые OCR-системы перешли на нейронные сети.
Что делать с рукописным вводом
Задачу с рукописным текстом для компьютера иногда упрощают. Например, просят писать почтовый индекс в специальном месте на конверте особым шрифтом. Формы для дальнейшей обработки компьютером имеют отдельные поля, которые просят заполнять печатными буквами.
Планшеты и смартфоны, которые поддерживают рукописный ввод, часто используют принцип выявления признаков. При написании определенной буквы экран устройства распознает, что сначала человек написал одну линию, потом вторую. Компьютеру помогает то, что все признаки появляются последовательно, в отличие от варианта, когда весь текст уже написан от руки на бумаге.
Шаги распознавания текста
Чем лучше качество исходного текста на бумаге, тем лучше качество распознавания. Первый этап — создание черно-белой или серой копии. Если все прошло без ошибок, то все черное — это символы, а все белое — фон. Хорошие OCR-программы автоматически отмечают трудные элементы: колонки, таблицы или картинки. Все OCR-программы распознают текст последовательно, символ за символом, словом за словом и строчка за строчкой.
Сначала OCR-программа объединяет пиксели в буквы, а буквы — в вероятные комбинации, затем система сопоставляет их со словарем. Если комбинация букв находится, то она отмечается как распознанное слово. Если нет — программа подставляет наиболее вероятный вариант.
Чему еще можно обучить OCR-систему
В крупных компаниях за подготовку актов, счетов и судебных исков отвечают сотрудники, но развитие машинного обучения и нейронных сетей позволили автоматизировать деятельность бухгалтеров и юристов. Современные OCR-системы ушли гораздо дальше, чем распознавание символов, и стали основой для целой индустрии Legal Tech — цифровых продуктов, ориентированных на бизнес с большим количеством типовых юридических и бухгалтерских процессов. Вряд ли машина сможет в скором времени заменить бэк-офис, но современные решения значительно оптимизируют его работу.
Например, сервис «Цифровой бэк-офис» от МегаФона может собирать типовую документацию с помощью конструктора, выделять нужную информацию из первичной документации и генерировать ответы на запросы госорганов. Процесс идентичен тому, что происходит в обычном офисе юриста, только вместо живого человека — чат-бот, который собирает информацию и выдает готовый документ. Главные преимущества — отсутствие ошибок «человеческого фактора» и скорость подготовки документов: время сокращается с привычных 30 до 5 минут.
Также функция по распознаванию первичной документации может быстро перенести нужную информацию из актов и счетов-фактур в учетные системы. OCR-система получает типовой документ на входе и генерирует ответ в нужной форме. Например, «Судебная платформа» в «Цифровом бэк-офисе» МегаФона может работать в таком режиме с запросами от госорганов, претензиями и судебными исками. На подготовку отзыва системе понадобится всего около 20 секунд.
Что означает английское сокращение ocr в информатике
оптическое распознавание символов
OCR: übersetzungOptical Character Recognition (engl.); Texterkennung; optische Zeichenerkennung * * * OCR 〈Abk. für engl.〉 Optical Character Recognitio. смотреть
OCR: translation OCR OCR noun COMPUTING optical character recognition; a computer system for automatically recognizing letters and numbers. смотреть
• Bar code scanner: Abbr. • Bar-code reader: Abbr. • Data proc. syst. • Data-entry means: abbr. • Elec. text-reading method • Mail sorting utility: Ab. смотреть
орг.1) комп. сокр. от optical character recognition2) гос. упр., амер. сокр. от Office for Civil Rights3) банк., австр., новозел. сокр. от official cas. смотреть
1) (Optical Character Recognition) оптическое распознавание символов автоматическое распознавание с помощью специальных программ графических изображений символов печатного текста (например, введённого в компьютер с помощью сканера) и преобразование их в формат, пригодный для обработки текстовыми процессорами, редакторами текстов и т.д. см. тж. character recognition, handwriting recognition, ICR, scanner 2) (Optical Character Reader) устройство оптического распознавания символов, или автоматического чтения текста. смотреть
1) сокр. от optical card reader оптическое устройство считывания с перфокарт 2) сокр. от optical card reading оптическое считывание перфокарт 3) сокр. от optical character reader оптическое устройство считывания знаков, оптическое устройство для считывания знаков, устройство оптического считывания знаков, устройство для оптического считывания знаков 4) сокр. от optical character recognition оптическое распознавание знаков. смотреть
1) сокр. от optical card reader оптическое устройство считывания с перфокарт 2) сокр. от optical card reading оптическое считывание перфокарт 3) сокр. от optical character reader оптическое устройство считывания знаков, оптическое устройство для считывания знаков, устройство оптического считывания знаков, устройство для оптического считывания знаков 4) сокр. от optical character recognition оптическое распознавание знаков. смотреть
англ.; сокр. от optical character readerоптическое устройство (для) считывания знаков
OCR — (Optical Character Recognition) Система автоматического распознавания текста, введенного в компьютер через сканер в виде графического изображения
см. Optical Character Recognition. Краткий толковый словарь по полиграфии.2010.
OCR: translationOffice of Collateral Responsibility
сокр. от optical character recognition оптическое распознавание символов
Optical Character Recognition оптическое распознавание символов
см. optical character recognition
n. автоматическое чтение печатного материала
див. «optical character recognition»
OCR OPTICAL CHARACTER RECOGNITION
OCR Optical Character Recognition noun автоматическое распознавание текста
OCR PAGE READER
Оптическое читающее устройство для чтения полной страницы
OCR PAGE READER
Оптическое читающее устройство для чтения полной страницы. Краткий толковый словарь по полиграфии.2010.
OCR PROGRAM
OCR PROGRAM
OCR SCANNER
Оптическое читающее устройство
OCR SCANNER
Оптическое читающее устройство. Краткий толковый словарь по полиграфии.2010.
Помогите прочитать, что здесь написано? (OCR)
Тонны архивных бумаг, чеков и счетов проходят сканирование и оцифровку во многих отраслях: в розничной торговле, логистике, банковских услугах и т.п. Компании получают конкурентное преимущество, если быстро оцифровывают и находят нужную информацию.
В 2020 году нам тоже пришлось решать проблему качественной оцифровки документов, и над этим проектом мы с коллегами работали совместно с компанией Verigram. Вот как мы проводили оцифровку документов на примере заказа клиентом SIM-карты прямо из дома.
Оцифровка позволила нам автоматически заполнять юридические документы и заявки на услуги, а также открыла доступ к аналитике фискальных чеков, отслеживанию динамики цен и суммарных трат.
Для преобразования различных типов документов (отсканированные документы, PDF-файлы или фото с цифровой камеры) в редактируемые форматы с возможностью поиска мы используем технологию оптического распознавания символов – Optical Character Recognition (OCR).
Работа со стандартными документами: постановка задачи
Заказ SIM-карты для пользователя выглядит так:
пользователь решает заказать SIM-карту;
фотографирует удостоверение личности для автоматического заполнения анкеты;
курьер доставляет SIM-карту.
Важно: пользователь фотографирует удостоверение личности своим смартфоном со специфическим разрешением камеры, качеством, архитектурой и другими особенностями. А на выходе мы получаем текстовое представление информации загруженного изображения.
Цель проекта OCR: построить быструю и точную кросc-платформенную модель, занимающую небольшой объем памяти на устройстве.
Верхнеуровневая последовательность обработки изображения стандартного документа выглядит так:
Выделяются границы документа, исключая не интересующий нас фон и исправляя перспективу изображения документа.
Выделяются интересующие нас поля: имя, фамилия, год рождения и т.п. На их основе можно построить модель предсказания соответствующего текстового представления для каждого поля.
Post-processing: модель вычищает предсказанный текст.
Локализация границ документа
Загруженное с камеры устройства изображение документа сравнивается с набором заранее подготовленных масок стандартных документов: фронтальная или задняя часть удостоверения, документ нового или старого образца, страницы паспорта или водительские права.
Предварительно делаем pre-processing обработку изображения и в результате ряда морфологических операций получаем соответствующее бинарное (черно-белое) представление.
Техника работает так: в каждом типе документа есть фиксированные поля, не меняющиеся по ширине и высоте. Например, название документа в правом верхнем углу как на картинке ниже. Они служат опорными полями, от которых рассчитывается расстояние до других полей документа. Если количество обнаруженных полей от опорного выше определенного порога для проверочной маски, мы останавливаемся на ней. Так подбирается подходящая маска.
Так выглядит подбор подходящей маски
исправляется перспектива изображения;
определяется тип документа;
изображение обрезается по найденной маске c удалением фона.
В нашем примере мы выявили, что загруженное фото — это фронтальная часть удостоверения личности Республики Казахстан образца позднее 2014 года. Зная координаты полей, соответствующие этой маске, мы их локализуем и вырезаем для дальнейшей обработки.
Следующий этап — распознавание текста. Но перед этим расскажу, как происходит сбор данных для обучения модели.
Распознавание текста
Данные для обучения
Мы подготавливаем данные для обучения одним из следующих способов.
Первый способ используется, если достаточно реальных данных. Тогда мы выделяем и маркируем поля с помощью аннотационного инструмента CVAT. На выходе получаем XML-файл с названием полей и их атрибутами. Если вернуться к примеру, для обучения модели по распознаванию текста, на вход подаются всевозможные локализованные поля и их соответствующие текстовые представления, считающиеся истинными.
Но чаще всего реальных данных недостаточно или полученный набор не содержит весь словарь символов (например, в реальных данных могут не употребляться некоторые буквы вроде «ъ» или «ь»). Чтобы получить большой набор бесплатных данных и избежать ошибок аннотаторов при заполнении, можно создать синтетические данные с аугментацией.
Сначала генерируем рандомный текст на основе интересующего нас словаря (кириллица, латиница и т.п.) на белом фоне, накладываем на каждый текст 2D-трансформации (повороты, сдвиги, масштабирование и их комбинации), а затем склеиваем их в слово или текст. Другими словами, синтезируем текст на картинке.
Примеры 2D-трансформаций
Показательный пример 2D-трансформации представлен в библиотеке для Python Text-Image-Augmentation-python. На вход подается произвольное изображение (слева), к которому могут применяться разные виды искажений.
Применяем разные виды искажений
Дисторсия, перспектива и растяжение изображения с помощью библиотеки Text-Image-Augmentation-python
После 2D-трансформации на изображение текста добавляются композитные эффекты аугментации: блики, размытия, шумы в виде линий и точек, фон и прочее.
Пример изображений в сформированной нами обучающей выборке на основе применения аугментации
Так можно создать обучающую выборку.
Обучающая выборка
Распознавание текста
Следующий этап — распознавание текста стандартного документа. Мы уже подобрали маску и вырезали поля с текстовой информацией. Дальше можно действовать одним из двух способов: сегментировать символы и распознавать каждый по отдельности или предсказывать текст целиком.
Посимвольное распознавание текста
В этом методе строится две модели. Первая сегментирует буквы: находит начало и конец каждого символа на изображении. Вторая модель распознает каждый символ по отдельности, а затем склеивает все символы.
Предсказывание локального текста без сегментации (end-2-end-решение)
Мы использовали второй вариант — распознавание текста без сегментирования на буквы, потому что этот метод оказался для нас менее трудозатратным и более производительным.
В теории, создается нейросетевая модель, которая выдает копию текста, изображение которого подается на вход. Так как текст на изображении может быть написан от руки, искажен, растянут или сжат, символы на выходе модели могут дублироваться.
Отличие результатов распознавания реальной и идеальной модели
Чтобы обойти проблему дублирования символов, добавим спецсимвол, например «-», в словарь. На этапе обучения каждое текстовое представление кодируется по следующим правилам декодировки:
два и более повторяющихся символа, встретившиеся до следующего спецсимвола, удаляются, остается только один;
повторение спецсимвола удаляется.
Так во время тренировочного процесса на вход подается изображение, которое проходит конволюционный и рекуррентный слои, после чего создается матрица вероятностей встречаемости символов на каждом шаге.
Истинное значение получает различные представления с соответствующей вероятностью за счет СТС-кодировки. Задача обучения — максимизировать сумму всех представлений истинного значения. После распознавания текста и выбора его представления проводится декодировка, описанная выше.
Архитектура модели по распознаванию текста
Мы попробовали обучить модель на разных архитектурах нейросетей с использованием и без использования рекуррентных слоев по схеме, описанной выше. В итоге остановились на варианте без использования рекуррентных слоев. Также для придания ускорения inference части, мы использовали идеи сетей MobileNet разных версий. Граф нашей модели выглядел так:
Схема итоговой модели
Методы декодирования
Хочу выделить два наиболее распространенных метода декодирования: CTC_Greedy_Decoder и Beam_Search.
CTC_Greedy_Decoder-метод на каждом шаге берет индекс, с наибольшей вероятностью соответствующий определенному символу. После чего удаляются дублирующиеся символы и спецсимвол, заданный при тренировке.
Метод «Beam_Search» — лучевой алгоритм, в основании которого лежит принцип: следующий предсказанный символ зависит от предыдущего предсказанного символа. Условные вероятности совстречаемости символов максимизируются и выводится итоговый текст.
Post-processing
Есть вероятность, что в продакшене при скоринге на новых данных модель может ошибаться. Нужно исключить такие моменты или заранее предупредить пользователя о том, что распознавание не получилось, и попросить переснять документ. В этом нам помогает простая процедура постобработки, которая может проверять на предсказание только ограниченного словаря для конкретного поля. Например, для числовых полей выдавать только число.
Другим примером постобработки являются поля с ограниченным набором значений, которые подбираются по словарю на основе редакторского расстояния. Проверка на допустимость значений: в поле даты рождения не могут быть даты 18 века.
Оптимизация модели
Техники оптимизации
На предыдущем этапе мы получили модель размером 600 килобайт, из-за чего распознавание были слишком медленным. Нужно было оптимизировать модель с фокусом на увеличение скорости распознавания текста и уменьшение размера.
В этом нам помогли следующие техники:
Квантование модели, при котором вычисления вещественных чисел переводятся в более быстрые целочисленные вычисления.
«Стрижка» (pruning) ненужных связей. Некоторые веса имеют маленькую магнитуду и оказывают малый эффект на предсказание, их можно обрезать.
Для увеличения скорости распознавания текста используются мобильные версии архитектур нейросеток, например, MobileNetV1 или MobileNetV2.
Так, в результате оптимизации мы получили снижение качества всего на 0,5 %, при этом скорость работы увеличилась в 6 раз, а размер модели снизился до 60 килобайт.
Вывод модели в продуктив
Процесс вывода модели в продуктив выглядит так:
Мы создаем 32-битную TensorFlow модель, замораживаем ее и сохраняем с дополнительными оптимизациями типа weight или unit pruning. Проводим дополнительное 8-битное квантование. После чего компилируем модель в Android- или iOS-библиотеку и деплоим ее в основной проект.
Рекомендации
На этапе развертывания задавайте статическое выделение тензоров в графе модели. Например, в нашем случае скорость увеличилась в два раза после указания фиксированного размера пакета (Batch size).
Не используйте LSTМ- и GRU-сети для обучения на синтетических данных, так как они проверяют совстречаемость символов. В случайно сгенерированных синтетических данных последовательность символов не соответствует реальной ситуации. Помимо этого они вызывают эффект уменьшения скорости, что важно для мобильных устройств, особенно для старых версий.
Аккуратно подбирайте шрифты для обучающей выборки. Подготовьте для вашего словаря набор шрифтов, допустимых для отрисовки интересующих символов. Например, шрифт OCR B Regular не подходит для кириллического словаря.
Пробуйте тренировать собственные модели, поскольку не все opensource-библиотеки могут подойти. Перед тем как тренировать собственные модели, мы пробовали Tesseract и ряд других решений. Так как мы планировали развертывать библиотеку на Android и iOS, их размер был слишком большим. Кроме того, качество распознавания этих библиотек было недостаточным.