Что означает английское сокращение ocr в информатике

Что означает английское сокращение ocr в информатике

Смотреть что такое «OCR» в других словарях:

OCR-A — Schriftart OCR A Kategorie Grotesk Erstellung … Deutsch Wikipedia

OCR-B — Schriftart OCR B Kategorie Grotesk … Deutsch Wikipedia

OCR-B — Category Sans serif Designer(s) Adrian Frutiger Date released 1968 The OCR B is a set of mono … Wikipedia

OCR-B — OCR B, eine 1968 entworfene Schrift zur maschinellen optischen Zeichenerkennung (OCR). Im Unterschied zur OCR A Schrift ist die Linienführung runder, wodurch die Schrift für das menschliche Auge leichter lesbar ist, einem OCR Programm aber… … Universal-Lexikon

OCR-A — OCR A, eine 1968 entworfene Schrift zur maschinellen optischen Zeichenerkennung (OCR). Die Schrift wirkt durch ihre kantige Linienführung sehr technisch, ist aber für OCR Programme leicht zu interpretieren. Man findet sie beispielsweise in der… … Universal-Lexikon

OCR-H — OCR H, eine Schrift zur maschinellen optischen Zeichenerkennung (OCR), die als Vergleichsgrundlage für handgeschriebene Blockschrift eingesetzt wird. Ein OCR Programm vergleicht dabei die eingelesenen Zeichen mit der OCR Schrift und kann so… … Universal-Lexikon

OCR — noun COMPUTING optical character recognition; a computer system for automatically recognizing letters and numbers that have been printed or written by hand on paper: • the scanner s built in OCR software * * * OCR UK US /ˌəʊsiːˈɑːr/ noun [U] IT ► … Financial and business terms

OCR — may refer to: Optical character recognition, conversion of images of text into characters The OCR A font, designed to simplify character recognition The similar OCR B font Transvaginal oocyte retrieval, a technique used in in vitro fertilization… … Wikipedia

.ocr — ocr, von einigen Programmen zum Fax oder Bildschirmdruck erzeugte Dateierweiterung, die anzeigt, dass diese Datei mit einem Zeichenerkennungsprogramm (OCR) bearbeitet werden kann … Universal-Lexikon

OCR — DEFINICIJA krat. inform. postupak kojim računalo prepoznaje slova, znakove i brojke skenirane optičkim čitačem u obliku slike [OCR softver] ETIMOLOGIJA engl. Optical Character Recognition … Hrvatski jezični portal

OCR — sigla ES ingl. Optical Character Recognition, lettura ottica di caratteri … Dizionario italiano

Источник

Что означает английское сокращение ocr в информатике

1 OCR-A

2 OCR-B

3 OCR

Тематики

масляный автоматический выключатель с устройством повторного включения

[Я.Н.Лугинский, М.С.Фези-Жилинская, Ю.С.Кабиров. Англо-русский словарь по электротехнике и электроэнергетике, Москва]

Тематики

Тематики

оптическое распознавание символов
Системы оптического распознавания символов, предназначенные для автоматического ввода документов в ПК. Это может быть книга, газета, журнал, факс – любой документ, который надо перевести в электронный формат.
[ http://www.morepc.ru/dict/]

Тематики

оптическое устройство (для) считывания

[Е.С.Алексеев, А.А.Мячев. Англо-русский толковый словарь по системотехнике ЭВМ. Москва 1993]

Тематики

распознавание оптических знаков
Распознавание знаков, использующее оптические средства для идентификации графических знаков.
[ ГОСТ 25868-91]

Тематики

ядерный реактор с органическим теплоносителем

[А.С.Гольдберг. Англо-русский энергетический словарь. 2006 г.]

Тематики

4 OCR

5 OCR

6 OCR

7 ocr

8 ocr

9 OCR

10 OCR

11 ocr

12 OCR

13 OCR

14 OCR

15 OCR

16 OCR V2

17 OCR/CS

18 OCR

19 OCR

20 OCR

См. также в других словарях:

OCR-A — Schriftart OCR A Kategorie Grotesk Erstellung … Deutsch Wikipedia

OCR-B — Schriftart OCR B Kategorie Grotesk … Deutsch Wikipedia

OCR-B — Category Sans serif Designer(s) Adrian Frutiger Date released 1968 The OCR B is a set of mono … Wikipedia

OCR-B — OCR B, eine 1968 entworfene Schrift zur maschinellen optischen Zeichenerkennung (OCR). Im Unterschied zur OCR A Schrift ist die Linienführung runder, wodurch die Schrift für das menschliche Auge leichter lesbar ist, einem OCR Programm aber… … Universal-Lexikon

OCR-A — OCR A, eine 1968 entworfene Schrift zur maschinellen optischen Zeichenerkennung (OCR). Die Schrift wirkt durch ihre kantige Linienführung sehr technisch, ist aber für OCR Programme leicht zu interpretieren. Man findet sie beispielsweise in der… … Universal-Lexikon

OCR-H — OCR H, eine Schrift zur maschinellen optischen Zeichenerkennung (OCR), die als Vergleichsgrundlage für handgeschriebene Blockschrift eingesetzt wird. Ein OCR Programm vergleicht dabei die eingelesenen Zeichen mit der OCR Schrift und kann so… … Universal-Lexikon

OCR — noun COMPUTING optical character recognition; a computer system for automatically recognizing letters and numbers that have been printed or written by hand on paper: • the scanner s built in OCR software * * * OCR UK US /ˌəʊsiːˈɑːr/ noun [U] IT ► … Financial and business terms

OCR — may refer to: Optical character recognition, conversion of images of text into characters The OCR A font, designed to simplify character recognition The similar OCR B font Transvaginal oocyte retrieval, a technique used in in vitro fertilization… … Wikipedia

.ocr — ocr, von einigen Programmen zum Fax oder Bildschirmdruck erzeugte Dateierweiterung, die anzeigt, dass diese Datei mit einem Zeichenerkennungsprogramm (OCR) bearbeitet werden kann … Universal-Lexikon

OCR — DEFINICIJA krat. inform. postupak kojim računalo prepoznaje slova, znakove i brojke skenirane optičkim čitačem u obliku slike [OCR softver] ETIMOLOGIJA engl. Optical Character Recognition … Hrvatski jezični portal

OCR — sigla ES ingl. Optical Character Recognition, lettura ottica di caratteri … Dizionario italiano

Источник

Update

Медиа о технологиях в бизнесе

Что такое OCR и как оно помогает ускорить бизнес-процессы

Технология оптического распознавания символов (OCR) умеет преобразовывать бумажные документы в доступный для чтения и редактирования формат. Также OCR упрощает рутину бухгалтеров, юристов и HR-сотрудников: может распознать документы и перенести информацию в учетные системы.

Что означает английское сокращение ocr в информатике. Смотреть фото Что означает английское сокращение ocr в информатике. Смотреть картинку Что означает английское сокращение ocr в информатике. Картинка про Что означает английское сокращение ocr в информатике. Фото Что означает английское сокращение ocr в информатике

Как компьютер распознает текст

OCR (англ. optical character recognition) — технология автоматического анализа текста и превращения его в данные, которые может обработать компьютер. Человек распознает символы с помощью глаз и мозга. Компьютер использует камеру сканера, которая создает графическое изображение текстовой страницы. Для компьютера нет разницы между сканом текстового документа и фотографией: и то, и другое — набор пикселей.

Человек легко поймет, что на картинке изображен текст. Для компьютера есть два способа: распознавать символы целостно, то есть распознавать паттерн, или выделять отдельные черты, из которых состоит символ — выявлять признаки.

Метод распознавания паттерна

В 1968 году компания American Type Founders, которая с конца 19 века занималась созданием печатных шрифтов, придумала шрифт OCR-A с буквами одинаковой ширины. В основном шрифт использовали в банковских чеках, а для его чтения компьютером было создано специальное программное обеспечение.

Поскольку шрифт был стандартизирован, его распознавание стало относительно простой задачей. Программы «знали» OCR-A и могли переводить информацию с чеков в машиночитаемую форму. Однако в случае ошибки живой человек мог вмешаться в процесс и также прочитать банковский чек. Следующим шагом стало обучение программ OCR распознавать символы еще в нескольких самых распространенных шрифтах.

Выявление признаков

Этот способ еще называют интеллектуальным распознаванием символов — ICR. Программа, работающая с выявлением паттернов, не сможет определить символы, если шрифты ей неизвестны. Вместо распознавания паттерна ICR выделяет характерные индивидуальные черты, из которых состоит символ.

Большинство современных OCR-программ работают по этому принципу. Чаще всего в них используются классификаторы на основе машинного обучения, но в последнее время некоторые OCR-системы перешли на нейронные сети.

Что делать с рукописным вводом

Задачу с рукописным текстом для компьютера иногда упрощают. Например, просят писать почтовый индекс в специальном месте на конверте особым шрифтом. Формы для дальнейшей обработки компьютером имеют отдельные поля, которые просят заполнять печатными буквами.

Планшеты и смартфоны, которые поддерживают рукописный ввод, часто используют принцип выявления признаков. При написании определенной буквы экран устройства распознает, что сначала человек написал одну линию, потом вторую. Компьютеру помогает то, что все признаки появляются последовательно, в отличие от варианта, когда весь текст уже написан от руки на бумаге.

Шаги распознавания текста

Чем лучше качество исходного текста на бумаге, тем лучше качество распознавания. Первый этап — создание черно-белой или серой копии. Если все прошло без ошибок, то все черное — это символы, а все белое — фон. Хорошие OCR-программы автоматически отмечают трудные элементы: колонки, таблицы или картинки. Все OCR-программы распознают текст последовательно, символ за символом, словом за словом и строчка за строчкой.

Сначала OCR-программа объединяет пиксели в буквы, а буквы — в вероятные комбинации, затем система сопоставляет их со словарем. Если комбинация букв находится, то она отмечается как распознанное слово. Если нет — программа подставляет наиболее вероятный вариант.

Чему еще можно обучить OCR-систему

В крупных компаниях за подготовку актов, счетов и судебных исков отвечают сотрудники, но развитие машинного обучения и нейронных сетей позволили автоматизировать деятельность бухгалтеров и юристов. Современные OCR-системы ушли гораздо дальше, чем распознавание символов, и стали основой для целой индустрии Legal Tech — цифровых продуктов, ориентированных на бизнес с большим количеством типовых юридических и бухгалтерских процессов. Вряд ли машина сможет в скором времени заменить бэк-офис, но современные решения значительно оптимизируют его работу.

Например, сервис «Цифровой бэк-офис» от МегаФона может собирать типовую документацию с помощью конструктора, выделять нужную информацию из первичной документации и генерировать ответы на запросы госорганов. Процесс идентичен тому, что происходит в обычном офисе юриста, только вместо живого человека — чат-бот, который собирает информацию и выдает готовый документ. Главные преимущества — отсутствие ошибок «человеческого фактора» и скорость подготовки документов: время сокращается с привычных 30 до 5 минут.

Также функция по распознаванию первичной документации может быстро перенести нужную информацию из актов и счетов-фактур в учетные системы. OCR-система получает типовой документ на входе и генерирует ответ в нужной форме. Например, «Судебная платформа» в «Цифровом бэк-офисе» МегаФона может работать в таком режиме с запросами от госорганов, претензиями и судебными исками. На подготовку отзыва системе понадобится всего около 20 секунд.

Источник

Что означает английское сокращение ocr в информатике

оптическое распознавание символов

OCR: übersetzungOptical Character Recognition (engl.); Texterkennung; optische Zeichenerkennung * * * OCR 〈Abk. für engl.〉 Optical Character Recognitio. смотреть

OCR: translation OCR OCR noun COMPUTING optical character recognition; a computer system for automatically recognizing letters and numbers. смотреть

• Bar code scanner: Abbr. • Bar-code reader: Abbr. • Data proc. syst. • Data-entry means: abbr. • Elec. text-reading method • Mail sorting utility: Ab. смотреть

орг.1) комп. сокр. от optical character recognition2) гос. упр., амер. сокр. от Office for Civil Rights3) банк., австр., новозел. сокр. от official cas. смотреть

1) (Optical Character Recognition) оптическое распознавание символов автоматическое распознавание с помощью специальных программ графических изображений символов печатного текста (например, введённого в компьютер с помощью сканера) и преобразование их в формат, пригодный для обработки текстовыми процессорами, редакторами текстов и т.д. см. тж. character recognition, handwriting recognition, ICR, scanner 2) (Optical Character Reader) устройство оптического распознавания символов, или автоматического чтения текста. смотреть

1) сокр. от optical card reader оптическое устройство считывания с перфокарт 2) сокр. от optical card reading оптическое считывание перфокарт 3) сокр. от optical character reader оптическое устройство считывания знаков, оптическое устройство для считывания знаков, устройство оптического считывания знаков, устройство для оптического считывания знаков 4) сокр. от optical character recognition оптическое распознавание знаков. смотреть

1) сокр. от optical card reader оптическое устройство считывания с перфокарт 2) сокр. от optical card reading оптическое считывание перфокарт 3) сокр. от optical character reader оптическое устройство считывания знаков, оптическое устройство для считывания знаков, устройство оптического считывания знаков, устройство для оптического считывания знаков 4) сокр. от optical character recognition оптическое распознавание знаков. смотреть

англ.; сокр. от optical character readerоптическое устройство (для) считывания знаков

OCR — (Optical Character Recognition) Система автоматического распознавания текста, введенного в компьютер через сканер в виде графического изображения

см. Optical Character Recognition. Краткий толковый словарь по полиграфии.2010.

OCR: translationOffice of Collateral Responsibility

сокр. от optical character recognition оптическое распознавание символов

Optical Character Recognition оптическое распознавание символов

см. optical character recognition

n. автоматическое чтение печатного материала

див. «optical character recognition»

OCR OPTICAL CHARACTER RECOGNITION

OCR Optical Character Recognition noun автоматическое распознавание текста

OCR PAGE READER

Оптическое читающее устройство для чтения полной страницы

OCR PAGE READER

Оптическое читающее устройство для чтения полной страницы. Краткий толковый словарь по полиграфии.2010.

OCR PROGRAM

OCR PROGRAM

OCR SCANNER

Оптическое читающее устройство

OCR SCANNER

Оптическое читающее устройство. Краткий толковый словарь по полиграфии.2010.

Источник

Помогите прочитать, что здесь написано? (OCR)

Тонны архивных бумаг, чеков и счетов проходят сканирование и оцифровку во многих отраслях: в розничной торговле, логистике, банковских услугах и т.п. Компании получают конкурентное преимущество, если быстро оцифровывают и находят нужную информацию.

В 2020 году нам тоже пришлось решать проблему качественной оцифровки документов, и над этим проектом мы с коллегами работали совместно с компанией Verigram. Вот как мы проводили оцифровку документов на примере заказа клиентом SIM-карты прямо из дома.

Оцифровка позволила нам автоматически заполнять юридические документы и заявки на услуги, а также открыла доступ к аналитике фискальных чеков, отслеживанию динамики цен и суммарных трат.

Для преобразования различных типов документов (отсканированные документы, PDF-файлы или фото с цифровой камеры) в редактируемые форматы с возможностью поиска мы используем технологию оптического распознавания символов – Optical Character Recognition (OCR).

Что означает английское сокращение ocr в информатике. Смотреть фото Что означает английское сокращение ocr в информатике. Смотреть картинку Что означает английское сокращение ocr в информатике. Картинка про Что означает английское сокращение ocr в информатике. Фото Что означает английское сокращение ocr в информатике

Работа со стандартными документами: постановка задачи

Заказ SIM-карты для пользователя выглядит так:

пользователь решает заказать SIM-карту;

фотографирует удостоверение личности для автоматического заполнения анкеты;

курьер доставляет SIM-карту.

Что означает английское сокращение ocr в информатике. Смотреть фото Что означает английское сокращение ocr в информатике. Смотреть картинку Что означает английское сокращение ocr в информатике. Картинка про Что означает английское сокращение ocr в информатике. Фото Что означает английское сокращение ocr в информатике

Важно: пользователь фотографирует удостоверение личности своим смартфоном со специфическим разрешением камеры, качеством, архитектурой и другими особенностями. А на выходе мы получаем текстовое представление информации загруженного изображения.

Цель проекта OCR: построить быструю и точную кросc-платформенную модель, занимающую небольшой объем памяти на устройстве.

Что означает английское сокращение ocr в информатике. Смотреть фото Что означает английское сокращение ocr в информатике. Смотреть картинку Что означает английское сокращение ocr в информатике. Картинка про Что означает английское сокращение ocr в информатике. Фото Что означает английское сокращение ocr в информатике

Верхнеуровневая последовательность обработки изображения стандартного документа выглядит так:

Выделяются границы документа, исключая не интересующий нас фон и исправляя перспективу изображения документа.

Выделяются интересующие нас поля: имя, фамилия, год рождения и т.п. На их основе можно построить модель предсказания соответствующего текстового представления для каждого поля.

Post-processing: модель вычищает предсказанный текст.

Что означает английское сокращение ocr в информатике. Смотреть фото Что означает английское сокращение ocr в информатике. Смотреть картинку Что означает английское сокращение ocr в информатике. Картинка про Что означает английское сокращение ocr в информатике. Фото Что означает английское сокращение ocr в информатике

Локализация границ документа

Загруженное с камеры устройства изображение документа сравнивается с набором заранее подготовленных масок стандартных документов: фронтальная или задняя часть удостоверения, документ нового или старого образца, страницы паспорта или водительские права.

Что означает английское сокращение ocr в информатике. Смотреть фото Что означает английское сокращение ocr в информатике. Смотреть картинку Что означает английское сокращение ocr в информатике. Картинка про Что означает английское сокращение ocr в информатике. Фото Что означает английское сокращение ocr в информатике

Предварительно делаем pre-processing обработку изображения и в результате ряда морфологических операций получаем соответствующее бинарное (черно-белое) представление.

Техника работает так: в каждом типе документа есть фиксированные поля, не меняющиеся по ширине и высоте. Например, название документа в правом верхнем углу как на картинке ниже. Они служат опорными полями, от которых рассчитывается расстояние до других полей документа. Если количество обнаруженных полей от опорного выше определенного порога для проверочной маски, мы останавливаемся на ней. Так подбирается подходящая маска.

Что означает английское сокращение ocr в информатике. Смотреть фото Что означает английское сокращение ocr в информатике. Смотреть картинку Что означает английское сокращение ocr в информатике. Картинка про Что означает английское сокращение ocr в информатике. Фото Что означает английское сокращение ocr в информатикеТак выглядит подбор подходящей маски

исправляется перспектива изображения;

определяется тип документа;

изображение обрезается по найденной маске c удалением фона.

В нашем примере мы выявили, что загруженное фото — это фронтальная часть удостоверения личности Республики Казахстан образца позднее 2014 года. Зная координаты полей, соответствующие этой маске, мы их локализуем и вырезаем для дальнейшей обработки.

Что означает английское сокращение ocr в информатике. Смотреть фото Что означает английское сокращение ocr в информатике. Смотреть картинку Что означает английское сокращение ocr в информатике. Картинка про Что означает английское сокращение ocr в информатике. Фото Что означает английское сокращение ocr в информатике

Следующий этап — распознавание текста. Но перед этим расскажу, как происходит сбор данных для обучения модели.

Распознавание текста

Данные для обучения

Мы подготавливаем данные для обучения одним из следующих способов.

Первый способ используется, если достаточно реальных данных. Тогда мы выделяем и маркируем поля с помощью аннотационного инструмента CVAT. На выходе получаем XML-файл с названием полей и их атрибутами. Если вернуться к примеру, для обучения модели по распознаванию текста, на вход подаются всевозможные локализованные поля и их соответствующие текстовые представления, считающиеся истинными.

Что означает английское сокращение ocr в информатике. Смотреть фото Что означает английское сокращение ocr в информатике. Смотреть картинку Что означает английское сокращение ocr в информатике. Картинка про Что означает английское сокращение ocr в информатике. Фото Что означает английское сокращение ocr в информатике

Но чаще всего реальных данных недостаточно или полученный набор не содержит весь словарь символов (например, в реальных данных могут не употребляться некоторые буквы вроде «ъ» или «ь»). Чтобы получить большой набор бесплатных данных и избежать ошибок аннотаторов при заполнении, можно создать синтетические данные с аугментацией.

Сначала генерируем рандомный текст на основе интересующего нас словаря (кириллица, латиница и т.п.) на белом фоне, накладываем на каждый текст 2D-трансформации (повороты, сдвиги, масштабирование и их комбинации), а затем склеиваем их в слово или текст. Другими словами, синтезируем текст на картинке.

Что означает английское сокращение ocr в информатике. Смотреть фото Что означает английское сокращение ocr в информатике. Смотреть картинку Что означает английское сокращение ocr в информатике. Картинка про Что означает английское сокращение ocr в информатике. Фото Что означает английское сокращение ocr в информатикеПримеры 2D-трансформаций

Показательный пример 2D-трансформации представлен в библиотеке для Python Text-Image-Augmentation-python. На вход подается произвольное изображение (слева), к которому могут применяться разные виды искажений.

Что означает английское сокращение ocr в информатике. Смотреть фото Что означает английское сокращение ocr в информатике. Смотреть картинку Что означает английское сокращение ocr в информатике. Картинка про Что означает английское сокращение ocr в информатике. Фото Что означает английское сокращение ocr в информатикеПрименяем разные виды искажений Что означает английское сокращение ocr в информатике. Смотреть фото Что означает английское сокращение ocr в информатике. Смотреть картинку Что означает английское сокращение ocr в информатике. Картинка про Что означает английское сокращение ocr в информатике. Фото Что означает английское сокращение ocr в информатике Что означает английское сокращение ocr в информатике. Смотреть фото Что означает английское сокращение ocr в информатике. Смотреть картинку Что означает английское сокращение ocr в информатике. Картинка про Что означает английское сокращение ocr в информатике. Фото Что означает английское сокращение ocr в информатике Что означает английское сокращение ocr в информатике. Смотреть фото Что означает английское сокращение ocr в информатике. Смотреть картинку Что означает английское сокращение ocr в информатике. Картинка про Что означает английское сокращение ocr в информатике. Фото Что означает английское сокращение ocr в информатикеДисторсия, перспектива и растяжение изображения с помощью библиотеки Text-Image-Augmentation-python

После 2D-трансформации на изображение текста добавляются композитные эффекты аугментации: блики, размытия, шумы в виде линий и точек, фон и прочее.

Что означает английское сокращение ocr в информатике. Смотреть фото Что означает английское сокращение ocr в информатике. Смотреть картинку Что означает английское сокращение ocr в информатике. Картинка про Что означает английское сокращение ocr в информатике. Фото Что означает английское сокращение ocr в информатикеПример изображений в сформированной нами обучающей выборке на основе применения аугментации

Так можно создать обучающую выборку.

Что означает английское сокращение ocr в информатике. Смотреть фото Что означает английское сокращение ocr в информатике. Смотреть картинку Что означает английское сокращение ocr в информатике. Картинка про Что означает английское сокращение ocr в информатике. Фото Что означает английское сокращение ocr в информатикеОбучающая выборка

Распознавание текста

Следующий этап — распознавание текста стандартного документа. Мы уже подобрали маску и вырезали поля с текстовой информацией. Дальше можно действовать одним из двух способов: сегментировать символы и распознавать каждый по отдельности или предсказывать текст целиком.

Посимвольное распознавание текста

Что означает английское сокращение ocr в информатике. Смотреть фото Что означает английское сокращение ocr в информатике. Смотреть картинку Что означает английское сокращение ocr в информатике. Картинка про Что означает английское сокращение ocr в информатике. Фото Что означает английское сокращение ocr в информатике

В этом методе строится две модели. Первая сегментирует буквы: находит начало и конец каждого символа на изображении. Вторая модель распознает каждый символ по отдельности, а затем склеивает все символы.

Предсказывание локального текста без сегментации (end-2-end-решение)

Что означает английское сокращение ocr в информатике. Смотреть фото Что означает английское сокращение ocr в информатике. Смотреть картинку Что означает английское сокращение ocr в информатике. Картинка про Что означает английское сокращение ocr в информатике. Фото Что означает английское сокращение ocr в информатике

Мы использовали второй вариант — распознавание текста без сегментирования на буквы, потому что этот метод оказался для нас менее трудозатратным и более производительным.

В теории, создается нейросетевая модель, которая выдает копию текста, изображение которого подается на вход. Так как текст на изображении может быть написан от руки, искажен, растянут или сжат, символы на выходе модели могут дублироваться.

Что означает английское сокращение ocr в информатике. Смотреть фото Что означает английское сокращение ocr в информатике. Смотреть картинку Что означает английское сокращение ocr в информатике. Картинка про Что означает английское сокращение ocr в информатике. Фото Что означает английское сокращение ocr в информатикеОтличие результатов распознавания реальной и идеальной модели

Чтобы обойти проблему дублирования символов, добавим спецсимвол, например «-», в словарь. На этапе обучения каждое текстовое представление кодируется по следующим правилам декодировки:

два и более повторяющихся символа, встретившиеся до следующего спецсимвола, удаляются, остается только один;

повторение спецсимвола удаляется.

Что означает английское сокращение ocr в информатике. Смотреть фото Что означает английское сокращение ocr в информатике. Смотреть картинку Что означает английское сокращение ocr в информатике. Картинка про Что означает английское сокращение ocr в информатике. Фото Что означает английское сокращение ocr в информатике

Так во время тренировочного процесса на вход подается изображение, которое проходит конволюционный и рекуррентный слои, после чего создается матрица вероятностей встречаемости символов на каждом шаге.

Что означает английское сокращение ocr в информатике. Смотреть фото Что означает английское сокращение ocr в информатике. Смотреть картинку Что означает английское сокращение ocr в информатике. Картинка про Что означает английское сокращение ocr в информатике. Фото Что означает английское сокращение ocr в информатике

Истинное значение получает различные представления с соответствующей вероятностью за счет СТС-кодировки. Задача обучения — максимизировать сумму всех представлений истинного значения. После распознавания текста и выбора его представления проводится декодировка, описанная выше.

Архитектура модели по распознаванию текста

Мы попробовали обучить модель на разных архитектурах нейросетей с использованием и без использования рекуррентных слоев по схеме, описанной выше. В итоге остановились на варианте без использования рекуррентных слоев. Также для придания ускорения inference части, мы использовали идеи сетей MobileNet разных версий. Граф нашей модели выглядел так:

Что означает английское сокращение ocr в информатике. Смотреть фото Что означает английское сокращение ocr в информатике. Смотреть картинку Что означает английское сокращение ocr в информатике. Картинка про Что означает английское сокращение ocr в информатике. Фото Что означает английское сокращение ocr в информатикеСхема итоговой модели

Методы декодирования

Хочу выделить два наиболее распространенных метода декодирования: CTC_Greedy_Decoder и Beam_Search.

CTC_Greedy_Decoder-метод на каждом шаге берет индекс, с наибольшей вероятностью соответствующий определенному символу. После чего удаляются дублирующиеся символы и спецсимвол, заданный при тренировке.

Метод «Beam_Search» — лучевой алгоритм, в основании которого лежит принцип: следующий предсказанный символ зависит от предыдущего предсказанного символа. Условные вероятности совстречаемости символов максимизируются и выводится итоговый текст.

Post-processing

Что означает английское сокращение ocr в информатике. Смотреть фото Что означает английское сокращение ocr в информатике. Смотреть картинку Что означает английское сокращение ocr в информатике. Картинка про Что означает английское сокращение ocr в информатике. Фото Что означает английское сокращение ocr в информатике

Есть вероятность, что в продакшене при скоринге на новых данных модель может ошибаться. Нужно исключить такие моменты или заранее предупредить пользователя о том, что распознавание не получилось, и попросить переснять документ. В этом нам помогает простая процедура постобработки, которая может проверять на предсказание только ограниченного словаря для конкретного поля. Например, для числовых полей выдавать только число.

Другим примером постобработки являются поля с ограниченным набором значений, которые подбираются по словарю на основе редакторского расстояния. Проверка на допустимость значений: в поле даты рождения не могут быть даты 18 века.

Оптимизация модели

Техники оптимизации

На предыдущем этапе мы получили модель размером 600 килобайт, из-за чего распознавание были слишком медленным. Нужно было оптимизировать модель с фокусом на увеличение скорости распознавания текста и уменьшение размера.

В этом нам помогли следующие техники:

Квантование модели, при котором вычисления вещественных чисел переводятся в более быстрые целочисленные вычисления.

«Стрижка» (pruning) ненужных связей. Некоторые веса имеют маленькую магнитуду и оказывают малый эффект на предсказание, их можно обрезать.

Что означает английское сокращение ocr в информатике. Смотреть фото Что означает английское сокращение ocr в информатике. Смотреть картинку Что означает английское сокращение ocr в информатике. Картинка про Что означает английское сокращение ocr в информатике. Фото Что означает английское сокращение ocr в информатике

    Для увеличения скорости распознавания текста используются мобильные версии архитектур нейросеток, например, MobileNetV1 или MobileNetV2.

    Так, в результате оптимизации мы получили снижение качества всего на 0,5 %, при этом скорость работы увеличилась в 6 раз, а размер модели снизился до 60 килобайт.

    Вывод модели в продуктив

    Процесс вывода модели в продуктив выглядит так:

    Что означает английское сокращение ocr в информатике. Смотреть фото Что означает английское сокращение ocr в информатике. Смотреть картинку Что означает английское сокращение ocr в информатике. Картинка про Что означает английское сокращение ocr в информатике. Фото Что означает английское сокращение ocr в информатике

    Мы создаем 32-битную TensorFlow модель, замораживаем ее и сохраняем с дополнительными оптимизациями типа weight или unit pruning. Проводим дополнительное 8-битное квантование. После чего компилируем модель в Android- или iOS-библиотеку и деплоим ее в основной проект.

    Рекомендации

    На этапе развертывания задавайте статическое выделение тензоров в графе модели. Например, в нашем случае скорость увеличилась в два раза после указания фиксированного размера пакета (Batch size).

    Не используйте LSTМ- и GRU-сети для обучения на синтетических данных, так как они проверяют совстречаемость символов. В случайно сгенерированных синтетических данных последовательность символов не соответствует реальной ситуации. Помимо этого они вызывают эффект уменьшения скорости, что важно для мобильных устройств, особенно для старых версий.

    Аккуратно подбирайте шрифты для обучающей выборки. Подготовьте для вашего словаря набор шрифтов, допустимых для отрисовки интересующих символов. Например, шрифт OCR B Regular не подходит для кириллического словаря.

Что означает английское сокращение ocr в информатике. Смотреть фото Что означает английское сокращение ocr в информатике. Смотреть картинку Что означает английское сокращение ocr в информатике. Картинка про Что означает английское сокращение ocr в информатике. Фото Что означает английское сокращение ocr в информатике

    Пробуйте тренировать собственные модели, поскольку не все opensource-библиотеки могут подойти. Перед тем как тренировать собственные модели, мы пробовали Tesseract и ряд других решений. Так как мы планировали развертывать библиотеку на Android и iOS, их размер был слишком большим. Кроме того, качество распознавания этих библиотек было недостаточным.

    Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *