Оптическое распознавание символов (OCR) для Windows 10

Возможность оптического распознавания символов (OCR) является частью универсальной платформы Windows (UWP), это означает что она может быть использована для всех приложений ориентированных на Windows 10. Вместе с OCR вы можете извлечь текст и текстовую часть информации из изображений. Она предназначена для обработки различных типов изображений, от сканированных документов до фотографий. В то же время, она высоко оптимизирована и работает полностью на устройстве, не требуя подключения к Интернету. Ноябрьское обновление Windows 10 позволяет производить распознавание текста для четырех новых языков, в результате чего общее количество поддерживаемых языков составило 25.
Эта технология была тщательно протестирована в Microsoft в течение многих лет. Она используется в основных продуктах, таких как Word, OneNote, OneDrive, Bing, Office Lens и Translator для различных сценариев, включая индексацию изображений, восстановление документов и дополненную реальность.

Использование API OCR очень простое, посмотрите сами на этот фрагмент кода:

  1. SoftwareBitmap bitmap;
  2. // …
  3. // Получение растрового bitmap изображения из файла, камеры, …
  4. // …
  5. OcrEngine ocrEngine = OcrEngine.TryCreateFromUserProfileLanguages();
  6. OcrResult ocrResult = await ocrEngine.RecognizeAsync(bitmap);
  7. string extractedText = ocrResult.Text;

Выполнение кода используя изображение, приведённое ниже, извлекает следующий текст:
“TRAVEL THE WORLD SEE THE SIGHTS HAVE GREAT DAYS AND BETTER NIGHTS”

 

OcrResult может быть также использована для извлечения текста построчно или нахождения положения каждого отдельного слова. Для более подробной информации можно воспользоваться рабочим примером кода на GitHub или документацией на сайте MSDN.

Эта работа является эволюцией библиотеки Microsoft OCR для среды выполнения Windows (Windows Runtime), выпущенной в NuGet в 2014 году. Если вы использовали эту библиотеку в приложениях для Windows/Windows Phone 8.1, переход к новому OCR API в Windows 10 будет простым.

В случае, если вам необходимо использовать OCR в качестве сервиса, у нас охвачена и эта задача. Эта же технология выпущена как часть Project Oxford (набор сервисов обработки природных данных, мы рекомендуем вам попробовать это, поскольку это даёт целый ряд возможностей для ваших приложений). В сравнении с пространством имён Windows.Media.Ocr, служба имеет дополнительные функции, такие как определение языка и определения ориентации текста. Попробуйте поэкспериментировать с сервисным демо службы OCR, а подробную информацию можно получить в документации API.

Мы с нетерпением ждем в магазине приложений Windows Store ваших новых, удивительных приложений, использующих технологию OCR. Если вы хотите поделиться своим мнением, задать вопрос или начать дискуссию, пожалуйста, напишите в форуме MSDN. Мы будем с нетерпением ждать ваш отклик!

Перевод оригинальной статьи Optical Character Recognition (OCR) for Windows 10
Автор: Pavle Josipovic
Перевод: Сергей Урусов

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *