Как распознать текст со сканера на word

Преобразование отсканированных документов и изображений в редактируемые форматы Word, Pdf, Excel и Txt (простой текст)

Доступно страниц: 10 (Вы уже использовали 0 страниц)

Если вам нужно распознать больше страниц, пожалуйста, зарегистрируйтесь

Загрузите файлы для распознавания или перетащите их на эту страницу

Поддерживаемые форматы файлов:

pdf, jpg, bmp, gif, jp2, jpeg, pbm, pcx, pgm, png, ppm, tga, tiff, wbmp

  • Китайский OCR
  • Немецкий OCR
  • Нидерландский OCR
  • Английский OCR
  • Французский OCR
  • Итальянский OCR

Как распознать текст с изображения?

Шаг 1

Загрузите изображения или PDF-файлы

Выберите файлы с компьютера, Google Диска, Dropbox, по ссылке или перетащив их на страницу

Шаг 2

Язык и формат

Выберите все языки, используемые в документе. Кроме того, выберите .doc или любой другой формат, который вам нужен в результате (поддерживается больше 10 текстовых форматов)

Шаг 3

Конвертируйте и скачивайте

Нажмите «Распознать», и вы можете сразу загрузить распознанный текстовый файл

Word для Microsoft 365 Word 2021 Word 2019 Word 2016 Word 2013 Еще…Меньше

Если вы хотите вставить в документ Word печатный документ или рисунок, это можно сделать несколькими способами.

Примечание: Если вы ищете инструкции по подключению сканера или скопатора к Microsoft Windows, посетите веб-сайт поддержки изготовителя вашего устройства.

Сканирование изображения в Word

Для сканирования изображения в документ Word можно использовать сканер, многофункциональный принтер, копировальный аппарат с возможностью сканирования или цифровую камеру.

  1. Отсканируйте изображение или сделайте его снимок с помощью цифровой камеры или смартфона.

  2. Сохраните изображение в стандартном формате, таком как JPG, PNG или GIF. Поместите его в папку на своем компьютере.

  3. В Word, поместите курсор туда, куда вы хотите вставить отсканированное изображение, а затем на вкладке Вставка нажмите кнопку Рисунки.

    На вкладке "Вставка" выделен значок "Рисунки".

  4. Выберите отсканированный рисунок в диалоговом окне и нажмите кнопку Вставить.

    Выберите рисунок, который вы хотите вставить в Word.

Вставка отсканированного текста в Word

Для сканирования документа в Microsoft Word проще всего использовать наше бесплатное приложение Office Lens на смартфоне или планшете. Оно получает снимок документа с помощью камеры устройства и сохраняет его в виде редактируемого документа непосредственно в Word. Она доступна бесплатно на iPad ,iPhone, Windows Phone и Android.

Если вы не хотите использовать Office Lens, лучше всего отсканировать документ в формате PDF с помощью программного обеспечения сканера, а затем открыть его в Word.

  1. В Word выберите Файл > Открыть.

  2. Перейдите к папке, в которой хранится PDF-файл, и откройте его.

  3. Word откроет диалоговое окно, в котором нужно подтвердить импорт текста PDF-файла. Нажмите кнопку ОК, Word импортировать текст. Word постарается сохранить форматирование текста.

    Word подтверждает попытку расплавить PDF-файл, который вы открыли.

Дополнительные сведения см. в статье Редактирование содержимого PDF-документа в Word.

Примечание: Точность распознавания текста зависит от качества сканирования и четкости отсканированного текста. Рукописный текст редко распознается, поэтому для лучших результатов сканируйте печатные материалы. Всегда проверяйте текст после его открытия в Word, чтобы убедиться, что он правильно распознан.

Кроме того, со сканером может поставляться приложение для распознавания текста (OCR). Обратитесь к документации своего устройства или к его производителю.

Остались вопросы о Word?

Задайте их на форуме сообщества Word Answers

Помогите нам улучшить Word

У вас есть предложения, как улучшить Word? Дайте нам знать, предоставив нам отзыв. Дополнительные сведения см. в Microsoft Office.

См. также

  • Вставка изображений в Office 2013 и Office 2016

  • Вставка подписи

  • Приложение «Сканер» для Windows: вопросы и ответы

Нужна дополнительная помощь?


Автор:
Обновлено: 19.04.2018

Представьте себе функцию, позволяющую извлечь текст из изображения и быстро вставить его в другой документ. На самом деле это возможно. Вам больше не нужно терять время, набирая все, потому что есть программы, которые используют оптическое распознавание символов (OCR) для анализа букв и слов в изображении, а затем конвертируют их в текст.

В наши дни существует так много бесплатных и эффективных опций, позволяющих извлечь текст из изображения, а не печатать его вручную. Ниже представлены самые удобные и эффективные программы и их сравнение.

Как распознать текст с картинки в Word

Как распознать текст с картинки в Word

Содержание

    • Видео — распознавание текста с картинки в WORD
  • Извлечение текста с помощью OneNote
  • Использование онлайн-сервисов
    • Видео — Как распознавать текст с картинки, фотографии или PDF файла
  • Как извлечь текст из изображений с помощью ABBY FineReader
    • Онлайн версия
    • Десктопная версия
    • Видео — Как распознать PDF в Word
  • Сравнение популярный инструментов распознавания текста

Видео — распознавание текста с картинки в WORD

Извлечение текста с помощью OneNote

OneNote OCR уже на протяжении нескольких лет остается одной из самых лучших программ для распознавания текста. Однако, распознавание это одна из тех менее известных функций, которые пользователи редко используют, но как только вы начнете ее использовать, вы будете удивлены тем, насколько быстрой и точной она может быть. Действительно, способность извлекать текст — одна из особенностей, которая делает OneNote лучше Evernote.

Это стандартная программа, скорее всего вам не придется устанавливать ее самостоятельно. Найдите ее на компьютере в папке Microsoft Office или же с помощью поиска на панели «Пуск». Запустите программу.

Инструкции по извлечению текста:

  1. Шаг 1. Откройте любую страницу в OneNote, желательно пустую.

    Открываем любую страницу в OneNote

    Открываем любую страницу в OneNote

  2. Шаг 2. Перейдите в меню «Вставка»> «Изображения» и выберите файл изображения и настройте язык распознавания.

    Выберите файл изображения

    Выберите файл изображения

  3. Шаг 3. Щелкните правой кнопкой мыши по вставленному изображению и выберите «Копировать текст с изображения». Он сохранится в буфере обмена.

Копируем текст с изображения

Копируем текст с изображения

Теперь вы можете вставить его куда угодно. Удалите вставленное изображение, если оно вам больше не нужно.

Вставляем текст куда угодно

Вставляем текст куда угодно

На заметку! Это быстрый и удобный способ извлечения текста из картинки, но есть одно «но» — One Note работает подобным образом лишь с латиницей. Он не распознает русский текст.

Использование онлайн-сервисов

Онлайн-сервисы по распознаванию текста с изображения работают примерно по одному и тому же принципу. В примере ниже использовался Free Online OCR. На этом сайте стоит ограничение. Регистрация даст вам доступ к дополнительным функциям, недоступным для гостей: конвертировать многостраничный PDF (более 15 страниц) в текст, большие изображения и ZIP-архивы, выбирать языки распознавания, конвертировать в редактируемые форматы и многое другое. Распознать короткий тест можно и без регистрации.

  1. Шаг 1. Откройте сайт бесплатного OCR. Выберите изображение посредством кнопки «Select File». Это может быть и PDF файл.

    Открываем сайт бесплатного OCR

    Открываем сайт бесплатного OCR

  2. Шаг 2. Выберите язык и нажмите на кнопку «CONVERT».

    Выбираем язык и нажимаем на кнопку "CONVERT"

    Выбираем язык и нажимаем на кнопку «CONVERT»

Текст появится в поле ниже. Вы также можете скачать в формате Microsoft Word.

Этот способ имеет ряд преимуществ:

  1. Вам не придется скачивать и устанавливать стороннее программное обеспечение.
  2. Итог можно скачать в виде текстового документа.
  3. Это быстро.
  4. Более того на сайте можно распознавать текст на одном из множества предложенных языков.

Видео — Как распознавать текст с картинки, фотографии или PDF файла

Как извлечь текст из изображений с помощью ABBY FineReader

Существует две версии этой программы. Одна работает в автоматическом режиме онлайн, другая же — десктопная, ее придется скачать и установить на компьютер. Обе — платные. Однако в онлайн-версии можно бесплатно распознать текст с не более 5 страниц, а в установленной программе первое время действует пробный бесплатный период. На сегодня это один из лучших инструментов для распознавания текста с картинки.

Онлайн версия

  1. Шаг 1. Перейдите на сайт FineReader.

    Открываем сайт FineReader

    Открываем сайт FineReader

  2. Шаг 2. Загрузите изображение. Выберите нужный вам язык и нажмите на кнопку регистрации. Следуйте указаниям на сайте. Как только вы зарегистрируетесь, сайт перенаправит вас на другую страницу. Нажмите на кнопку «Распознать» и дождитесь окончания процесса.

Загружаем файл, выбираем язык, выбираем формат сохранения

Загружаем файл, выбираем язык, выбираем формат сохранения

Текст сохранится в формате docs. Скачайте его.

Десктопная версия

  1. Шаг 1. Запустите FreeReader и нажмите «Сканировать изображение», чтобы выбрать файл, содержащий текст. Он загрузится в программу, при необходимости их можно отредактировать, чтобы улучшить распознаваемость текста. Программа предложит вам выделить область, текст с которой нужно распознать.
  2. Шаг 2. Извлечение текста. Нажмите «Распознать», чтобы извлечь текст из выделения. Выбранный текст будет отображаться в текстовом окне через несколько секунд.

    Извлекаем текст

    Извлекаем текст

Шаг 3. Проверка. В этой программе есть функция проверки. Нажав на эту кнопку, пользователь на экране будет видеть некорректно распознанные слова и фрагмент оригинала. На этом этапе можно быстро исправить практически все ошибки программы.

Шаг 4. Сохраните текст любым из предложенных способов.

Сохраняем текст

Сохраняем текст

Обратите внимание:

  1. Во-первых, вам нужно убедиться, что исходное изображение четкое, хорошего качества.
  2. Во-вторых, выбор правильного механизма OCR важен, и вам нужно учитывать их сильные и слабые стороны.
  3. В-третьих, убедитесь, что ваши изображения масштабированы до нужного размера (не менее 300 DPI).
  4. Низкая контрастность приведет к плохому OCR, поэтому вам необходимо исправить это до распознавания.
  5. Удалите шумы и дефекты.
  6. Если изображение перекошено, отредактируйте его.

Видео — Как распознать PDF в Word

Сравнение популярный инструментов распознавания текста

Название программы OneNote FineReader OCR Online Free Online OCR
Условия использования Стандартная программа, входящая в пакет Microsoft Office. Как правило, присутствует на всех компьютерах ОС Windows Онлайн версия программы. До 5 страниц бесплатно при регистрации Бесплатный онлайн-сервис. Не требует регистрации
Скорость Мгновенное распознавание Процесс происходит на сервере. Время ожидания не больше 5 минут Мгновенное распознавание
Особенности Это не главная функция программы, а лишь побочная. Хоть она и достаточно хороша, не ждите от нее совершенства Сокращенная версия основной программы. В полной компьютерной версии намного больше опций, повышающих качество распознавания.
Доступно распознавание теста сразу на нескольких языках, если в тексте есть вставки на другом языке.
Сохраняет форматирование
Скорость. Доступность
Число доступных языков В русскоязычной версии программы доступно три языка: русский, английский, немецкий Множество языков Множество языков
Результат OneNote FineReader OCR Online Free Online OCR

Хотя рынок заполнен программным обеспечением OCR, которое может извлекать текст из изображений, хорошая программа OCR должна делать больше, чем просто распознавание текста. Она должна поддерживать макет содержимого, текстовые шрифты и графику как в исходном документе.

Рекомендуем похожие статьи

Дополнительные настройки

Метод OCR

Исходный язык файла

Чтобы получить оптимальный результат, выберите все языки, которые есть в файле.

Улучшить OCR

Применить фильтр:

Конвертер DOCX

Преобразование из PDF в DOCX или из результатов сканирования в DOCX. PDF — очень удобный формат, но его сложно редактировать. Упростите извлечение цитат, редактирование текста или его повторное использование!

Платформа: Windows, iOS, Android, веб

Лицензия: пробная, от 5388 в год

Распознает: JPG, TIF, BMP, PNG, PDF, сигнал со сканера, снимки камеры

Сохраняет: DOC, DOCX, XLS, XLSX, ODT, TXT, RTF, PDF, PDF/A, PPTX, EPUB, FB2

Abbyy FineReader

Abbyy FineReader известен своим точным модулем OCR, который позволяет быстро распознать текст с картинки. Приложение можно использовать как оцифровщик бумаг, так как он включает в себя инструмент для прямого перехвата фотографий со сканера. Их можно сразу сохранить в любой из доступных форматов, в том числе текстовые документы, HTML-файлы или PDF. Бесплатная версия накладывает ограничение на количество страниц: не более 10.

Особенности:

  • большое количество доступных языков;
  • оптимизация размера фотографий с минимальными потерями качества;
  • автоматическая проверка орфографии и грамматики;
  • работа с многостраничными документами;
  • редактирование распознанного текста.

Плюсы:

  • высокая точность результата даже при невысоком качестве фото.
  • способно отличать разные языки в документе;
  • доступна для установки на все версии Windows с любой разрядностью.

Минусы:

  • обновления приобретаются отдельно;
  • требуется регистрация аккаунта на официальном сайте;
  • сбивается оригинальное форматирование и стиль документа.

Платформа: Windows, Linux, mac OS

Лицензия: бесплатная

Распознает: JPG, TIFF, BMP, PNG, снимки со сканера

Сохраняет: DOCX

OCR CuneiForm

Программа для распознавания текста по фото OCR CUneiForm направлена только на одно действие – перехват со сканера изображений и преобразования содержащейся на них текстовой информации. Также допускается открытие графических файлов с персонального компьютера. После этого работу можно продолжить в любом текстовом редакторе. Разрешается работать в одиночном или пакетном режиме.

Особенности:

  • может использоваться вместо стандартного софта для сканирования;
  • преобразование графических файлов в редактируемый документ Ворд;
  • анализ документа на наличие форм, таблиц, изображений;
  • поиск по созданному текстовому файлу;
  • распознавание на отдельных выбранных областях.

Плюсы:

  • сохраняет оригинальную структуру документа и его форматирование;
  • можно запускать в автоматическом режиме или настроить параметры;
  • специальный режим для матричного принтера.

Минусы:

  • допускается разрешение не выше 600;
  • показал не очень хорошие результаты с фото плохого качества.

Платформа: Android, iOS

Лицензия: бесплатная

Распознает: фотографии с камеры

Сохраняет: PDF, PPT, DOCX

Office Lens

Ранее Office Lens (также известный как Microsoft Lens) был доступен для ПК, но теперь корпорация прекратила поддержку десктопной версии. Приложение превращает ваш телефон в продвинутый сканер, автоматически анализируя окружение и делая снимок документа. Возможна работа в том числе со снимками с неправильным отображением (положенные боком, перевернутые, лежащие на неровной поверхности и т.д.).

Особенности:

  • корректировка результата после создания снимка;
  • извлечение печатного и рукописного текста на русском и английском языке;
  • распознавание таблиц и контактов;
  • создание многостраничного документа из фотографий.

Плюсы:

  • полностью бесплатный;
  • есть разные пресеты и настройки для документов (лист, фото, доска, визитка);
  • отправка файлов в облачные хранилища.

Минусы:

  • для подключения модуля OCR требуется регистрация аккаунта;
  • некорректные результаты при извлечении русских букв.

Платформа: Android, iOS

Лицензия: условно-бесплатная; от 349 рублей

Распознает: фотографии с камеры

Сохраняет: PDF

Adobe Scan

Как и продукт от Microsoft, Adobe Scan также сканирует текстовые данные через мобильную фотокамеру. Результат сохраняется как PDF-документ, оптимизированный для редактирования в программном обеспечении Acrobat. Все результаты сохраняются автоматически в облако Adobe Document Cloud.

Особенности:

  • подходит для разного типа информации: книга, доска, удостоверение, визитка;
  • автоматическое сканирование окружения на предмет документов;
  • редактирование созданных фотографий;
  • расшифровка и использование встроенных форм.

Плюсы:

  • не требует оплаты;
  • на файлы можно накладывать защиту;
  • корректно работает с русскими буквами.

Минусы:

  • нет автоматического сохранения;
  • для использования приложения обязательно требуется регистрация.

Платформа: веб

Лицензия: условно-бесплатная

Распознает: JPG, GIF, TIFF, BMP, PNG, PCX, PDF

Сохраняет: TXT, DOC, DOCX, XLSX, PDF

Online OCR

На этом сервисе пользователи могут провести распознавание текста бесплатно и сохранить результат в редактируемые текстовые файлы без установки софта. Поддерживается работа со сканами, популярными форматами графики, сканами и PDF. Без регистрации и оплаты доступно распознование только 15 страниц в час. После авторизации данный лимит повышается до 50, а также увеличивается допустимый размер (200 МБ).

Особенности:

  • обработка текста в зависимости от особенностей оригинального языка;
  • редактирование результата в режиме прямого времени;
  • объединение обрабатываемых файлов в единый проект;
  • анализ отдельных страниц документа.

Плюсы:

  • удобное русскоязычное управление;
  • автоматический определитель типа документа;
  • ведется история загружаемых файлов.

Минусы:

  • загруженные снимки нельзя отредактировать;
  • не всегда корректный результат.

Платформа: веб

Лицензия: бесплатная

Распознает: JPEG, PNG, PDF

Сохраняет: PDF, TXT, DOCX, ODF

img2text

Бесплатный инструмент работает с популярными форматами графики и нередактируемыми документами ПДФ. Сервис ведет журнал ваших действий, поэтому при внезапном прерывании сети можно вернуться к работе без вторичной загрузки. Разработчики постоянно улучшают свой продукт и добавляют новые возможности, на данный момент в ней есть переводящая утилита, также анонсирована опция импорта файла по ссылке.

Особенности:

  • изменение преобразованного текста прямо на сайте;
  • перевод иностранных документов;
  • проверка орфографии;
  • копирование результата в буфер обмена.

Плюсы:

  • работает полностью на бесплатной основе;
  • быстрая скорость загрузки и обработки.

Минусы:

  • документ не должен содержать картинок, таблиц и колонок;
  • некорректно работает с файлами, в которых используется несколько языков.

Платформа: Windows, macOS

Лицензия: бесплатная

Распознает: JPEG, TIFF, PNG, BMP

Сохраняет: JPEG, TIFF, PNG, BMP

Microsoft OneNote

Записная книжка от разработчика Microsoft работает как отдельная программа, также ее можно приобрести в пакете с офисным ПО MS Office. Хотя софт также распространяется как мобильное приложение, распознавание текста с картинки поддерживается только в десктопном варианте на компьютере. Хотя изменять информацию на картинках нельзя, данные можно скопировать и вставить в текстовой редактор.

Особенности:

  • загрузка фотографий с жесткого диска или подключенной фотокамеры;
  • скрытие выбранных областей фотографии;
  • можно добавлять пометки и конвертировать их в редактируемый текст;
  • прослушивание открытого текста.

Плюсы:

  • автоматические бэкап в облако предотвратит потерю важных данных;
  • есть опция переводчика текста и проверка орфографии в документе.

Минусы:

  • требуется вход с учетной записью Microsoft;
  • текст на фотографиях нельзя исправлять.

Платформа: Windows, macOS

Лицензия: пробная; от $129

Распознает: JPEG, TIFF, PNG, BMP, PDF

Сохраняет: PDF, TXT, PPTX, DOCX, XLSX

Readiris 17

Readiris – один из немногих PDF-редакторов, умеющий различать печатный текст и даже ручной почерк и преобразовать его в стандартный текстовой массив. Программу можно использовать как сканер текста с фото, так как она работает со всеми популярными моделями сканирующих устройство. Софт корректно распознает кириллические символы и показывает высокую точность результатов. Пробная версия доступна в полном функционале в течение 10 дней.

Особенности:

  • позволяет перехватывать и оптимизировать картинки со сканера;
  • работает с более чем 170 языками и проверяет ошибки;
  • сохраняет оригинальное форматирование документа;
  • распознает таблицы, штрих-коды, формулы, нестандартные символы.

Плюсы:

  • имеется пакетный режим;
  • присутствуют инструменты редактирования.

Минусы:

  • неудобная рабочая панель;
  • высокая стоимость полной версии.

Платформа: Windows

Лицензия: бесплатная

Распознает: JPEG, TIFF, PNG, BMP, PSD

Сохраняет: DOC, TXT

Freemore OCR

Freemore OCR – простая в управлении программа, считывающая текст с изображений или из нередактируемых ПДФ. Работа проводится в двухоконном режиме, что особенно удобно при проверке точности результатов. Стоит отметить, что при загрузке файл помечается как подозрительный, при установке некоторые антивирусы требуется на время отключить.

Особенности:

  • корректно распознает текст, расположенный вокруг графических элементов;
  • позволяет встраивать цифровую подпись;
  • имеются возможности ручного редактирования результата;
  • экспорт как новый файл или копирование всего текста в буфер обмена.

Плюсы:

  • работает с защищенными паролем файлами;
  • очень простое в управлении меню.

Минусы:

  • не распознает кириллицу;
  • при установке подгружает рекламный софт.

Платформа: Windows

Лицензия: условно-бесплатная; 499 руб

Распознает: PDF, BMP, JPG, TIFF, JP2, PNG

Сохраняет: DOCX, RTF, TXT, PDF

Scanitto Pro

Если нужен сканер с распознаванием текста, выбирайте это простое средство для преобразования ксерокопий в документ. Софт работает с подключенным устройством, подменяя встроенную по умолчанию программу сканирования. Отличается удобными функциями выборочного анализа, разрешая отмечать фрагменты, которые нужно распознать.

Особенности:

  • просматривайте результат перед выводом на экспорт;
  • объединение изображений в многостраничные документы;
  • поворот скана и очистка для шума для более точного анализа;
  • оптическое распознавание более 7 языков (включая русский).

Плюсы:

  • удобный пользовательский интерфейс с минимумом настроек;
  • минимальные требования к системе и процессору компьютера.

Минусы:

  • нельзя загружать фото с жесткого диска;
  • сбивает структуру и удаляет оригинальное форматирование текста.

В заключение

Надеемся, что наш обзор помог вам понять, какая программа для сканирования и распознавания текста подойдет для вашей задачи. Все рассмотренные приложения в целом достойно справились с анализом сложных фото и показали высокую скорость работы. А если вам требуется обработка сохраненного ПДФ-файла, советуем скачать бесплатно PDF Commander. Он поможет создать из распознанного текста полноценный документ и разнообразить его дополнительными элементами.

Представляем вашему вниманию программы для распознавания и сканирования текста, с помощью которых можно оптимизировать процесс оцифровки документов, рукописных или бумажных книг.

Выбор программы для распознавания и сканирования текста

Рассматриваемые нами приложения легко переводят png, jpg, pdf и «бумажные файлы» в удобный для редактуры в Word формат и другие офисные ПО, редактируют распечатанный или сфотографированный материал в полноценный текст.

Программы

Русский язык

Лицензия

Рейтинг

Обработка текста

Встроенный словарь

ABBYY FineReader Да Бесплатная 10 Частично Да
OCR CuneiForm Да Бесплатная 10 Да Да
Adobe Reader Да Пробная 8 Да Нет
WinScan2PDF Да Бесплатная 8 Нет Да
VueScan Да Бесплатная 8 Да Нет
SimpleOCR Нет Пробная 10 Да Да
Readiris Pro Да Пробная 10 Да Да
Microsoft OneNote Да Бесплатная 7 Нет Да
Freemore OCR Features Нет Бесплатная 10 Да Да
TopOCR Нет Бесплатная 7 Да Нет

ABBYY FineReader новая версия

ABBYY FineReader скачать

Приложение легко распознает печатные символы и преобразовывает отсканированные документы в цифровые форматы. Считается лидером в своей категории, поскольку выполняет свои задачи качественно и быстро, в отличие от подобных аналогов. Эбби ФайнРидер имеет свою OCR технологию обработки материала, функции для захвата данных на разных источниках, а также инструменты для обработки PDF-объектов, их редактирования и комментирования. Также доступна автоматизированная конвертация, сохранение разметок, обработка текста на разных языках, поддержка подключаемых устройств и интегрированный редактор. Бесплатная версия ограничивает работу софта после 15 дней использования.

ABBYY FineReader русская версия

OCR CuneiForm новая версия

OCR CuneiForm скачать

Программа специализируется на идентификации сканированного или сфотографированного текста, сохраняя его структурирование и гарнитуру шрифта. Понимает любой печатный шрифт, отправляет распознанный результат во встроенный редактор текста, переделывает электронные копии и графические файлы в удобный вид для редактуры. В состав комплекса входят два программных обеспечения для пакетной и одиночной обработок. Распознанные документы легко сохранить в удобном формате или отыскать их в поиске. Дополнительно прога может определять таблицы, текстовые блоки и графические картинки вне зависимости от сложности, объема и четкости текста.

OCR CuneiForm русская версия

Adobe Reader новая версия

Adobe Reader скачать

Популярный просмотрщик всех видов PDF-файлов с базовыми функциями работы с документацией. Позволяет просматривать, копировать, менять ориентацию или отправлять на печать документы. Для слабовидящих юзеров доступна опция масштабирования, увеличивающая размер шрифта до нужных параметров. Также можно воспользоваться функцией трёхмерного изображения и воспроизведения интегрированных в мультимедийный контент объектов. Доступен поиск в PDF картах, портфолио и файлах, а также комментирование файлов, присоединение электронных подписей и настройка плагинов для веб-навигаторов. Из минусов бесплатной версии отметим ограниченный только просмотром функционал.

Adobe Reader русская версия

WinScan2PDF новая версия

WinScan2PDF скачать

Портативная утилита для считывания данных со сканеров и сохранения материала в PDF. Софт переводит содержимое документов в цифровые форматы, одновременно обрабатывает несколько книг с последующим сохранением в один файл с соответствующим количеством страниц. В настройках можно выбирать качество сохраняемой работы, создавать много страниц в одном документе, менять язык интерфейса. ВинСкан2ПДФ позволит быстро отсканировать бумажную документацию, обработать сразу несколько страниц и создать многостраничный ПДФ.

WinScan2PDF русская версия

VueScan новая версия

VueScan скачать

Программа-имитатор работы драйвера для расширения функциональных возможностей разнообразных моделей сканеров. Быстро подключается к устройствам сканирования, работает с негативами, старыми фотоснимками и слайдами без потери качества. В пользовательских настройках можно настраивать все этапы сканирования, сохранять отсканированную документацию в TIFF, JPEG и PDF форматах, распознавать тексты, использовать глубокую настройку готовой работы и применять множество установок. Фри-версия накладывает водяные знаки на работу.

VueScan русская версия

SimpleOCR новая версия

SimpleOCR скачать

Утилита распознает рукописный и машинный текст на датском, английском и французском языках, имеет интегрированный редактор и большой словарный запас. СимплеОЦР считывает данные со сканеров и проводит конвертацию материала в TXT, TIFF и DOC форматы, переводит напечатанный на бумаге текст и рукопись в цифровой формат, идентифицирует картинки и шрифты. Также доступно сравнение отсканированного ранее текста с полученным, а также внесение изменений. Бесплатная версия предоставляет только 14 дней распознавания текстов.

SimpleOCR полная версия

Readiris Pro новая версия

Readiris Pro скачать

Один из лидеров в категории OCR программ, который сканирует и распознает бумажную и рукописную документацию, работает с более 100 языками и имеет интегрированный редактор. Позволяет отсканировать и оцифровать материал, а с помощью редактора внести изменения. Реадирис конвертирует в формат изображения, таблицы и документа, работает с облачными хранилищами и ftp-папками, экспортирует в DJVU. В настройках можно улучшать качество документа, поворачивать его или сохранять в виртуальном хранилище. Ознакомительная версия активна 10 дней и дает на обработку только 100 страниц.

Readiris Pro русская версия

Microsoft OneNote новая версия

Microsoft OneNote скачать

Является дополнением к Office Mobile пакету и предоставляет расширения для создания списков задач, покупок или заметок. В функционале доступно создание маркированных списков, отметка галочкой выполненных пунктов, ввод рукописных примечаний сенсорным нажатием или цифровым пером, добавление графических картинок. Немаловажным плюсом утилиты является работа мобильной версии с OneDrive для хранения всех правок заметок, их просмотра или редактуры. Понятный русскоязычный интерфейс и бесплатное распространение станут приятными плюсами в работе с этой удобной прогой.

Microsoft OneNote русская версия

Freemore OCR Features новая версия

Freemore OCR Features скачать

Качественное ПО для оптического распознавания текста из изображений и ПДФ-документации. Доступно извлечение текста из картинки, которая получена с цифровой камеры, сканера или мобильного телефона, дешифровка и зашифровка символов, сохранение материала в TXT и Word, редактура метаданных, предпросмотр документации, применение пароля или цифровой подписи. Софт имеет методику сверхскоростной обработки и передовой кодировки, пресеты с оптимальной настройкой, поддерживает многоядерные процессоры. Продукт совместим со многими известными фирмами сканеров, открывает картинки разных форматов, защищает работу паролем и в реальном времени быстро обрабатывает материал.

Freemore OCR последняя версия

TopOCR новая версия

TopOCR скачать

Программа легко оптически распознает, редактирует и читает текстовую документацию. Благодаря своей многофункциональности может распознать и отсканировать материал, а также внести изменения с помощью опций графического редактора и электронного переводчика. Приложение озвучивает текст на 11 языках, быстро переводит документацию и создает аудиокниги. Поддерживает многие распространенные форматы, работает напрямую со сканером и озвучивает текст. Из минусов отметим отсутствие русскоязычной поддержки.

TopOCR последняя версия

Данный материал является частной записью члена сообщества Club.CNews.
Редакция CNews не несет ответственности за его содержание.

Эти сайты и программы помогут извлечь текстовое содержимое изображений и бумаг, чтобы вам было удобнее с ним работать.

1. Office Lens

  • Платформы: Android, iOS, Windows.
  • Распознаёт: снимки камеры.
  • Сохраняет: DOCX, PPTX, PDF.

Этот сервис от компании Microsoft превращает камеру смартфона или ПК в бесплатный сканер документов. С помощью Office Lens вы можете распознать текст на любом физическом носителе и сохранить его в одном из «офисных» форматов или в PDF. Итоговые текстовые файлы доступны для редактирования в Word, OneNote и других сервисах Microsoft, интегрированных с Office Lens. К сожалению, с русским языком программа справляется не так хорошо, как с английским.

2. Adobe Scan

  • Платформы: Android, iOS.
  • Распознаёт: снимки камеры.
  • Сохраняет: PDF.

Adobe Scan тоже использует камеру смартфона, чтобы сканировать бумажные документы, но сохраняет их копии только в формате PDF. Приложение полностью бесплатно. Результаты удобно экспортировать в кросс‑платформенный сервис Adobe Acrobat, который позволяет редактировать PDF‑файлы: выделять, подчёркивать и зачёркивать слова, выполнять поиск по тексту и добавлять комментарии.

3. FineReader

  • Платформы: веб, Android, iOS, Windows.
  • Распознаёт: JPG, TIF, BMP, PNG, PDF, снимки камеры.
  • Сохраняет: DOC, DOCX, XLS, XLSX, ODT, TXT, RTF, PDF, PDF/A, PPTX, EPUB, FB*2.

FineReader славится высокой точностью распознавания. Увы, бесплатные возможности инструмента ограниченны: после регистрации вам позволят отсканировать всего 10 страниц. Зато каждый месяц будут начислять ещё по пять страниц в качестве бонуса. Подписка стоимостью 129 евро позволяет сканировать до 5 000 страниц в год, а также открывает доступ к десктопному редактору PDF‑файлов.

Перейти на сайт FineReader →

4. Online OCR

  • Платформы: веб.
  • Распознаёт: JPG, GIF, TIFF, BMP, PNG, PCX, PDF.
  • Сохраняет: TXT, DOC, DOCX, XLSX, PDF.

Веб‑сервис для распознавания текстов и таблиц. Без регистрации Online OCR позволяет конвертировать до 15 документов в час — бесплатно. Создав аккаунт, вы сможете отсканировать 50 страниц без ограничений по времени и разблокируете все выходные форматы. За каждую дополнительную страницу сервис просит от 0,8 цента: чем больше покупаете, тем ниже стоимость.

Перейти на сайт Online OCR →

5. img2txt

  • Платформы: веб.
  • Распознаёт: JPEG, PNG, PDF.
  • Сохраняет: PDF, TXT, DOCX, ODF.

Бесплатный онлайн‑конвертер, существующий за счёт рекламы. img2txt быстро обрабатывает файлы, но точность распознавания не всегда можно назвать удовлетворительной. Сервис допускает меньше ошибок, если текст на загруженных снимках написан на одном языке, расположен горизонтально и не прерывается картинками.

Перейти на сайт img2txt →

6. Microsoft OneNote

  • Платформы: Windows, macOS.
  • Распознаёт: популярные форматы изображений.
  • Сохраняет: DOC, PDF.

В настольной версии популярного блокнота OneNote тоже есть функция распознавания текста, которая работает с загруженными в заметки изображениями. Если кликнуть правой кнопкой мыши по снимку документа и выбрать в появившемся меню «Копировать текст из рисунка», то всё текстовое содержимое окажется в буфере обмена. Программа доступна бесплатно.

Скачать Microsoft OneNote →

7. Readiris 17

  • Платформы: Windows, macOS.
  • Распознаёт: JPEG, PNG, PDF и другие.
  • Сохраняет: PDF, TXT, PPTX, DOCX, XLSX и другие.

Мощная профессиональная программа для работы с PDF и распознавания текста. С высокой точностью конвертирует документы на разных языках, включая русский. Но и стоит Readiris 17 соответственно — от 49 до 199 евро в зависимости от количества функций. Вы можете установить пробную версию, которая будет работать бесплатно 10 дней. Для этого нужно зарегистрироваться на сайте Readiris, скачать программу на компьютер и ввести в ней данные от своей учётной записи.

Скачать Readiris 17 →

Читайте также 💻📎🖌

  • 7 лучших текстовых редакторов, работающих в браузере
  • Easy Screen OCR для Windows и macOS распознает текст с картинок или прямо с экрана
  • Лучшие инструменты для массового переименования файлов в Windows, macOS и Linux
  • 7 лучших текстовых редакторов, поддерживающих Markdown
  • 10 отличных текстовых редакторов для разных платформ

*Деятельность Meta Platforms Inc. и принадлежащих ей социальных сетей Facebook и Instagram запрещена на территории РФ.


Загрузить PDF


Загрузить PDF

Из этой статьи вы узнаете, как на компьютере преобразовать отсканированный документ в документ Word. Это можно сделать с помощью программы Word, если отсканированный документ сохранен в формате PDF, или с помощью бесплатного конвертера, если отсканированный документ сохранен как изображение. Если у вас есть учетная запись Microsoft и смартфон, используйте бесплатное приложение Office Lens, чтобы отсканировать документ и сохранить его в виде документа Word в облачном хранилище OneDrive.

  1. Изображение с названием Turn a Scanned Document Into Microsoft Word Document Step 1

    1

    Убедитесь, что отсканированный документ сохранен в формате PDF. Microsoft Word может преобразовать такой документ без дополнительного программного обеспечения.[1]

    • Если отсканированный документ сохранен как изображение (например, в формате JPG или PNG), воспользуйтесь сервисом New OCR.
  2. Изображение с названием Turn a Scanned Document Into Microsoft Word Document Step 2

    2

    Откройте PDF-документ в Word. Этот процесс зависит от операционной системы:

    • в Windows щелкните правой кнопкой мыши по PDF-файлу, выберите «Открыть с помощью», а затем в меню нажмите «Word»;
    • в Mac OS X щелкните по PDF-файлу, а потом нажмите «Файл» > «Открыть с помощью» > «Word».
  3. Изображение с названием Turn a Scanned Document Into Microsoft Word Document Step 3

    3

    Нажмите OK, когда появится запрос. Word приступит к преобразованию PDF-документа в формат DOC.

    • Этот процесс может занять несколько минут, если в PDF-документе большой текст или много изображений.
  4. Изображение с названием Turn a Scanned Document Into Microsoft Word Document Step 4

    4

    Активируйте редактирование файла (если потребуется). Если в верхней части окна Word отобразилась желтая полоса с предупреждением, нажмите «Включить редактирование» на желтой полосе, чтобы разблокировать документ для редактирования.

    • Обычно это относится только к скачанным файлам (например, если вы скачали отсканированный документ в формате PDF из облачного хранилища).
  5. Изображение с названием Turn a Scanned Document Into Microsoft Word Document Step 5

    5

    Отредактируйте документ. Преобразованный документ не будет абсолютной копией исходного — скорее всего, вам придется добавить отсутствующие слова, удалить лишние пробелы и исправить опечатки.

  6. Изображение с названием Turn a Scanned Document Into Microsoft Word Document Step 6

    6

    Сохраните документ. Чтобы сохранить отредактированный документ в формате DOC, выполните следующие действия:

    • в Windows нажмите Ctrl+S, введите имя файла, выберите папку для сохранения и нажмите «Сохранить»;
    • в Mac OS X нажмите Command+S, введите имя файла, выберите папку для сохранения (в меню «Где») и нажмите «Сохранить».

    Реклама

  1. Изображение с названием Turn a Scanned Document Into Microsoft Word Document Step 7

    1

    Откройте сайт сервиса New OCR. Перейдите на страницу http://www.newocr.com/ в веб-браузере компьютера.

  2. Изображение с названием Turn a Scanned Document Into Microsoft Word Document Step 8

    2

    Нажмите Обзор. Это серая кнопка в верхней части страницы. Откроется окно Проводника (Windows) или Finder (Mac).

  3. Изображение с названием Turn a Scanned Document Into Microsoft Word Document Step 9

    3

    Выберите отсканированный файл. В окне Проводника или Finder перейдите к отсканированному документу, который сохранен как изображение, и щелкните по нему.

  4. Изображение с названием Turn a Scanned Document Into Microsoft Word Document Step 10

    4

    Нажмите Открыть. Эта кнопка находится в нижнем правом углу окна. Файл загрузится на веб-сайт.

  5. Изображение с названием Turn a Scanned Document Into Microsoft Word Document Step 11

    5

    Щелкните по Upload + OCR (Загрузить и распознать). Вы найдете эту кнопку в нижней части страницы. Текст, который есть на изображении, будет распознан и отобразится на странице.

  6. Изображение с названием Turn a Scanned Document Into Microsoft Word Document Step 12

    6

    Прокрутите вниз и нажмите Download (Скачать). Эта ссылка находится в нижней левой части страницы над полем с текстом. Раскроется меню.

  7. Изображение с названием Turn a Scanned Document Into Microsoft Word Document Step 13

    7

    Щелкните по Microsoft Word (DOC). Эта опция находится в меню «Скачать». Документ Word скачается на компьютер.

  8. Изображение с названием Turn a Scanned Document Into Microsoft Word Document Step 14

    8

    Откройте скачанный документ в программе Word. Для этого дважды щелкните по нему. Теперь изображение является документом Microsoft Word.

    • Возможно, вам придется нажать «Включить редактирование» в верхней части страницы, так как по умолчанию документ может быть заблокирован для редактирования.
  9. Изображение с названием Turn a Scanned Document Into Microsoft Word Document Step 15

    9

    Отредактируйте документ. Преобразованный документ не будет абсолютной копией исходного — скорее всего, вам придется добавить отсутствующие слова, удалить лишние пробелы и исправить опечатки.

    Реклама

  1. Изображение с названием Turn a Scanned Document Into Microsoft Word Document Step 16

    1

    Запустите приложение Office Lens. Нажмите на красно-белый значок с камерой и буквой «L».

    • Если у вас нет этого приложения, скачайте его на Play Маркете для Android-устройства или в App Store для iPhone.
  2. Изображение с названием Turn a Scanned Document Into Microsoft Word Document Step 17

    2

    Разрешите Office Lens получить доступ к телефону. Если вы впервые запускаете Office Lens, нажмите «Разрешить» или «OK», чтобы приложение получило доступ к файлам телефона.

  3. Изображение с названием Turn a Scanned Document Into Microsoft Word Document Step 18

    3

    Коснитесь Документ. Это вкладка внизу экрана.

  4. Изображение с названием Turn a Scanned Document Into Microsoft Word Document Step 19

    4

    Направьте камеру телефона на документе. Сделайте так, чтобы весь документ, который вы хотите отсканировать, отобразился на экране.

    • Убедитесь, что документ хорошо освещен, чтобы запечатлеть как можно больше деталей.
  5. Изображение с названием Turn a Scanned Document Into Microsoft Word Document Step 20

    5

    Нажмите кнопку съемки. Это красный круг в нижней части экрана. Будет сделано фото документа.

  6. Изображение с названием Turn a Scanned Document Into Microsoft Word Document Step 21

    6

    Нажмите

    Android 7 Done

    . Этот значок находится в правом нижнем углу экрана.

    • Чтобы отсканировать больше страниц, нажмите на символ «+» в нижней части экрана.
  7. Изображение с названием Turn a Scanned Document Into Microsoft Word Document Step 22

    7

    Коснитесь Word. Вы найдете эту опцию в разделе «Сохранить» на странице «Экспортировать в».

    • На Android-устройстве коснитесь квадратного значка у «Word», а затем нажмите «Сохранить» в нижней части экрана.
  8. Изображение с названием Turn a Scanned Document Into Microsoft Word Document Step 23

    8

    Войдите в свою учетную запись Microsoft. Если вы еще не авторизовались, введите адрес электронной почты и пароль. Теперь документ Word загрузится в вашу учетную запись OneDrive.

    • Это должна быть учетная запись, которую вы используете для входа в Microsoft Word.
  9. Изображение с названием Turn a Scanned Document Into Microsoft Word Document Step 24

    9

    Откройте Word на компьютере. Нажмите на синий значок с белой буквой «W».

  10. Изображение с названием Turn a Scanned Document Into Microsoft Word Document Step 25

    10

    Щелкните по Открыть другие документы. Эта опция находится в левой части раздела «Последние».

    • На компьютере Mac просто щелкните по значку папки у «Открыть» в левой части окна.
  11. Изображение с названием Turn a Scanned Document Into Microsoft Word Document Step 26

    11

    Нажмите Персональный OneDrive. Эта опция находится в верхней части окна. Откроется папка OneDrive.

    • Если вы не видите опцию «OneDrive», нажмите «+» > «Добавить место» > «OneDrive» и войдите в свою учетную запись Microsoft.
  12. Изображение с названием Turn a Scanned Document Into Microsoft Word Document Step 27

    12

    Перейдите в папку Office Lens. Откройте папку «Документы», а затем щелкните по папке «Office Lens». Они находятся на правой панели окна.

  13. Изображение с названием Turn a Scanned Document Into Microsoft Word Document Step 28

    13

    Дважды щелкните по документу Word, который был создан с помощью приложения «Office Lens».

    Реклама

Советы

  • Приложение Office Lens лучше работает с текстом на бумаге, чем с текстом на экране.

Реклама

Предупреждения

  • Результат распознавания текста сервисом New OCR зависит от качества текста на изображении. Чтобы получить оптимальный результат, отсканируйте документ в PDF-файл, а затем преобразуйте его с помощью программы Word (как описано в первом разделе).

Реклама

Об этой статье

Эту страницу просматривали 341 433 раза.

Была ли эта статья полезной?

сканирование и распознаваниеДобрый день.

Наверное, каждый из нас сталкивался с задачей, когда нужно перевести бумажный документ в электронный вид. Особенно это часто нужно делать тем кто учиться, работает с документацией, переводит тексты при помощи электронных словарей и т.д.

В этой статье мне хотелось бы поделиться некоторыми азами этого процесса. Вообще, сканирование и распознавание текста —  довольно трудоемко, так, как большинство операций придется делать вручную. Мы попытаемся разобраться по шагам, что, как и почему.

Не все сразу понимают одну вещь. После сканирования (пригона всех листов на сканере) у вас будут картинки формата BMP, JPG, PNG, GIF (могут быть и другие форматы). Так вот с этой картинки нужно получить текст — это процедура называется распознаванием. В таком порядке и будет изложение ниже.

1. Что нужно для сканирования и распознавания?

1) Сканер

Для перевода печатных документов в текстовый вид, вам для начала нужен сканер и соответственно, «родные» программы и драйверы, которые с ним шли. При помощи них можно будет сканировать документ и сохранить его для дальнейшей обработки.

Можно воспользоваться и другими аналогами, но софт, который шел со сканером в комплекте, обычно работает быстрее и имеет больше опций.

В зависимости от того, какой у вас сканер — скорость работы может существенно различаться. Есть сканеры, которые могут получить картинку с листа за 10 сек., есть которые будут получать за 30 сек. Если сканируете книгу  на 200-300 листов — думаю, не трудно подсчитать во сколько раз будет разница во времени?

2) Программа для распознавания

В нашей статье я буду показывать вам работу в одной из лучших программ для сканирования и распознавания абсолютно любых документов — ABBYY FineReader. Т.к. программа платная, то сразу дам ссылку и на другую — ее бесплатный аналог Cunei Form. Правда, я бы не стал их сравнивать, ввиду того, что FineReader выигрывает по всем параметрам, рекомендую все же попробовать именно ее.

abby

ABBYY FineReader 11

Официальный сайт: http://www.abbyy.ru/

Одна из лучших программ в своем роде. Она предназначена для того, чтобы распознать текст на картинке. Встроено множество опций и функций. Может разобрать кучу шрифтов, поддерживает даже рукописные варианты (правда, лично не пробовал, думаю, хорошо вряд ли будет распознавать рукописный вариант, если только у вас не идеальный каллиграфический почерк). Более подробно о работе с ней будет рассказано ниже. Здесь же отметим, что в статье будет рассказано о работе в программе 11 версии.

Как правило, разные версии  ABBYY FineReader не сильно отличаются друг от друга. Вы без труда сделаете то же самое и в другой. Главные отличия могут быть в удобстве, быстроте работы программы и ее возможностях. Например, более ранние версии отказываются открывать документ PDF и DJVU…

3) Документы для сканирования

Да, вот так вот, решил вынести документы отдельной графой. В большинстве случаев сканируют какие-нибудь учебники, газеты, статьи, журналы и пр. Т.е. те книги и ту литературу которая пользуется спросом. Я это к чему веду? Из личного опыта могу сказать, что многое, что вы захотите сканировать — возможно уже есть в сети!  Сколько раз лично я экономил время, когда находил ту или иную книгу уже сканированную в сети. Мне оставалось только скопировать текст в документ и продолжить с ним работу.

Из этого простой совет — прежде чем что-то сканировать, проверьте, может уже кто-то отсканировал и вам не нужно терять свое время.

2. Параметры сканирования текста

Здесь я не будут рассказывать о ваших драйверах для сканера, программах, которые вместе с ним шли, ибо все модели сканеров разные, ПО тоже везде разное и угадать и тем более показать наглядно как выполнять операцию — нереально.

Но во всех сканерах есть одни и те же настройки, которые сильно могут повлиять на скорость и качество вашей работы. Вот о них таки как раз и поговорим здесь. Буду перечислять по порядку.

1) Качество сканирования — DPI

Во-первых, качество сканирования поставьте в опциях не ниже 300 DPI. Желательно даже выставить побольше, если это возможно. Чем выше показатель DPI — тем четче получиться ваша картинка, ну и тем самым, быстрее пройдет дальнейшая обработка. К тому же чем выше качество сканирования — тем меньше ошибок вам в последствии придется исправлять.

Оптимальный вариант обеспечивает, обычно, 300-400 DPI.

2) Цветность

Этот параметр очень сильно влияет на время сканирования (кстати, DPI тоже влияет, но те так сильно, и только когда пользователь ставит высокие значения).

Обычно выделяют три режима:

— черно-белый (отлично подойдет для простого текста);

— серый ( подойдет для текста с таблицами и картинками);

— цветной (для цветных журналов, книг, в общем, документов, где важна цветность).

Обычно от выбора цветности зависит время сканирования. Ведь если документ у вас большой, то даже лишние 5-10 секунд на странице в целом выльются в приличное время…

3) Фотографии

Документ вы можете получить не только сканированием, но и сфотографировав его. Как правило, в этом случае у вас будут некоторые другие проблемы: искажение картинки, смазанность. Из-за этого может потребоваться более длительная дальнейшая правка и обработка полученного текста. Лично я не рекомендую пользоваться фотоаппаратами для этого дела.

Важно отметить, что не каждый такой документ получится распознать, т.к. качество сканирования у него может быть крайне низким…

3. Распознавание текста документа

Будем считать, что заветные сканированные страницы вы получили. Чаще всего они представляют собой форматы: tif, bmb, jpg, png. В общем-то, для ABBYY FineReader — это не сильно важно…

После открытия в ABBYY FineReader картинки, программа, как правило, на автомате начинает выделять области и распознавать их. Но иногда она делает это не правильно. Для этого-то мы и рассмотрим выделение нужных областей вручную.

Важно! Не все сразу понимают, что после открытия документа в программе, слева в окне отображается исходный документ, в котором вы и выделяете различные области. После нажатия на кнопку «распознавания» программа в окне справа выведет вам готовый текст. После распознавания, кстати, целесообразно проверить текст на ошибки в том же самом FineReader.

3.1 Текст

Эта область используется для выделения текста. Картинки и таблицы нужно исключать из нее. Редкие и необычный шрифты придется вводить вручную…

Для выделения текстовой области, обратите внимание на панель в верхней части FineReader. Там есть кнопка «Т» (см. скриншот ниже, указатель мышки как раз на этой кнопке). Щелкаете по ней, затем на картинке ниже выделяете аккуратно прямоугольную область, в которой располагается текст. Кстати, в некоторых случаях нужно создавать текстовых блоков по 2-3, а иногда по 10-12 на страницу, т.к. форматирование текста может быть разным и одним прямоугольником всю область не выделить.

Важно отметить, что в текстовую область не должны попадать картинки! В дальнейшем это вам сэкономит кучу времени…

Документ без имени [1] - ABBYY FineReader 11 Professional Edition_2013-11-03_10-07-33

3.2 Картинки

Используется для выделения картинок и тех областей, которые тяжело распознать из-за плохого качества, или необычности шрифта.

На скриншоте ниже указатель мышки находится на кнопке, используемой для выделения области «картинка». Кстати, в эту область можно выделить абсолютно любую часть страницы, а FineReader вставит ее потом в документ как обычную картинку. Т.е. просто «тупо» скопирует…

Обычно эту область используют для выделения плохо отсканированных таблиц, для выделения нестандартного текста и шрифта, само-собой картинок.

картинки

3.3 Таблицы

На скриншоте ниже показана кнопка для выделения таблиц. Вообще, лично я ее использую крайне редко. Дело в том, что вам придется довольно рутинно рисовать (фактически) каждую линию на таблице и показывать что и как программе. Если таблица небольшая и в не очень хорошем качестве, я рекомендую для этих целей использовать область «картинка». Тем самым сэкономите кучу времени, а таблицу можно потом в Word сделать быстренько на основе картинки.

таблица

3.4 Ненужные элементы

Важно отметить. Иногда на странице есть ненужные элементы, которые мешают распознать текст, или вообще не дают вам выделить нужную область. Их можно при помощи «ластика» удалить вовсе.

Для этого переходим в режим редактирования изображения.

Документ без имени [1] - ABBYY FineReader 11 Professional Edition_2013-11-03_10-14-11

Выбираем инструмент «ластик» и выделяем ненужную область. Она сотрется и на ее месте будет белый лист бумаги.

Документ без имени [1] - ABBYY FineReader 11 Professional Edition_2013-11-03_10-14-21

Кстати, рекомендую использовать вам эту опцию как можно чаще. Старайтесь все текстовые области которые вы выделили, где вам не нужен кусок текста, или присутствуют любые ненужные точки, размытости, искажения — удалять ластиком. Благодаря этому распознавание будет быстрее!

4. Распознавание файлов PDF/DJVU

Вообще, этот формат распознавания не будет отличаться ничем другим от остальных — т.е. работать с ним можно так же как с картинками. Единственное, программа не должна быть слишком старой версии, если файлы PDF/DJVU у вас не открываются — обновите версию до 11.

Небольшой совет. После открытия документа в FineReader — он автоматически начнет распознавать документ. Часто в файлах PDF/DJVU определенная область страницы не нужна во всем документе! Чтобы удалить такую область на всех страницах сделайте следующее:

1. Зайдите в раздел редактирования изображения.

2. Включите опция «обрезки».

3. Выделите область, нужную вам на всех страницах.

4. Нажмите применить ко всем страницам и обрежьте.

Документ без имени [1] - ABBYY FineReader 11 Professional Edition_2013-11-03_10-19-21

5. Проверка ошибок и сохранение результатов работы

Казалось бы, какие еще могут быть проблемы, когда все области были выделены, затем распознаны — бери да сохраняй… Не тут то было!

Во-первых, нужна проверка документа!

Чтобы ее включить, после распознавания, в окне справа, будет кнопка «проверка», см. скриншот ниже. После ее нажатия программа FineReader будет автоматически показывать вам те области, где у программы возникли ошибки и она не смогла достоверно определить тот или иной символ. Вам останется только выбирать, либо вы согласны с мнением программы, либо вводите свой символ.

Кстати, в половине случаев, примерно, программа будет вам предлагать готовое правильное слово — вам останется толкьо мышкой выбрать нужный вариант.

проверка документа

Во-вторых, после проверки вам нужно выбрать формат, в который вы сохраните результат своей работы.

Здесь FineReader дает вам развернуться на полную катушку: можно просто передать информацию в Word один в один, а можно сохранить ее в одном из десятков форматов. Но хотелось бы выделить другой важный аспект. Какой формат бы не выбрали, более важно выбрать тип копии! Рассмотрим самые интересные варианты…

Документ без имени [1] - ABBYY FineReader 11 Professional Edition_2013-11-03_10-24-08

 Точная копия

Все области, которые вы выделяли на странице в распознанном документе будут соответствовать точь в точь исходному документу. Очень удобный вариант, когда вам важно не потерять форматирование текста. Кстати, шрифты так же будут очень похожи на оригинал. Рекомендую при таком варианте передавать документ в Word, чтобы уже там продолжить дальнейшую работу.

Редактируемая копия

Этот вариант хорош тем, что вы получите уже форматированный вариант текста. Т.е. отступов с «километр», которые возможно были в исходном документе — вы не встретите. Полезная опция, когда вы будете значительно редактировать информацию.

Правда, не стоит выбирать, если вам важно сохранить стилистику оформления, шрифты, отступы. Иногда, если распознавание прошло не очень успешно — ваш документ может «перекосить» из-за измененного форматирования. В этом случае целесообразно выбрать точную копию.

Простой текст

Вариант для тех, кому нужен просто текст со странице без всего остального. Подойдет для документов без картинок и таблиц.

На этом статья по сканированию и распознаванию документа подошла к концу. Надеюсь, что при помощи этих простых советов вы сможете решить свои задачи…

Удачи!

  • Распечатать

Оцените статью:

  1. 5
  2. 4
  3. 3
  4. 2
  5. 1

(12 голосов, среднее: 3.3 из 5)

Поделитесь с друзьями!

Понравилась статья? Поделить с друзьями:
  • Как распознать текст с картинки в word онлайн бесплатно
  • Как распознать текст с картинки в excel
  • Как распознать текст в формате word
  • Как распознать текст в microsoft word
  • Как распознать текст в excel бесплатно