Как отредактировать документ после сканирование изображение. Сканирование и изменение документа

Для сохранения электронных копий оригинальных «бумажных» документов их подвергают сканированию. Иногда полученные таким способом дубликаты распознаются с помощью совмещенных с программами сканирования OCR-приложений, а иногда сохраняются в виде картинки. Нередко после сканирования в исходный документ вносятся какие-либо изменения, которые требуется отобразить и в электронной копии. Отредактировать «скан» можно несколькими способами.

Инструкция

  • Если сканирование осуществлялось в режиме распознавания текста, то содержимое полученного документа можно изменить еще до его сохранения - большинство программ, предназначенных для сканирования и распознавания, имеют встроенные редакторы текста. Например, в популярной среди русскоязычных пользователей сканеров программе FineReader каждая страница отсканированного и переведенного в текстовый формат документа открывается в отдельном окне, имеющем меню редактирования, функциональные возможности которого схожи с функциями обычного текстового редактора. Если же отсканированный и распознанный текст был сохранен в файл, то изменить его можно стандартным текстовым редактором. Воспользуйтесь для этого, например, Microsoft Word - этот текстовый процессор способен прочесть большинство форматов, используемых для сохранения текстов OCR-программами.
  • Если отсканированный документ был сохранен в формате изображения, то для его правки следует использовать какой-либо графический редактор. В некоторых случаях будет достаточно стандартного приложения Paint, устанавливаемого по умолчанию вместе с операционной системой Windows. Откройте в нем файл, содержащий изображение отсканированного текста, выделите участок картинки, который следует заменить, и залейте его цветом, совпадающим с фоном документа. Затем подберите размер, цвет и шрифт, соответствующий тексту, и напечатайте новый фрагмент поверх залитого участка. Однако в большинстве случаев для замены текста требуется более тщательная работа с изображением - копирование фоновых участков и помещение копий поверх текста в несколько слоев, деформация набранного текста в соответствии с состоянием исходного документа, копирование и вставка отдельных букв и слов текста и т.д. Поэтому намного больше подходит для этой работы более продвинутый графический редактор - например, Adobe Photoshop.
  • Есть и еще один способ замены фрагмента исходного текста в сохраненном как изображение отсканированном документе. Его можно использовать, если есть возможность сканирования нового фрагмента с отредактированным текстом. Нужный текст можно напечатать на такой же (или той же самой) бумаге, что и исходный документ, поэтому внешний вид исходного и исправленного фрагментов будет совпадать в большей мере, чем этого можно добиться в графическом редакторе. Отсканированную часть текста затем надо наложить на редактируемый документ с помощью любого графического редактора - такая операция предусмотрена практически во всех приложениях этого рода.
  • Довольно часто среди пользователей сканеров возникает вопрос о том, как отредактировать отсканированный документ. В целом решить задачу подобного рода можно, воспользовавшись специальным программным обеспечением или онлайн-сервисом, который поддерживает конвертацию из PDF в любой удобный для редактирования формат. Ниже вы можете ознакомиться с несколькими популярными ПО и сервисами, которые помогут вам произвести конвертирование отсканированных документов с целью их дальнейшего редактирования.

    Решение задачи с помощью OCR

    Если вам нужно редактирование отсканированных документов, то воспользуйтесь любой программой OCR, функция которой заключается в оптическом распознавании символов. Данное ПО сравнивает символы в отсканированном файле с теми символами, которые имеются в его БД. После этого, программа данной категории производит конвертацию файла в удобный текстовый формат. Однако примите во внимание, что далеко не все OCR способны работать на бесплатной основе – среди них есть немало и платных вариантов. Также учтите, что в зависимости от того, насколько качественно вам удастся выполнить сканирование оригинала, вы можете столкнуться с различными ошибками, редактируя готовый скан. Чтобы решить непосредственно задачу связанную с тем, как редактировать сканированный текст следуйте следующей инструкции:

    • Загрузите программу OCR с официального сайта разработчика или любого надежного веб-ресурса и установите ее.
    • Откройте редактируемый файл в окне программы. Данный процесс может отличаться для каждого ПО подобного типа, но в целом от вас потребуется открыть файл, после чего запустить процесс конвертации. Во многих таких программах можно выбирать подходящий формат выходного файла. Главное, чтобы измененный тип документ был удобен для вас.
    • После произведенной конвертации вам нужно будет удалить из готового файла форматирование, если с ним возникли какие-то проблемы. Дело в том, что ПО может учесть форматирование, к примеру, шрифты, межстрочные интервалы, если сканируемый файл отсканируется недостаточно ровно. Чтобы удалить форматирование используйте любой текстовый редактор, к примеру, обычный «Блокнот». Он, как правило, не способен распознавать форматирование, благодаря чему вставить текст в него можно без лишнего кода.
    • В конце вам нужно открыть новый документ в любом удобном редакторе и приступить к такому процессу, как редактирование сканированных документов. Обязательно воспользуйтесь функцией проверки орфографии, чтобы вовремя найти все ошибки и устранить их. Но ошибки, связанные с форматированием, придется исправлять ручным образом.

    Но прежде чем включить сканер и отсканировать тот или иной текст, вам стоит изначально определиться с удобной для вас программой оптического распознавания символов. Далее можно ознакомиться с одними из самых популярных и распространенных среди них:

    1. Одной из самых известных программ категории OCR, является ABBYY FineReader, работающая на платной основе. Данное ПО используется для конвертирования сканов в текстовые файлы с помощью запатентованных алгоритмов, которые позволяют распознавать даже текст, имеющий не очень высокое качество. В целом преимущества программы заключаются в высокой точности распознавания текста, способности преобразовывать всю структуру и внешний вид отсканированного текста. Следовательно, она оставит на своих местах не только текст, но также таблицы, рисунки и прочее.
    2. Readiris Pro — также является довольно распространенной программой с функцией OCR, которая обладает очень удобным интерфейсом. С ее помощью можно сохранить распознанный текст в таких форматах, как XPS, OpenOffice, PDF, Word и Excel. Следует добавить, что эта программа позволяет работать с более чем сотней языков мира и форматом DjVu.
    3. Freemore OCR представляет собой программу, распространяемую абсолютно бесплатно. С ее помощью можно достаточно оперативно извлекать графику и текст с отсканированных изображений. Извлеченный текст можно сохранить в виде документа Word. Помимо этого, она обладает функцией многостраничного распознавания. Но учтите, что интерфейс программы выполнен только на английском языке. Однако данное обстоятельство не влияет на удобство ее использования.

    Решение задачи с помощью онлайн-сервисов

    Если вас интересует ответ на вопрос о том, как изменить отсканированный документ, не устанавливая специальных программных приложений, то воспользуйтесь любым онлайн-сервисом, предлагающим конвертирование изображений в текст. Обычно все эти ресурсы работают по одной схеме. Вам нужно лишь загрузить скан документа, предварительно сохранив его в PDF-формате, после чего следуя рекомендации выбрать нужное задание и нажать на что-то типа «Конвертировать» (везде по-разному). Затем сервис выдаст вам готовый файл в виде документа Word.

    • Одним из самых удобных и лучших сервисов, предлагающих конвертирование PDF в Word с целью редактирования скана, является smallpdf.com . Его преимущества заключаются в простом интерфейсе, быстрой работе, отличном качестве результата, поддержке работы с Dropbox и Google-диском и массой дополнительных функций. Бесплатно воспользоваться им можно только два раза в час. При необходимости вы можете приобрести платный Pro-аккаунт, в результате чего список функций будет заметно расширен.
    • Также довольно удобным онлайн-сервисом конвертации является zamzar.com. Он отличается возможностью пакетной обработки файлов, большим количеством вариантов конвертирования и быстротой. При этом использовать этот ресурс можно абсолютно бесплатно. Однако здесь имеются ограничения по размеру – не больше 50 мб. Чтобы снять этот лимит, вам придется оплатить соответствующий тариф. Кроме того, результат можно получить только на e-mail, который придется предварительно ввести перед загрузкой файла.

    Хранить отсканированные документы на жестком диске компьютера или внешнем носителе удобно и безопасно. Однако как внести изменения в страницы, обычно представленные в виде изображения? Нам понадобятся специальные программы, об установке и управлении которыми мы расскажем ниже.

    Как отсканировать документ перед редактированием?

    Чтобы успешно манипулировать файлом в дальнейшем, важно правильно перевести его в формат “картинки”, а также учесть несколько простых, но полезных нюансов в самом процессе. Для этого:

    • Разгладьте все заломы и складки, чтобы они не отобразились на скане и не привели к трудностям в распознавании букв.
    • Для удобства обращения сохраните файл в формате PDF, JPG или TIFF.
    • PDF-документ можно будет открыть и редактировать программой Adobe Acrobat (или любой другой, предназначенной для подобных целей).
    • Зайдите на сайт компании-создателя сканера, либо поищите фирменную программу на прилагавшемся диске (часто известные бренды имеют собственные приложения для изменения отсканированных страниц).
    • Для последующего использования файла в MS Office 2003 или 2007, установите утилиту Microsoft Office Document Scanning. Она производит конвертацию сканируемого файла автоматически, переводя его сразу в текст (программа не работает с более “свежими” версиями Офиса).
    • Рекомендуется сканировать в черно-белой гамме, а не в цветной – это упрощает анализ текста.
    • TIFF формат лучше всего применять для OCR конвертеров, то есть программ, производящих оптическое распознавание.

    Как отредактировать отсканированный документ – работа с OCR-утилитами

    Принцип метода Optical Character Recognition - считывание имеющихся на бумаге символов, их последующее сравнение с элементами из собственной базы данных. Таким образом происходит преобразование сплошной картинки в редактируемый текст. Яркие примеры программ, справляющихся с данной задачей – Adobe Acrobat и Evernote. Чтобы внести исправления в имеющийся скан, просто откройте его одним из таких приложений, весь последующий процесс произойдет автоматически. Когда программа закончит распознавание, то предложит пользователю сохранить документ в одном из доступных форматов.


    Как отредактировать отсканированный документ PDF

    Если отсканированный документ сохранен в файле PDF, мы с легкостью сможем отредактировать его в программе Acrobat DC. Для этого:

    • открываем меню “Инструменты” -> “Редактировать PDF”;
    • программа запускает процесс редактирования, показывая меню подсказок в правом углу сверху;
    • щелкнув на ней и выбрав “Параметры”, можно указать язык распознавания;
    • что внести изменения, просто щелкните на любой строке документа;
    • документ, открытый для редактирования через OCR, сопровождается особой панелью с настройками, размещенной в правой стороне экрана;
    • в разделе “Настройки”, кроме языка, также удобно выбирать отображаемый шрифт, отмечать страницы, которые необходимо редактировать (все или по одной).


    Во всемирной сети существует доступная альтернатива устанавливаемым программам-конвертерам. Это онлайновые OCR, которые без труда переведут полученное изображение в любой текстовый формат. К примеру, сайт pdfonline.com позволит за несколько минут из отсканированного PDF-документа сделать обычный файл MS Word.

    Иногда нет времени для того чтобы создать новый документ и необходимо срочно:

    • отредактировать сканированный чертеж или схему, внести в документ дополнения, комментарии;
    • вставить в сканированный рисунок формы документа поля для заполнения;
    • просто получить чистый, без помарок и лишнего грязного фона документ.

    Для этого сканированный документ предварительно необходимо преобразовать в черно-белый, при необходимости устранить перекос, и очистить от "мусора".
    Предвижу вопрос - почему бы не включить при сканировании черно-белый режим? Можно, но качество полученного изображения в этом случае будет на порядок ниже, чем в рассмотренном примере.

    Существуют специализированные программы для этих целей, такие как Spotlight Pro, но они сложны в использовании, и для их освоения требуется значительное время.

    Я хочу предложить более простой, но эффективный вариант обработки сканированных документов, с помощью программы оптического распознавания текста ABBYY FineReader 9.0.

    Сканировать документ, можно непосредственно из интерфейса программы или вставить для обработки уже сканированный рисунок.

    Для наглядности и усложнения задачи, мы возьмем уже сканированный разворот книги, с перекосом страниц и пожелтевшими от времени страницами. Используя программу ABBYY FineReader 9.0, преобразуем рисунок в черно-белый, исправим перекос и очистим от мусора.

    1. Запускаем программу ABBYY FineReader и в меню Сервис , выбираем команду Опции .
      В открывшемся окне, во вкладке Сканировать/Открыть , отмечаем пункт Не обрабатывать полученные изображения , так как распознавать текст мы не будем - нам нужно только изображение. Выбираем параметры Обработки изображения :
    2. Теперь очистим изображение от мусора - мелких точек. Для этого, просто нажмем 1-3 раза кнопку Очистить изображение , при этом наблюдаем за процессом удаления мусора. при первом нажатии удаляются более мелкие точки, а при последующих, крупнее.

      Участок рисунка до начала процесса очистки от мусора.

      Участок рисунка после однократного нажатия на кнопку Очистить изображение

      Участок рисунка после второго нажатия на кнопку Очистить изображение

    3. Теперь, осталось очистить изображение от крупных "клякс" и затемненных участков. Сделать это можно с помощью инструмента Ластик .
      Принцип работы этого инструмента, отличается от работы аналогичных инструментов других распространенных графических редакторов, и конечно в лучшую сторону. В данном случае, отпадает необходимость "ёрзать" пиктограммой листика по изображению, периодически выбирая команду отмена, после нечаянно стертой полезной информации. Стереть участок изображения в программе ABBYY FineReader, можно методом выделения этого участка.
      Удерживая левую кнопку мыши, выделяем участок изображения любых размеров, и, убедившись, что в выделенный участок входят только элементы, предназначенные для удаления, отпускаем кнопку. Выделенный участок очищен.
    4. Осматриваем получившийся очищенный рисунок, и на одной из страниц обнаруживаем небольшой нюанс. Строки текста слегка искажены. Но оказывается и от этого дефекта сканирования можно легко избавится. Нажимаем кнопку Исправить искажение строк , и дефект исправлен.

      Участок изображения до исправления искажения строк

      Участок изображения после исправления искажения строк

    5. Вот и все, получилось чистое, без перекосов и искажения строк изображение.

    Его можно распечатать, не тратя лишнюю краску на кляксы и грязь, отправить по электронной почте другу, без угрызения совести за не качественный скан, а так же сохранить для дальнейшего использования в любом из поддерживаемых форматов.

    Для сохранения изображения в меню Файл , выбираем команду Сохранить изображение как... . Выбираем любой из поддерживаемых форматов:
    Bitmap, черно-белый (*.bmp; *.dib; *.rle)
    Bitmap, серый (*.bmp; *.dib; *.rle)
    Bitmap, цветной (*.bmp; *.dib; *.rle)
    DCX, черно-белый (*.dcx)
    DCX, серый (*.dcx)
    DCX, цветной (*.dcx)
    JBIG2 (*.jb2; *.jbig2)
    JPEG 2000, серый (*.jp2; *.j2k)
    JPEG 2000, цветной (*.jp2; *.j2k)
    JPEG, серый (*.jpg; *.jpeg)
    JPEG, цветной (*.jpg; *.jpeg)
    PCX, черно-белый (*.pcx)
    PCX, серый (*.pcx)
    PCX, цветной (*.pcx)
    PNG, черно-белый (*.png)
    PNG, серый (*.png)
    PNG, цветной (*.png)
    TIFF, черно-белый, несжатый (*.tif; *.tiff)
    TIFF, черно-белый, packbits (*.tif; *.tiff)
    TIFF, черно-белый, сжатие: ZIP (*.tif; *.tiff)
    TIFF, черно-белый, сжатие: LZW (*.tif; *.tiff)
    TIFF, черно-белый, Group4 (*.tif; *.tiff)
    TIFF, серый, несжатый (*.tif; *.tiff)
    TIFF, серый, Packbits (*.tif; *.tiff)
    TIFF, серый, сжатие: JPEG (*.tif; *.tiff)
    TIFF, серый, сжатие: ZIP (*.tif; *.tiff)
    TIFF, серый, сжатие: LZW (*.tif; *.tiff)
    TIFF, цветной, несжатый (*.tif; *.tiff)
    TIFF, цветной, Packbits (*.tif; *.tiff)
    TIFF, цветной, сжатие: JPEG (*.tif; *.tiff)
    TIFF, цветной, сжатие: ZIP (*.tif; *.tiff)
    TIFF, цветной, сжатие: LZW (*.tif; *.tiff)
    PDF (*.pdf)


    Очищенные сканы страниц от "мусора" и с исправленным искажением строк.

    Хочется отметить, многие в настоящее время переводят свои документы (чертежи, схемы, книги...) в электронный вид. При большом объеме работ, удобнее использовать для этих целей фотоаппарат. С некоторыми моделями сканеров и фотоаппаратов, поддерживающих функцию переснятия документов, программа ABBYY FineReader, идет в комплекте. При выборе инструмента для перевода документов в электронный вид, следует учесть это, так как FineReader, с учетом её основного назначения - оптического распознавания текста, для тех, кто работает с документами не менее полезная программа, чем текстовый редактор.

    После завершения поиска документа, можно открыть документ в Word для его изменения. Как это сделать зависит от версии Office, в которой установлены.

    Сканирование документа в формате PDF и изменить в Word

    Совет: Преобразование лучше всего работает с документами, содержащими преимущественно текст.

      Сканирование документа в соответствии с инструкциями для сканера и сохраните его на своем компьютере как PDF-файл.

      В Word, выберите файл > Открыть .

      Перейдите к нужному PDF-файл на своем компьютере и нажмите кнопку Открыть .

      Появится сообщение о том, что Word будет преобразовать PDF-файла в редактируемый документ Word. Нажмите кнопку ОК .

    См. также

    Параметр со сканера или камеры для сканирование изображений и документов недоступен в Word 2010. Вместо этого можно использовать сканер для сканирования документа, и сохраните файл на своем компьютере.

    Программа Microsoft Office Document Imaging была удалена из Office 2010, однако вы можете установить ее на своем компьютере, используя один из вариантов, описанных в статье Установка приложения MODI для использования совместно с Microsoft Office 2010 .

    Прежде чем продолжать

      Найти и открыть изображений документов Microsoft Office для Обработки изображений документа Microsoft Office в меню Пуск Windows.

      В меню Файл выберите команду Открыть .

      Найдите отсканированный документ и нажмите кнопку Открыть .

      После запуска Microsoft Office Document Imaging нажмите клавиши CTRL+A, чтобы выделить весь документ, а затем нажмите клавиши CTRL+C.

      Запустите Microsoft Word.

      На вкладке Файл нажмите кнопку Создать .

      Дважды щелкните элемент Новый документ .

      Нажмите клавиши CTRL+V, чтобы вставить содержимое отсканированного документа в новый файл.

    Параметр со сканера или камеры для сканирование изображений и документов недоступен в Microsoft Office Word 2007. Вместо этого можно использовать сканер для сканирования документа, и сохраните файл на своем компьютере.

    Шаг 1: Установка Microsoft Office документа обработки изображений

      Завершите работу всех программ.

      Совет: Перед завершением работы всех программ советуем распечатать этот раздел.

      Откройте панель управления: Щелкните правой кнопкой мыши кнопку Пуск и затем выберите пункт Панель управления или введите Панель управления в поле поиска в Windows.

      На панели управления щелкните Программы , а затем - Программы и компоненты .

      Щелкните правой кнопкой мыши название выпуска Microsoft Office установлен, или щелкните правой кнопкой мыши Microsoft Office Word 2007 (в зависимости от того как часть Office или отдельной программы установлен Word) и нажмите кнопку Изменить .

      Выберите Добавить или удалить компоненты , а затем нажмите кнопку Продолжить .

      В разделе Параметры установки щелкните знак "плюс" (+) рядом с компонентом Средства Office .

      Щелкните стрелку рядом с компонентом Microsoft Office Document Imaging , выберите параметр Запускать все с моего компьютера , а затем нажмите кнопку Продолжить .

    Шаг 2: Создание документа, который можно редактировать

    Отсканируйте документ, следуя инструкциям для сканера.

    Прежде чем продолжать , преобразуйте полученный файл в формат TIFF. Для этого можно использовать Paint или другую подобную программу.

    Теперь у вас есть документ, который можно редактировать. Не забудьте сохранить новый файл, чтобы не потерять изменения.

    Интернет