Часто при работе на компьютере возникает необходимость работать с текстом (редактировать, использовать в других приложениях), отображаемом на мониторе, но не доступном для копирования в буфер обмена. При работе программиста это может быть информация из отсканированных книг или справочников, защищенных от копирования, интерфейс программ.
Источники информации, отображаемой на экране, которые не получается скопировать в буфер обмена:
- Отсканированные документы, книги, изображаемые картинкой;
- Справочники (электронные книги), программно защищенные от копирования в буфер обмена;
- Разнообразная информация, отображаемая на экране, например текст интерфейса программы.
Возможны варианты обрабатываемого текста:
- Текст, большой по объему и не видимый целиком на экране (отсканированные документы или информация, программно защищенная от копирования в буфер обмена).
- Текст, весь видимый на экране (часть интерфейса программы или часть документа);
В зависимости от необходимого для обработки объема текста можно использовать различные программы и методики:
- Использовать виртуальный принтер для сохранения текста, программно защищенного от копирования в буфер обмена;
- Использовать распознавание текста с экрана монитора.
Использование виртуального принтера
Практическая ситуация: программист работает на работе с библиотекой стандартных подсистем 1С. Документация размещена на сайте и диске ИТС. Диск только на работе, а работать приходится на работе и дома. Копирование с диска ограничено. В таком случае поможет распечатка документации на принтере (Ctrl + P).
Для экономии бумаги и удобства работы можно использовать виртуальный принтер, который печатает в файл. Сохраненный файл можно потом просмотреть, распечатать или распознать для использования в работе.
В качестве виртуального принтера можно использовать:
- Microsoft Office Document Imaging Writer;
- SnagIt;
- FinePrint.
Виртуальный принтер Microsoft Office Document Imaging Writer входит в пакет Office 2003 и более поздние версии. При печати необходимо выбрать этот принтер.
В результате получим файл с расширением mdi или tif, открываемый программой MSPVIEW.EXE.
Можно найти размещение файла MSPVIEW.EXE: Пуск - Программы - Microsoft Office - Средства Microsoft Office - Microsoft Office Document Imaging. Правой кнопкой мышки вызвать контекстное меню, Свойства. Определить путь размещения файла MSPVIEW.EXE. Например: «c:\Program Files\Common Files\Microsoft Shared\MODI\11.0\» (зависит от версии Microsoft Office).
Можно настроить (при необходимости) открытие файлов mdi с помощью программы «Microsoft Office Document Imaging», это файл MSPVIEW.EXE.
Можно сохраненный файл распознать и отправить текст в Microsoft Word. Для этого используйте меню «Сервис» - «Отправить текст в Microsoft Word». Можно переключить в режим просмотра текста: «Вид» – «Просмотр текста». В этом режиме можно выделить текст и копировать в буфер обмена.
Виртуальный принтер SnagIt (http://www.techsmith.com/snagit-features.html) позволяет печатать в многостраничный графический файл различных форматов. Такие файлы потом можно распознать другими программами или распечатать. Так же возможен режим «Извлечения текстов». Из выделенной области экрана извлекается текст, который можно копировать в буфер обмена.
Виртуальный принтер FinePrint (http://fineprint.com) позволяет печатать в файл с предварительным просмотром страниц. При предварительном просмотре страниц можно выделить текст и сохранить в буфер обмена, сохранить все в текстовом формате TXT или графических форматах, а также распечатать. Таким образом, при печати текста, защищенного от копирования, в окне программы FinePrint можно копировать текст в буфер обмена.
Распознавание текста с экрана монитора
Если есть необходимость копировать и использовать в другом приложении текст, видимый на экране – необходимо вручную набрать текст или использовать программу для оптического распознавания текста документа в редактируемый вид.
Для этого необходимо:
- Копирование экрана (части экрана), например кнопкой «PrtSc» копирование экрана в буфер обмена;
- Сохранение копии экрана в графический файл, например вставка в Paint и сохранение в файл;
- Использование программы для оптического распознавания текста документа в редактируемый вид;
- Копирование необходимого текста после распознавания в буфер обмена;
- Вставка текста из буфера обмена в необходимое приложение.
Для выполнения этого можно использовать различные программы для оптического распознавания текста документа в редактируемый вид.
Например, бесплатная программа CuneiForm или платная программа ABBYY FineReader.
CuneiForm является бесплатной программой и доступна для скачивания и использования всем желающим. Подробнее:
http://cognitiveforms.ru/products/cuneiform/
Ознакомительная версия ABBYY FineReader 10 Home Edition работает на компьютере в течение 15 дней, позволяет распознать 50 страниц и сохранять/напечатать за раз не более 1 страницы из документа. Подробнее:
http://www.abbyy.ru/download/finereader_home_edition
При наличии специальных программ возможно использование упрощенной последовательности действий (без сохранения в файл):
- Копирование экрана (части экрана);
- Оптическое распознавания текста документа и сохранение распознанного текста в буфер обмена;
- Вставка текста из буфера обмена в необходимое приложение.
Для такой работы возможно использование программы ABBYY Screenshot Reader. Входит в состав ABBYY FineReader или распространяется отдельно. Простая и удобная программа для создания снимков любой области экрана. Поможет сохранить изображение всего экрана, окна приложения или выделенной вручную области. Можно использовать любую версию программы. Ознакомительная версия программы работает на компьютере в течение 120 дней. Подробнее:
http://www.abbyy.ru/screenshot_reader/
Для использования программы можно указать область на экране для распознавания и сохранения в буфер обмена или в редактируемый формат (файл).
Программа позволяет сохранять выделенную область в различном виде (текст, таблица, рисунок).
Работать очень просто:
- Запустить программу ABBYY Screenshot Reader (лучше сделать ярлык на рабочем столе);
- При необходимости изменить параметры программы;
- Нажать кнопку программы для выделения и копирования;
- Выделить область на экране;
- Перейти в необходимое приложение и вставить текст из буфера обмена (Ctrl + V).
При этом текст в выделенной области будет распознан и сохранен в буфер обмена, а потом вставлен в указанное место в необходимом приложении.
Рекомендую использовать виртуальный принтер Microsoft Office Document Imaging Writer (входит в пакет Office) для сохранения не редактируемых документов и ABBYY Screenshot Reader для распознавания текста с экрана (части документа, сохраненного Microsoft Office Document Imaging Writer).
Это важно: для улучшения качества распознавания можно увеличить размер экранного шрифта.
Другие публикации по теме:
Программы для создания снимков экрана //infostart.ru/public/19299/