FineReader 11: безупречное опознание
Написал Максим ИВАНОВ   
27.11.2011

FineReader известен практически каждому пользователю компьютера. Первая версия вышла в далеком 1993 году, и с тех пор разработка российской компании ABBYY непрерывно развивалась и совершенствовалась, став мировым лидером среди программ по распознаванию текста. В конце августа вышла очередная версия - ABBYY FineReader 11. Каждое крупное обновление вызывает закономерный вопрос: стоит ли платить за переход на новую версию или можно вполне обойтись старой? >>>

Как обычно, FineReader выпускается в трех вариантах: Home Edition, Professional Edition и Corporate Edition. Различаются они функционально и, разумеется, ценой. Домашняя версия обойдется в 1490 рублей (коробочная версия), обновление встанет в 900 рублей. Профессиональная стоит дороже - 3990 руб. и 2390 руб. соответственно. Мы будем рассматривать демоверсию ABBYY FineReader 11 Professional Edition. Пробная версия имеет ограничение как по длительности, так и по объему работы: ознакомительный период - 15 дней плюс возможность распознать 50 страниц и сохранить/распечатать за раз не более 1 страницы. Впрочем, для оценки новых возможностей этого достаточно. Прежде чем мы к ним перейдем, дадим краткую характеристику FineReader 11.

Системные требования: ОС Windows XP и выше. Процессор: 1 ГГц (минимум). Но вот памяти требуется немало - не менее 1 Гб и для каждого ядра дополнительно по 512 Мб. Также требуется 700 Мб на жестком диске для установки и столько же для работы.

Основная задача FineReader - это распознавание текста и перевод его в форматы, доступные для редактирования (в том числе PDF с текстовым слоем и возможностью поиска). Причем в последних версиях возможно распознавание с точным сохранением форматирования, что актуально в ряде случаев.

Источником данных могут служить сканеры, МФУ, фотоаппараты, камеры мобильных устройств либо изображения-файлы, в том числе такие форматы, как PDF, DJVU и XPS. Разумеется, есть поддержка TWAIN- или WIA-совместимых сканеров. Также программа интегрируется с некоторыми приложениями (MS Word 2002 и выше, MS Excel 2002 и выше, MS PowerPoint 2003 и выше, OpenOffice.org 3, Adobe Acrobat/Reader 5.0 и выше), что позволяет распознанный текст сразу открывать в нужной вам программе для последующей доводки и исправления мелких огрехов. К счастью, неточностей в распознавании с каждой версией становится меньше.

FineReader 11 понимает текст на 188 языках (включая иероглифы), при этом для 45 языков присутствуют словарная поддержка и проверка орфографии. Интерфейс программы доступен на 23 языках.

11 нововведений FineReader 11

1. Выше скорость. По словам разработчиков, средняя скорость распознавания документов возросла на 20%. Если же обрабатывать данные в специальном черно-белом режиме, удастся ускорить работу программы почти в два раза. А заодно и сэкономить место на жестком диске. Кроме того, есть режим быстрого распознавания, ускоряющий работу более чем в два раза за счет уменьшения точности распознавания. Честно говоря, большинству пользователей, нечасто прибегающих к помощи FineReader, от этих “ускорений” будет ни жарко ни холодно. Но в случае обработки большого массива документов новая версия сэкономит немало времени.

2. Выше точность. Авторская технология Advanced Document Recognition Technology (ADRT) позволяет максимально точно сохранить исходную структуру многостраничных документов, включая расположение текста, таблиц, колонтитулов, примечаний, нумерации, содержания, оглавления и тому подобных элементов. В 11-й версии обещают следующее: до 25% улучшено распознавание таблиц и до 15% - изображений и графиков, добавлено восстановление вертикальных колонтитулов, до 70% улучшено определение текста на полях документа, до 40% - заголовка и колонтитулов. Проверить точность этих цифр сложно, но в то, что программа стала лучше распознавать текст, охотно верим. Не зря же разработчики хлеб едят.

Кстати, позволим небольшую ремарку о скорости и точности работы программы. Не следует забывать, что она напрямую зависит от используемого железа или качества документов-оригиналов. Если сканер медленный, а изображения текста плохого качества - не стоит ждать от FineReader чудес.

3. Создание электронных книг. В последние годы мы наблюдаем за тем, как электронные книги “захватывают” мир. Еще недавно они были в диковинку, сегодня их может позволить почти каждый. Соответственно, большинство программ, активно работающих с текстом, обзаводятся поддержкой ebook-форматов. Не остался в стороне и FineReader, в котором появилась возможность создавать электронные книги в популярных форматах fb2, ePub и других. Сама операция может выглядеть следующим образом: отсканировал книгу, распознал, перегнал в нужный формат и закинул на смартфон, ридер, планшет и т. п. В частности, созданную электронную книгу из FineReader можно сразу отправить на свой аккаунт Amazon. В последующих версиях работа с электронными книгами будет наверняка расширена за счет поддержки новых форматов и устройств.

4. Новые форматы. Теперь текст можно сохранять в свободном формате ODT (Open Office.org Writer) либо DjVu. Форматы не столь распространены, но эта возможность обязательно найдет своих сторонников.

5. Работа со стилями. Разработчики обновили редактор стилей текста. Используемые в документе стили можно редактировать, объединять, причем изменения автоматически будут применены ко всему документу.

В FineReader, который создавался лишь для распознавания текста, появляется все больше функций, свойственных текстовым редакторам. Это изменение шрифта, размера, начертания, выравнивания и так далее. Работать в популярных текстовых процессорах (Word, Writer) все равно привычнее и удобнее, но иногда что-то проще сделать в самом FineReader. Так что появление подобных функций, если они не усложняют и не замедляют работу программы, можно только приветствовать.

6. Помногу и сразу. Иногда приходится сканировать и распознавать большое количество документов с различным форматированием и оформлением. В таких случаях работа идет таким образом: сканируется и распознается один документ, потом следующий и так далее. Теперь необходимость в этом отпала - обещается интеллектуальное распознавание (технология ADRT), которое “разберется” в куче разноформатных документов, сканируемых без перерыва подачи, и распознает каждый со своими настройками.

7. Из фото в текст. Фотокамеры ныне можно встретить даже в сотовых телефонах, поэтому нередко приходится распознавать изображения документов с очень плохим качеством. В новой версии повысилась точность распознавания, улучшилась возможность ручной корректировки изображений, сделанных на мобильные камеры (выравнивание строки на сгибах страниц разворота книги или исправление трапециевидных искажений).

8. Обработка изображений. Эта функция также улучшилась. Пользователи теперь могут настраивать значения яркости и контрастности изображений, уровни интенсивности света и тени. Причем изменения можно применить к отдельным страницам или ко всем сразу. Значит, придется реже прибегать к услугам редакторов изображений для корректировки некоторых параметров изображений.

9. Даешь PDF. FineReader 11 имеет три варианта сохранения распознанного документа в формат PDF: высокое качество (качество исходного изображения сохраняется), минимальный размер (для архивирования) и сбалансированный режим (для публикации в Интернете). Улучшена технология сжатия (MRC), за счет чего размер готового PDF-файла может уменьшиться в несколько раз по сравнению с аналогичным, созданным в предыдущей версии (ABBYY FineReader 10).

10. Больше языков. Добавлена поддержка вьетнамского и туркменского (латиница) языков, в результате их число увеличилось до 188. Впрочем, здесь есть куда расти: в "Википедии" уже присутствует 271 активный раздел на различных языках.

11. Маленький подарок. Зарегистрированные пользователи программы получат уже знакомое приложение ABBYY Screenshot Reader, позволяющее делать снимки любой области экрана и сразу же их распознавать. В новой версии стало проще задавать размер области для снимка.

* * *

Для тех, кто еще пользуется старыми версиями либо не знаком с программой, расскажем об азах работы. Для удобства пользователей при запуске FineReader 11 мы увидим окно “Задачи” с пятью вкладками: “Основные”, Microsoft Word, Adobe PDF, E-book, “Другие”. Тех задач, которые сгруппированы во вкладках, достаточно для выполнения большинства операций, доступных программе. Не нужно залезать в меню, что-то изучать.

Во вкладке “Основные” сгруппированы популярные: “Сканирование в Word”, PDF в Word, “Сканировать и сохранить изображение”, “Сканировать в PDF с возможностью поиска”, “Фото в Word”. Все возможные параметры доступны тут же и настраиваются одним-двумя щелчками мыши. К примеру, “Сканирование в Word” дает четыре способа оформления: точная копия, редактируемая копия, форматированный текст, только текст. При этом можно выбрать, сохранять ли изображения и колонтитулы.

Резюме

В целом ABBYY FineReader 11 не содержит революционных изменений. Оно и понятно - программа давно завоевала доверие пользователей качественной и быстрой работой. К тому же конкуренты находятся далеко. От этого и небольшое количество эволюционных изменений.

Обновлять ли программу? Если вы обладаете предыдущей версий либо используете FineReader редко, ответ будет - нет. Если же нововведения вас не просто заинтересовали, но и показались полезными, обновляйтесь.

Максим ИВАНОВ, специально для www.softkey.info



30866 просмотров

  Коментарии
Написал(а) dim, в 2011-12-21 08:25:37
классная штука но дорого то как блин...а может тем кто за чертой и нечего развиваться? а существуют ли похожие бесплатные? Зорыч подскажи заодно как можно выйти в интернет из ОС Убунту посредством usb модема или через мобильник? В нашей местности это единственный вариант
Сюрпризы программы finereader 11
Написал(а) pas_128, в 2011-12-21 15:43:32
Преподнёс сюрприз finereader 11, аднака! Теперь нет привычной возможности сохранять изображения отдельных страниц документа finereader, особенно выделенных участков страницы (комбинация клавиш ctrl+shift+s или f12 (в более ранних версиях), чем я регулярно пользовался в предыдущих версиях (хотя есть всё-таки возможность сохранять выделенные страницы в виде изображений в области миниатюр страниц с помощью контекстного меню, но это явно не то - шаг назад). Ей Богу, какая-то странная логика развития программного продукта! (Вспомнилось крылатое выражение В.И. Ленина: \"Шаг вперёд, два шага назад\")
Написал(а) dim, в 2011-12-22 14:46:17
извиняюсь! Я все ответы нашел в 4номере за 2009г! Настоящая энциклопедия (МойДрКом-р).Спасибо

Добавить комментарий
  • Пожалуйста оставляйте комментарии только по теме.
Имя:
E-mail
Домашняя страница
Тема:
BBCode:СсылкаEmailЖирный текстКурсивПодчёркнутый текстКавычкиCodeСписокПункт спискаЗакрыть список
Коментарий:



Код:* Code