По самым потаенным уголкам винчестера...
Написал Максим ИВАНОВ   
20.02.2014

Современные поисковые системы относительно хорошо научились искать информацию в глобальной сети. А как быть, если нужно найти какую-нибудь информацию на домашнем или рабочем компьютере? Особенно необходима такая возможность студентам, аспирантам, научным сотрудникам, журналистам, писателям. То есть всем тем, у кого со временем появляется большая электронная библиотека, состоящая из десятков и сотен тысяч документов, статей, журналов, книг, сохраненных страниц из интернета и т.п. Google или Яндекс тут бессильны. Существует поисковая утилита, встроенная в Windows, но скорость ее работы, как и качество поиска оставляет желать лучшего. Значит, нужно искать какое-нибудь стороннее приложение. Попробуем в деле "Архивариус 3000".

"Архивариус 3000" - это небольшая программа, предназначенная для поиска документов и почтовых сообщений в компьютере, локальной сети и на съемных дисках (флеш-накопители, компакт-диски). Поиск по содержимому документов основан на тех же принципах, на каких работают поисковые системы в Интернете. Кстати, в свое время были созданы похожие программы Google Desktop и "Персональный поиск Яндекса", но в настоящее время их разработка прекращена.

Программа разрабатывается компанией Likasoft уже больше десяти лет и с тех пор обзавелась широкими возможностями по поиску в различных типах документов (включая архивы), почтовых программах, мессенджерах. Системные требования минимальные: процессор Pentium 166 и выше и минимум 32 Мб ОЗУ. Одним словом, программа будет прекрасно работать на любых компьютерах. Поэтому широк и список поддерживаемых ОС Windows: 95, 98, ME, NT, 2000, XP, 2003, Vista, 2008, 7, 8. Программа переведена на 37 языков, справка на русском языке присутствует.

Десять ключевых возможностей

Создатели программы выделяют десять ключевых преимуществ своей программы. Остановимся на них подробнее.

1. Полная поддержка Юникода (unicode). Юникод - это современный стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков. Это значит, что "Архивариус 3000" может свободно искать информацию в многоязычных документах (они создаются только в формате Юникода). Также не будет проблем с названиями файлов на различных языках.

2. Распознавание более 110 кодировок. К настоящему времени программа умеет распознавать огромное количество кодировок. Это все европейские и кириллические кодировки, распространенные восточноазиатские и ряд других, менее распространенных кодировок.

3. Поддержка более 40 типов документов. Перечислять все форматы документов не имеет смысла. Поддерживаются все популярные типы: от MS Office, RTF и PDF до TXT и LEX. К сожалению, программа пока не умеет искать в документах XDOC, XXLS. Количество распознаваемых форматов давно перевалило за сотню.

4. "Архивариус 3000" умеет искать информацию во всех мало-мальски распространенных архивных форматах. Причем распаковка происходит без использования внешних архиваторов.

5. Поиск в почтовых базах. Очень полезная возможность, так как в почтовых программах пользователей со временем скапливается много нужной информации. Поддерживаются следующие базы: Outlook, Outlook Express, The Bat!, PocoMail, Netscape, Thunderbird (и производных). Поиск ведется как в сообщениях, так и вложениях.

6. Поиск в интернет-пейджерах. Поиск производится по базам сообщений ICQ, QIP, Miranda, Odigo.

7. Многоязычный интерфейс. Благодаря этому и поддержке Юникода можно на русскоязычном компьютере переключиться на другой язык. При этом все символы отобразятся правильно (если в системе будут установлены нужные шрифты).

8. Морфологический поиск. Это поиск, умеющий искать слова с измененными окончаниями. Например, запрос "компьютер" найдет также "компьютеры", "компьютером", "компьютерами" и т. п. В английском языке это разные формы глаголов (например, go, went, gone). На данный момент морфологические модули созданы для 18 языков.

9. Серверный режим и удаленный доступ. Данная возможность позволяет осуществлять удаленный поиск и удаленный доступ к документам через веб-браузер. Для удаленного поиска нужно будет "поднять" сервер в одноименном меню.

10. Низкая цена. Существует три типа лицензий: "коммерческая" (юридические лица, предприятия и организации) - 990 руб., "персональная" (для некоммерческого использования физическими лицами) - 395 руб. и "студенческая" (для школьников и студентов в учебных целях) - 295 руб.

Незарегистрированная версия может индексировать не больше 10 тысяч файлов. Также она ограничена 100 запусками и/или 30 днями работы после установки. Инсталлятор весит около 6 Мб. Существуют версии для 32- или 64-битной Windows, а также неофициальная portable-версия.

Проверяем "Архивариус 3000" в деле

А теперь давайте посмотрим, как программа работает на конкретных примерах. После установки вам будет предложено произвести индексацию документов. Эта операция нужна для того, чтобы поиск в дальнейшем происходил практически мгновенно. Индексация запустится после того, как вы произведете определенные настройки. Сначала нужно выбрать морфологические модули (по умолчанию стоит русский и английский), выбрать типы документов и расширения файлов, типы кодировок и архивов. В дальнейшем вы сможете изменить эти параметры в настройках программы.

Наконец, нужно выбрать название для индекса и место его хранения. Здесь же можно оценить примерный размер базы. Тестовый раздел, состоящий из 26 тысяч документов и 10 Гб данных, программа оценила в четырехгигабайтный индекс. Авторы заявляют среднюю скорость индексирования 1 Гб/ч. Проверить это предположение не удалось из-за ограничения демонстрационной версии. Тем не менее 10 тысяч файлов проиндексировались за полчаса (индекс получился размером в 400 Мб).

После не забудьте зайти в меню "Индекс > Планировщик" и добавить новое задание. Оптимальный вариант - автоматическая переиндексация с периодом в неделю или месяц. По умолчанию индексироваться будут только новые файлы. Если же в структуре ваших документов произошли серьезные изменения, рекомендуется создать индекс заново.

* * *

После создания индекса всех источников хранения информации поиск по этой базе будет происходить практически мгновенно. В левой колонке будет указан список найденных отрывков ("список выдержек"), в правой - текст документа с найденным отрывком. Найденное слово (словоформа) подсвечивается. Если в поиске несколько слов, подсветка разного цвета. Текстовый файл можно сразу экспортировать в формате TXT. В настройках программы в меню "Выдержки" желательно включить опцию "Показывать путь к файлу" - так вам будет легче ориентироваться в результатах поиска.

"Архивариус 3000" понимает логические операторы в запросах. Если вам это ни о чем не говорит, можно воспользоваться альтернативой - опция "Строитель запроса" ("Введите запрос"). Так, из поиска можно исключить отдельное слово, искать по точной фразе или частям слов.

"Мастер поиска" позволяет сортировать найденные документы по дате изменения, размеру, типу или ключевым словам.

Наконец, вы можете воспользоваться поиском дубликатов документов и поиском литературы.

* * *

Последняя на момент написания статьи версия имела номер 4.59. Обновления выходят почти каждый месяц. Особых изменений нет. Добавляется только поддержка документов. К примеру, SQX1 (.sqx), образов дисков Media Descriptor (.mdx), Ice Book Reader (.ibk), MathCAD (.mcd), VirtualBox (.vdi). Добавлена поддержка файловой системы UDF ISO 13346.

Выводы

В целом "Архивариусу 3000" можно ставить высший балл. Со своими прямыми обязанностями - поиском информации на компьютере - программа справляется на отлично. Поиск с помощью логических операторов упрощает эту задачу, но данная возможность могла бы быть более гибкой. Быстрый поиск (после создания индекса) - еще один несомненный плюс. То же относится и к огромному количеству поддерживаемых форматов.



6313 просмотров

  Ваш комментарий будет первым

Добавить комментарий
  • Пожалуйста оставляйте комментарии только по теме.
Имя:
E-mail
Домашняя страница
Тема:
BBCode:СсылкаEmailЖирный текстКурсивПодчёркнутый текстКавычкиCodeСписокПункт спискаЗакрыть список
Коментарий:



Код:* Code