Soft

03.05.2011 Автор: Александр Евдокимов Версия для печати

Детекторы сходных изображений

Вообще-то, в наличии резервных копий каких-либо данных, в том числе графических изображений, нет ничего плохого. Лучше иметь лишний дубликат на всякий пожарный, чем при сбое разом потерять все. Но когда работа по коррекции фотографий закончена, когда все необходимое скопировано на съемные носители — оставлять лишние фотоклоны просто незачем. Тем более что найти копии изображений очень легко — благодаря детекторам графических дубликатов.


 Конечно, можно обойтись и без них, если файлов на диске хранится немного. Но у заядлых фотолюбителей коллекции могут содержать сотни, а то и тысячи различных фотографий, причем в разных директориях. Понять, какие из них двойные или даже тройные, а какие одиночные, простым перебором всех данных — задача, прямо скажем, нетривиальная, а в некоторых случаях и просто не решаемая человеческим разумом и памятью. А вот для специальных программных средств — «антиклонов», о которых пойдет речь в данном материале, это не составит никакого труда.

 Рассматривая поисковики графических дубликатов, мы сравним и оценим используемые ими методы определения двойников. Сопоставим и удобство использования, насколько каждый из них легко настроить, как они демонстрируют найденные одинаковые и сходные фотографии. Преимуществом, безусловно, будут обладать детекторы графических дубликатов, способные найти не только совпадающие полностью изображения, но и те, что имеют некоторые отличия. Дело в том, что в процессе обработки фотографии и рисунки могут видоизменяться — в таких случаях крайне желательно удалить неудачные варианты, которые когда-то были сохранены. Но для начала нужно просто обнаружить такие файлы среди залежей иллюстраций.

 

AntiDupl.NET 1.7.1.319

Разработчик: Игорь Ермолаев

Веб-сайт: antidupl.narod.ru

Размер дистрибутива: 1 Мбайт

Условия распространения: Freeware

 Поможет нам в этом, в частности, программа AntiDupl.NET. В тестовой директории емкостью 77,9 Мбайт, состоящей из 54 файлов различных графических форматов, она нашла при стандартных установках 26 пар клонов. Причем не все из них можно назвать прямыми дубликатами. В число похожих она справедливо отнесла также черно-белые и цветные версии одной и той же фотографии, а также слегка отличающиеся друг от друга рисунки (на одном из них изображение было искажено).

 По умолчанию программа относит к числу клонов все изображения, которые различаются не более чем на 5%. На странице «Поиск» в настройках («Поиск/Опции») вы вправе увеличить или, наоборот, уменьшить это значение, обратившись к параметру «Пороговая разность». Понятно, при нуле в этой графе программа продемонстрирует вам лишь абсолютных близнецов среди рисунков и фотографий.

 По умолчанию не задействована опция проверки изображений, перевернутых на 90 или 180 градусов. Если вы знаете, что в вашей коллекции могут быть такие иллюстрации, — отметьте щелчком мыши пункт «Искать повернутые и зеркальные дубликаты».

 Если сочтете необходимым ограничить спектр сканируемых графических форматов — снимите на закладке «Поиск» галочки у тех расширений, файлы с которыми проверять не нужно. Изначально же активизированы будут все пять знакомых утилите разновидностей цифровой графики: BMP, JPEG, TIFF, PNG и GIF. Учтите, что по умолчанию AntiDupl.NET изучать системные данные и директории не будет, зато в других местах на винчестере или съемном носителе исследует и содержимое подразделов.

 Где именно искать, вы должны указать в диалоговом окне, открывающемся щелчком по кнопке «Пути». Там вам нужно будет либо заменить уже выбранную папку другой («Изменить»), либо присоединить к ней еще директории («Добавить каталог») или даже отдельные фото и рисунки («Добавить файлы»). Последняя опция может пригодиться, если вы решите выявить в своей коллекции изображения, напоминающие заданный образец.

 Выявленные клоны AntiDupl.NET представит в виде списка, разделенного попарно. Изображения вы увидите уменьшенными, хотя при желании любое из них можно открыть полностью в программе, используемой в вашей системе для просмотра графики.

 С двойными и сходными рисунками и фотографиями эта программа позволяет поступить по-разному — вы можете, нажимая на соответствующие кнопки, удалить только первую иллюстрацию из двух, или только вторую, или сразу обе, а можете заменить первой вторую или, напротив, второй первую. По умолчанию стираемые изображения данная утилита поместит в системную «Корзину».

 

Image Comparer 3.7 Build 710

Разработчик: Bolide Software

Веб-сайт: www.bolidesoft.com

Размер дистрибутива: 3,39 Мбайт

Условия распространения: Trial (350 руб.)

 А вот пробная версия утилиты Image Comparer, к сожалению, не удаляет ничего из найденного. Для того чтобы активизировать в ее меню «Действия» операцию по стиранию или переносу отмеченных изображений, необходимо будет приобрести полнофункциональный вариант данной программы.

 В демонстрационном же релизе можно лишь искать и просматривать двойные и сходные фотографии и рисунки в галереях, которые создаются из графических файлов в той или иной папке на диске. Подготовить такие коллекции вы можете сами, нажав соответствующую кнопку в окне утилиты, но проще воспользоваться специальным «Мастером сравнения».

 На первом его шаге пользователю предложат выбрать: сопоставлять изображения внутри одной группы изображений или двух разных. Далее необходимо будет прописать путь к директории или двум директориям с иллюстрациями.

 На третьем этапе мастер спросит вас, следует искать только точные копии или похожие изображения тоже. Учтите, что по умолчанию в Image Comparer задан до- статочно низкий уровень соответствия (85%), что в нашем случае привело к появлению в списке результатов довольно отдаленных друг от друга иллюстраций. Так что перед созданием коллекции и проведением процедуры сопоставления рисунков и снимков «порог похожести» желательно повысить в параметрах («Инструменты/Настройки/Сравнение») с помощью отвечающего за данный показатель ползункового регулятора. Кстати, при использовании «Мастера сравнения» таковой будет равен 95%. При этом уровне соответствия утилита Image Comparer смогла распознать в тестовой директории 35 абсолютно одинаковых и очень похожих, на ее взгляд, изображений.

 Эта программа поддерживает намного больше графических форматов, чем AntiDupl.NET. Помимо файлов с расширениями, знакомыми вышеупомянутой утилите, она сравнивает друг с другом также TGA, PSD, PCX, WMF, DCX, EPS-иллюстрации и мн. др. При желании вы можете исключить любые из них из числа сопоставляемых на странице

 

«Форматы файлов» в «Настройках».

ImageDupeless English Version 1.6.3

Разработчик: Олег Тарлапан

Веб-сайт: www.imagedupeless.com

Размер дистрибутива: 2,9 Мбайт

Условия распространения: Shareware (295 руб.)

 Другая коммерческая утилита ImageDupeless поддерживает не так много графических форматов, как Image Comparer, но больше, чем некоммерческая AntiDupl.NET В число сопоставляемых графических данных эта утилита, в отличие от двух рассмотренных выше, включает также значки с расширениями ICO.

 Как и AntiDupl.NET, ImageDupless отправляет в «Корзину» ненужные копии — те из них, что вы выделите вручную, щелчком мыши, или при содействии самой программы. В последнем случае необходимо будет воспользоваться командой контекстного меню «Автоматически отметить» и задать критерии, по которым изображения можно счесть лишними. Далее останется только удалить обозначенные галочками дубликаты фотографий и рисунков, нажав соответствующую кнопку на главной панели утилиты.   

 Стерты клоны будут не только на диске, но и в галерее. Последнюю, как и в Image Comparer, вам нужно создать в самом начале работы с утилитой ImageDupeless. Провести эту и все последующие операции можно собственноручно или при содействии встроенного мастера «Помощник». Он пройдет вместе с вами все этапы избавления от дубликатов, включая поиск с заданным порогом соответствия (по умолчанию 11%). Затем пользователь как раз должен будет решить, задействовать или нет упомянутый инструмент автоматического выделения двойников или сделать это потом самому. На следующем шаге «Помощник» откроет окно, в котором можно просмотреть одинаковые изображения и при желании перезаписать их. Можно и просто переместить сходный файл в директорию двойника, задав то или иное название.

 Учтите, что в пробной версии при подведении курсора мыши к миниатюрам с дубликатами одной фотографии или рисунка будет появляться надпись Evaluation version. Есть в ней и другие ограничения, в частности по количеству изображений (не более 8 тыс. шт.).

 Изучив тестовую директорию при стандартных установках, Image Dupeless выявила 32 подобные друг другу цифровые иллюстрации. В отличие от программы AntiDupl.NET, эта утилита объединяет дубликаты в группы. В нашем случае таковых оказалось 11.

 При необходимости в любой момент можно будет обновить созданную галерею. Такая процедура предусмотрена в Image-Dupeless. Сможете вы в ней и сравнить две коллекции цифровых фотографий и рисунков, прописав путь ко второй в окне, открываемом щелчком по кнопке «Сравнить новые изображения с галереей». Правда, в пробной версии утилиты эта функция также заблокирована.

 

Similar Picture Find Freeware Version 1.2

Разработчик: UNGSoft Developers Group

Веб-сайт: www.ungsoft.com

Размер дистрибутива: 1,74 Мбайт

Условия распространения: Freeware

 Во «фриварной» же утилите Similar Picture Find этой, да и любыми другими функциями можете пользоваться без ограничений. В данной программе задавайте столько папок с иллюстрациями для выявления в них клонов, сколько требуется. Такую базу графических каталогов, объединяющих файлы с десятью различными расширениями, в том числе BMP, JPG, PNG, GIF и TIF, здесь называют репозиторием. Его разрешается сохранить в формате SPF и загружать по мере необходимости. Если в дальнейшем понадобится добавить в эту базу еще какую-то директорию, примените вышеупомянутую команду и пропишите путь в стандартном диалоговом окне.

 Можно в Similar Picture Find Freeware Version сопоставить с представленными в репозитории изображениями и отдельный графический файл. В этом случае обратитесь к параметру Search Similar в меню Action. Если же выявить двойников необходимо внутри созданной базы каталогов, тогда кликните мышью по пункту Test Repository For Similar.

 В папке, которую мы использовали для испытания детекторов клонов разной степени близости, при стандартном варианте настроек (File / Program Settings) утилита Similar Picture Find выявила 20 двойников, точнее сказать, 10 их пар. По умолчанию в качестве порогового значения, при котором рисунки и фотографии она будет считать похожими, выбрана отметка в 4%. При желании вы можете изменить этот параметр в строке Threshold value (percents) в ту или другую сторону. Чем меньше это число, тем ближе изображения должны быть друг к другу, и наоборот. Так что при значении, равном 10%, количество найденных программой пар сходных изображений увеличилось до 14, а при 2% уменьшилось до восьми.

 В окне Similar Picture Find вы можете сделать доступными для просмотра все изображения из репозитария (Show All) либо только сходные друг с другом (Show with similar found only),

 Удалить обнаруженные дубликаты эта программа способна одним кликом (Delete All Similar). Если столь радикальный шаг не входит в ваши планы, стирайте лишние клоны по одному, просматривая их и нажимая там, где требуется, кнопку Delete File.

 

Visual Similarity Duplicate Image Finder Demo 4.0.0.1

Разработчик: MindGems Inc.

Веб-сайт: www.mindgems.com

Размер дистрибутива: 2,04 Мбайт

Условия распространения: Trial (от 24,95 до 499 долл. в зависимости от версии)

 К сожалению, в триал-версии программы Visual Similarity Duplicate Image Finder нельзя удалить лишние копии. Не разрешено в ней и перемещать их в какую-либо папку, заданную в разделе After Scan Actions. Есть также ограничение по количеству групп клонов — в демке их продемонстрируют не более 10. В нашем случае таковых Visual Similarity Duplicate Image Finder удалось выявить только семь, содержащих 23 сходных файла. При этом по умолчанию был выставлен довольно высокий уровень соответствия — 95%. При его снижении в списке Similarity количество неидентичных, но близких друг другу клонов, разумеется, увеличивалось.

 При этом сам метод определения двойников — визуальный (Visual Compare) — мы не меняли, хотя в разделе Scan/Method можно было задавать и другие способы: с помощью хеш-суммы, размера файлов и EXIF-информации о дате создания изображения. Варианта, использующего сразу несколько методов сравнения, к сожалению, в списке нет.

 Зато в настройках можно активизировать опцию учета поворота и разворота снимков и рисунков. Разрешается также задать уровень тщательности поиска — в диапазоне от Low до Ultra. При тестировании было выставлено заданное по умолчанию значение Normal.

 Для того чтобы при содействии Visual Similarity Duplicate Image Finder выявить похожие и вообще одинаковые иллюстрации, создавать галереи, как в случае с Image Comparer и ImageDupless, не нужно. Достаточно прописать путь к содержащим их одной или нескольким директориям (Add Folder). После чего останется лишь нажать кнопку Start Scan.

 Двойников данная утилита выявляет среди файлов весьма внушительного числа графических форматов. Среди известных ей расширений не только JPEG, BMP, TIFF, PNG и GIF, но и значки ICO и курсоры CUR. Особо стоит отметить поддержку формата RAW.

 

Итоги поисков

 С функциональной точки, да и по результатам пробных поисков рисунков-двойников предпочтительнее других выглядела утилита Image Comparer. Ее бы мы и посоветовали вам использовать, не пожалев 350 руб. на приобретение. Если же вы не готовы выложить эту скромную сумму, тогда воспользуйтесь бесплатной программой-анти-дубликатором AntiDupl.NET. Она уступает по количеству поддерживаемых форматов иллюстраций, но среди тех, что ей известны, найдет и полных «близнецов», и модифицированные, но близкие друг к другу изображения. Так что от лишних графических файлов вы вполне можете избавиться усилиями этой Freeware-программы.

 

 

Критерий соответствия

 В принципе, искать двойников среди снимков и иных графических работ можно и при содействии утилиты-антидубликатора более широкого профиля, способной искать клоны не только среди иллюстраций. При одном, правда, условии: если такая программа умеет сопоставлять данные по их содержанию. Этой функцией обладает, в частности, некоммерческая Free Edition-версия программы NoClone 2010 (noclone.net) компании Reasonable Software.

 Для того чтобы она могла максимально эффективно сравнивать графические данные друг с другом, вам необходимо перед началом поиска клонов зайти в настройки, кликнув по ссылке Redefine в разделе Search Criteria. В появившемся диалоговом окне выберите в строке Search вариант Duplicate files, то есть «Дублирующиеся». Далее отметьте параметр File Content, а в нем пункт Similar content. После чего останется только подобрать подходящий уровень соответствия в поле Similarity в процентах.

 Разумеется, нужно будет еще в главном окне прописать путь к папке с изображениями-двойниками, щелкнув мышью по кнопке Add. Можно также изъять из числа исследуемых какие-либо директории и виды данных по их расширениям. Все это задается в окне, появляющемся при клике по ссылке Exclude Path.

 Для запуска процесса поиска клонов нажмите кнопку Search. Результаты сопоставления NoClone представит в виде списка на закладке Search Result, причем группы будут обозначены чередующимися белой и синей плашками. К сожалению, функция автоматического выделения тех или иных вариантов в бесплатной версии детектора дубликатов заблокирована. Так что ставить галочки к тем из них, что более не требуются, вам придется самостоятельно. Изображение групп сходных снимков или рисунков вы увидите в нижней части окна, на панели предварительного просмотра. Выбранные файлы можно удалить (Actions/SaveSpace) в «Корзину» или вообще с диска.


Назад в раздел

Текст сообщения*
Защита от автоматических сообщений

Читайте также