Заказ расчета стоимости продвижения онлайн »
СТАТЬЯ

25 декабря 2014

Яндекс и новый подход к группированию изображений

С помощью картинок сегодня можно не только заинтересовывать пользователей, но и продвигать сайты. Теперь в ответ на поисковой запрос выдается не просто набор картинок, а обедненные по какому-либо признаку группы изображений называемые «сериями».

Под сериями подразумевают схожие изображения, размещенные на веб-сайтах. За группировку картинок отвечает непосредственно сам алгоритм, который выделяет картинки на сайтах и объединяет их в группы по:

- цвету;

- форме;

- отдельным элементам.

Для образования полноценной серии будет достаточно четырех картинок, объединенных по каким-то признакам.

Пользователи привыкли видеть в поисковой выдаче картинки в виде страницы с многочисленной сеткой тумбнейлов. Чтобы увидеть все изображения, выдаваемые поисковиком, нужно прокручивать их прервью до конца списка.

Однако следует понимать, что для ответа на запрос бывает достаточно одной или двух картинок и связь их между собой для пользователя будет более удобной. Для чего нужна эта связь? Возьмем за пример инструкции по сбору оригами. Чтобы понять суть процесса, важно будет увидеть действия в пошаговом порядке на картинках. Также несколько картинок просто необходимы будут для того чтобы рассмотреть со всех сторон авто для покупки или какую- либо другую вещь.

Для того чтобы четко представлять себе какие еще могут быть назначения у серий, можно проанализировать ответы и реакцию пользователей на новую функцию поисковой машины. Так, например, один из пользователей отметил, что группировка картинок по сериям позволила ему найти три лучших варианта изображений для оформления кухонной фоторамки. Для него было принципиально важно, чтобы все рамки были из одной серии с изображениями специй, так как необходимо было оформить специальную рамку для трех картинок.

Еще один пример – изучение какого-либо приложения по инструкции в картинках. Неопытному пользователю гораздо проще разобраться с видеоинструкцией или пошаговыми картинками, чем добраться до сути просто по текстовому руководству или отдельным изображениям, не объединенным в серии. С помощью картинок, сгруппированных в серии, можно отремонтировать кран, уложить паркетную доску или утеплить фасад. Согласно статистическим данным более 13 процентов пользователей ищут нужную информацию через картинки.

Анализ количественных запросов показал, что 70 процентов пользователей ищут какие-либо инструкции с картинками, причем у 20 процентов потребность воспользоваться иллюстрированным интернет руководством возникает каждую неделю. Эти же данные подтверждает и статистика запросов - 9 процентов из них так или иначе связаны с инструкциями на самые разные тематики.

По результатам таких данных у Яндекса и родилось решение создавать серии картинок с отбором изображений для получения релевантного запросу ответа, дополняющего собой выдачу изображений.

Серии формируются согласно определенным требованиям - так чтобы пользователи могли перейти на выдаваемую картинку и получить больше информации с дополнительными описаниями по разным разделам сайта. Таким образом можно добиться улучшения сценария, в котором пользователь получает информацию по картинке.

Особенно важна серия, когда речь идет о конкретном объекте с пошаговой инструкцией, например, мастер-классе или фотосессии.

Оптимизаторам важно понимать, что подобное группирование возможным будет только на сайтах без активной рекламы и вредоносных программ. Все дело в том, что пользователи крайне негативно реагируют на любые всплывающие рекламные окна, поэтому группирование изображений на таких сайтах не представляется возможным.

Классификация картинок осуществляется по визуальной схожести в первую очередь. Отвечает за группировку иерархический алгоритм complete linkage clustering using nn-chain algorithm. Для группирования была разработана метрика схожих признаков изображений с помощью которых появилась возможность создать кластера-группы с определенными свойствами.

О каких свойствах идет речь? Можно составить целый перечень:

- один предмет или сцена, отснятые в различных ракурсах, должны находиться в едином кластере;

- одни и те же предметы в разных тонах должны быть помещены в один кластер;

- изображения из одной сессии с общими деталями и цветами должны быть в одном кластере;

- изображения одного размера также должны быть в одном кластере.

Дизайн картинок

Важно чтобы картинки, объединенные в серию, выдавались в едином блоке, поэтому дизайн должен быть проработан таким образом, чтобы серии между собой отличались и между тем выделялись.

Команда Яндекса поработала над десятками вариантов дизайнов, часть из них тестировались на пользователях и членах команды.

В результате удалось определить, что визуально пользователям нравится один дизайн, понятнее же совсем другой, облегчающий взаимодействие с сайтами. Идеальным решением стало объединение лучших качеств обоих вариантов дизайнов.

Еще один важный момент – пользователи должны понимать, когда серия начинается и когда заканчивается. В результате был разработан окончательный вариант с блоком шаринга и информацией.

Когда и кому будут нужны серии?

Особенно важно получать доступ к сериям людям, котором важно найти пошаговые иллюстрированные инструкции, с помощью которых можно решить задачи по покупке чего-либо, изготовлению, ремонту и прочие.

Новый алгоритм позволяет на порядок облегчить поиск по стилю картинок, например, найти картины одного художника, работы одного фотографа или продукцию из одной коллекции или одного бренда.