Дело в том, что похожую выдачу можно получить, имея только базу полных (по md5) дубликатов и базу описаний картинок (под описаниями понимаются alt'ы, прикартиночный текст и прочие подобные части HTML-ок). Действительно, пусть пользователь выбрал картинку. Ищем все ее полные дубликаты (т.е. ищем все картинки с тем же md5), ищем все их описания, выбираем самые частые слова, переводим на другие языки, ищем картинки по этим словам.
С остальным вообще не ищет, ввожу живых и мёртвых писателей, политиков, исторических личностей, различную технику — нету ссылки Similar images под изображениями.
Все равно ничего не понятно. Непонятно, в частности, как к первоначальной картинке http://oborona.clan.su/_nw/0/s24272.jpg привязалось слово "быдло" (на странице http://oborona.clan.su/news/2 этого слова нет, exif у картинки 20-байтный, т.е. пустой, JPEG-комментариев нет). Первых трех дубликатов (которые действительно являются по-другому обрезанными копиями беззубиков) в базе Яндекса просто нет, поэтому сравнить привязку текста не могу.