Операции поиска или нахождения похожих документов резко упрощаются, так как каждому слову и каждому документу сопоставляется относительно короткий вектор из k смыслов (строки и столбцы соответствующих матриц). Однако по причине малой осмысленности «смыслов» или по какой иной [4], но использование LSI в лоб для поиска так и не получило распространения. Хотя во вспомогательных целях (автоматическая фильтрация, классификация, разделение коллекций, предварительное понижение размерности для других моделей) этот метод, по-видимому, находит применение.
Распространённый паттерн: открыть страницу поиска в Google и щёлкать по разным результатам в поисках нужной информации. Можно открыть десятки отдельных вкладок или ходить на каждый сайт по очереди, возвращаясь затем на поисковую выдачу (кнопка Back в браузере). Специалист по поисковой оптимизации Дэн Петрович из австралийской компании Dejan Marketing придумал, как эксплуатировать этот паттерн с выгодой для себя и получить обширную статистику посещений сайтов конкурентов, лишив их трафика.

Поисковыми системами будут индексироваться ваши форумы и блоги, а не только страницы, инфоблоки и разделы инфоблоков. Файл sitemap.xml автоматически генерируется с учетом ваших настроек - заданной схемы. Вы можете гибко настроить в этой схеме - какие именно форумы, блоги и их разделы будут индексироваться поисковыми системами. При этом поддерживаются символьные адреса (URL).
Поисковое продвижение сайтов позволяет привлекать целевых посетителей из результатов выдачи поисковых систем Яндекс, Google за счет достижения топовых позиций в ранжировании по заданным ключевым запросам. Как правило, чем выше позиция сайта в результатах поиска, тем больше заинтересованных посетителей переходит на него с поисковых систем. Работы по продвижению сайта подразумевают приведение сайта в соответствие требованиям поисковых систем с целью увеличения его видимости.
Несмотря на кажущуюся простоту, последние 30 лет прямой поиск интенсивно развивается. Было выдвинуто немалое число идей, сокращающих время поиска в разы. Эти алгоритмы подробно описаны в разнообразной литературе, есть их сводки и сопоставления. Неплохие обзоры прямых методов поиска можно найти в учебниках, например, Седжвика или Кормена. При этом надо учесть, что новые алгоритмы и их улучшенные варианты появляются постоянно.
В рекламе появляются похожие истории — Youtube запустила шестисекундные bumper ads. Похожие форматы можно ждать и от других рекламных систем, а креативные команды научатся их правильно готовить. Сейчас креатив скорее пробует обрезать длинный ролик и пытается сжать его до шести секунд. А это отдельный мир — брифовать надо сразу на такие микроформаты, и для этого надо научиться думать по-другому.
Серая оптимизация отличается от чёрной тем, что она официально не запрещена, но её использование всё равно может быть расценено как неестественное завышение популярности сайта. Некоторые поисковые системы, например, Google, могут временно или постоянно заблокировать такой сайт. То есть, конечное решение о том, являются ли методы продвижения законными или нет, принимает специалист — модератор поисковой системы, а не программа.
Информационный поиск (Information Retrieval, IR) — поиск неструктурированной информации, единицей представления которой является документ произвольных форматов. Предметом поиска выступает информационная потребность пользователя, неформально выраженная в поисковом запросе. И критерий поиска, и его результаты не детерминированы. Этими признаками информационный поиск отличается от «поиска данных», который оперирует набором формально заданных предикатов, имеет дело со структурированной информацией и чей результат всегда детерминирован. Теория информационного поиска изучает все составляющие процесса поиска, а именно предварительную обработку текста (индексирование), обработку и исполнение запроса, ранжирование, пользовательский интерфейс и обратную связь.

Описание ссылки на сайт в выдаче называется сниппетом. Сниппет формируется поисковыми системами. Для формирования сниппета поисковые системы могут брать текст из таких источников как: текст на странице, текст описания сайта в каталоге (Яндекс.Каталог, DMOZ), текст мета-тега Description. При этом каждая поисковая система имеет свои особенности формирования сниппета. В частности Google чаще всего использует текст мета-тега Description. Так произошло и в данном случае — этот текст можно увидеть в коде сайта, на странице он не отображается.


Обсуждая качество продуктового поиска и способы его автоматизированного тестирования, в прошлый раз, пришли к пониманию некоторой непрозрачности проблемы. Огромное количество интернет-магазинов часто ставят покупателей в тупик, не находя требуемого по простейшим запросам, а проблемы как бы и нет. Одним словом, смотрим на реальные проблемы не очень релевантного поиска очень популярного интернет-магазина (который очень хочет быть «маркетплейсом»).
×