Одним из самых первых методов организации широкого доступа к ресурсам информации стало создание каталогов сайтов, причем ссылки на них начали группировать по тематике. Таким первым проектом стал ресурс Yahoo.com, который открылся весной 1994-ого года. Впоследствии когда количество сайтов в Yahoo-каталоге существенно увеличилось, была добавлена опция поиска необходимых сведений по каталогу. Это еще не было в полной мере поисковой системой, так как область такого поиска была ограничена только сайтами, входящими в данный каталог, а не абсолютно всеми ресурсами в интернете. Каталоги ссылок весьма широко использовались раньше, однако в настоящее время, практически в полной мере утратили свою популярность.

Описание ссылки на сайт в выдаче называется сниппетом. Сниппет формируется поисковыми системами. Для формирования сниппета поисковые системы могут брать текст из таких источников как: текст на странице, текст описания сайта в каталоге (Яндекс.Каталог, DMOZ), текст мета-тега Description. При этом каждая поисковая система имеет свои особенности формирования сниппета. В частности Google чаще всего использует текст мета-тега Description. Так произошло и в данном случае — этот текст можно увидеть в коде сайта, на странице он не отображается.


Пишется с помощью оператора OR. Обратите внимание, что оператор OR должен быть написан заглавными буквами. Относительно недавно появилась возможность написания логического «ИЛИ» в виде вертикальной черты ( | ), подобно тому, как это делается в Яндексе. Оператор OR (ИЛИ) полезен в первую очередь для тех случаев, когда у нужного термина есть синонимы или если его правильное написание еще не устоялось.


Для примера опишу лишь одну, пожалуй, самую популярную модель, работающую по смыслу. В теории информационного поиска данную модель принято называть латентно-семантическим индексированием (иными словами, выявлением скрытых смыслов). Эта алгебраическая модель основана на сингулярном разложении прямоугольной матрицы, ассоциирующей слова с документами. Элементом матрицы является частотная характеристика, отражающая степень связи слова и документа, например, TF*IDF. Вместо исходной миллионноразмерной матрицы авторы метода  Фурнас и Дирвестер предложили использовать 50—150 «скрытых смыслов» [3], соответствующих первым главным компонентам ее сингулярного разложения.
Прежде всего, стало очевидно, что поиск в вебе не может быть сколько-нибудь корректно выполнен, будучи основан на анализе (пусть даже сколь угодно глубоком, семантическом и т.п.) одного лишь текста документа. Ведь внетекстовые (off-page) факторы играют не меньшую, а порой и бо́льшую роль, чем текст самой страницы. Положение на сайте, посещаемость, авторитетность источника, частота обновления, цитируемость страницы и ее авторов — все эти факторы невозможно сбрасывать со счета.
Для некоторых результатов поиска Google предоставляет повторное поле для поиска, которое позволяет пользователю найти то, что он ищет внутри конкретного веб-сайта. Эта идея возникла из того, как пользователи использовали поиск. По словам инженера-программиста Бена Ли (Ben Lee) и менеджера продукта Джека Менцеля (Jack Menzel), «телепортирование» в сети — это как раз то, что помогает пользователям Google завершить свой поиск. Google развил эту концепцию на шаг вперед, и вместо просто «телепортирования», что значит для поиска нужного сайта пользователю достаточно ввести часть имени веб-сайта в Google (необязательно помнить весь адрес), пользователи могут вводить ключевые слова для поиска внутри выбранного сайта. Оказалось, что пользователям часто нелегко найти то, что они ищут внутри корпоративного сайта.
Значительную часть запросов составляет поиск товаров и услуг. Среди множества сайтов с товарами и услугами поисковой системе нужно найти и предложить пользователям наиболее качественные — удобные, информативные и авторитетные. Понятно, что все эти характеристики субъективны, а поисковый алгоритм может использовать только измеримые параметры. Анализируя сотни таких параметров, поисковая система вычисляет значение релевантности страницы — то есть определяет, насколько качественно страница отвечает на запрос.
Естественным развитием этой идеи можно считать предложенный Брином и Пейджем в 1998 году алгоритм PageRank — итеративный алгоритм, подобный тому, что используется в задаче определения победителя в шахматном турнире по швейцарской системе. В сочетании с поиском по лексике ссылок, указывающих на страницу (старая, весьма продуктивная идея, которая использовалась в гипертекстовых поисковых системах еще в 80-е годы), эта мера позволила резко повысить качество поиска.

Контент воровать нельзя. Google это палит, ведь он уже проиндексировал тот сайт, где вы украли текст. Происходит пессимизация – поисковик опускает вас в выдаче, потому что вы крадете чужой контент. Вы не полезны и не помогаете удовлетворять потребности пользователей. Но все же не стоит забывать и про поведенческие факторы. Видео, инфографика, все эти интерактивные вещи увеличивают время, которое пользователь проводит у вас на сайте, и заодно помогают улучшить конверсию. Но хорошо подумайте, что для вас сейчас рентабельней — снять видео за $1000 или налить контекстную рекламу на сайт и быстро получить заявки/заказы.
Бренд состоит из множества маленьких деталей, которые работают слажено, чтобы стать единым целым. Собирая эту машину, если вы забыли часть или ввернули винт неправильно, вы рискуете получить не работающую машину, или еще хуже – ту, которая разобьется вместе с вами. Один из способов избежать поломок вашей бренд-машины – с самого начала создать руководство по применению (handbook).
Пространство окружающего Мира наполнено отдельными событиями и их цепочками — эти события находят отражение в СМИ, в аккаунтах блогеров и обывателей в соцсетях. Получить картину окружающей действительности, претендующую на некую долю объективности можно, только если собрать различные точки зрения на одну и ту же проблему. Категоризатор событий — тот инструмент, который раскладывает “по полочкам” собранную информацию: версии описания событий. Далее предоставить доступ к информации о событиях пользователям через инструменты поиска, рекомендации и визуального представления временных последовательностей событий.
×