Королёв

Королёв — это новый алгоритм поиска Яндекс. Сам Yandex рассказал про новую технологию 22 августа 2017 года в планетарии.
Сегодня Яндекс запустил новый поисковый алгоритм, который умеет искать ответы не только по ключевым словам, но и по смыслу. И научился он этому благодаря вам. — написано на официальном сайте https://yandex.ru/korolev/ и https://yandex.ru/blog/company/korolev.
Информация с официального сайта Яндекс:
Яндекс запустил новую версию поиска. В её основе лежит поисковый алгоритм «Королёв». Алгоритм с помощью нейронной сети сопоставляет смысл запросов и веб-страниц — это позволяет Яндексу точнее отвечать на сложные запросы. Для обучения новой версии поиска используются поисковая статистика и оценки миллионов людей. Таким образом, вклад в развитие поиска вносят не только разработчики, но и все пользователи Яндекса.
Слова и смыслы
Прежде чем рассказывать про настоящее и будущее поиска, вспомним его прошлое. Первые поисковые системы появились в середине 1990-х годов, когда интернет был совсем небольшим — счёт сайтов шёл на тысячи. Чтобы помочь человеку найти нужное, достаточно было составить список веб-страниц, где есть слова из поискового запроса. О сложном ранжировании — то есть упорядочивании страниц по степени соответствия запросу — речь не шла. Считалось, что чем чаще в документе встречаются слова из запроса, тем лучше он подходит.
Интернет быстро рос, и потребовались дополнительные критерии отбора. Поисковики начали учитывать ссылки на документы, научились определять регион, откуда поступил запрос, стали обращать внимание на поведение пользователей.
В какой-то момент факторов ранжирования — признаков, по которым можно определить, насколько хорошо страница отвечает на запрос, — набралось так много, что стало ясно: прописать их все в виде инструкций невозможно. Лучше научить машину самостоятельно принимать решения: какие признаки использовать и как их комбинировать. В Яндексе для этих целей придумали Матрикснет. Это метод машинного обучения, с помощью которого строится наша формула ранжирования.
Поиск, однако, по-прежнему опирается на слова. Перед тем как пустить в ход сложную формулу ранжирования, поисковые машины составляют список «предварительно подходящих» веб-страниц — таких, в которых есть слова из запроса. Нам, людям, понятно, что один и тот же смысл можно выразить разными словами. Веб-страница может не содержать всех слов из запроса, но тем не менее очень хорошо на него отвечать. Однако объяснить это машине довольно сложно.
Первый шаг к поиску по смыслу Яндекс сделал в прошлом году, когда мы представили поисковый алгоритм «Палех». В его основе лежит нейронная сеть. Нейросети показывают отличные результаты в задачах, с которыми люди традиционно справлялись лучше машин: скажем, распознавание речи или объектов на изображениях.
Запуская «Палех», мы научили нейронную сеть преобразовывать поисковые запросы и заголовки веб-страниц в группы чисел — семантические векторы. Важное свойство таких векторов состоит в том, что их можно сравнивать друг с другом: чем сильнее будет сходство, тем ближе друг к другу по смыслу запрос и заголовок.
Как работает алгоритм «Королёв»
Поисковый алгоритм «Королёв» сравнивает семантические векторы поисковых запросов и веб-страниц целиком — а не только их заголовков. Это позволяет выйти на новый уровень понимания смысла. Представьте, что вы впервые услышали о романе Льва Толстого «Война и мир». Безусловно, вы сможете извлечь смысл из названия — например предположить, что в книге много батальных сцен. Но чтобы узнать все хитросплетения сюжета и давать исчерпывающие ответы на вопросы о романе, вам потребуется прочитать его полностью.

Минимальная длина комментария - 50 знаков. комментарии модерируются
Смотрите также:

Смерть одного человека трагедия, смерть миллионов статистика
"Смерть одного человека трагедия, смерть миллионов статистика" — это фраза, подчеркивающая, как массовые трагедии могут становиться безликими цифрами, в отличие от индивидуальных потерь,

Поисковый паук
Поисковый паук — это цифровой лазутчик, который шарит по сайтам в поисках инфы, собирая и анализируя данные для поисковых систем.

Поисковая оптимизация
Поисковая оптимизация — это магия, которую творят сеошники, чтобы сайты взлетали в топы поисковиков. В мире интернета это как заклинание для веб-сайтов.

ПС
ПС — это сокращённо от «поисковые системы», такие как Google или Яндекс. Это основа для всех, кто шарит в SEO.

Misery Loves Company
Misery Loves Company — фраза, означающая, что люди, испытывающие трудности или несчастье, склонны искать общение с такими же, кто тоже переживает плохие времена.

Веб 1.0
Веб 1.0 — это олдскульный интернет времён 90-х и начала 2000-х, где сайты были похожи на электронные визитки, и контентом их заполняли только админы, без участия пользователей.

На заборе тоже написано
На заборе тоже написано — это фразочка, чтобы показать, что не стоит всему доверять, что написано или видно. Иногда под сомнением даже самые убедительные вещи.

Тяжело первые десять лет, потом привыкаешь
Тяжело первые десять лет, потом привыкаешь — прикольное выражение, чтобы подбодрить, когда всё идёт не по плану. Говорит о том, что нужно время и терпение, чтобы привыкнуть к новым трудностям.

Dogfooding
Dogfooding — это когда компания сама тестирует свой продукт, чтобы понять его плюсы и минусы до официального релиза. Это про то, как стать своим же клиентом и увидеть продукт изнутри.

Морда
Морда — это главная страница сайта, которая имеет более высокий авторитет в глазах поисковых систем, чем остальные страницы.

Дивный дизайн
Дивный дизайн — это современный способ оформления сайтов с помощью CSS, где страницы формируются из гибких блоков, а не таблиц.

Искать пятый угол
Искать пятый угол — это выражение, означающее, что кто-то находится в безвыходной ситуации или пытается найти выход там, где его попросту нет.