Почему Яндекс ищет именно так, как ищет?

Рубрика: Поисковые системы Тэги: , , , оставил alarm в 23:27
30 Январь 2010

Тут развелся ажиотаж вокруг выдачи Яндекса при запросах, содержащих фразу “в России”. Так, по запросу “количество дебилов в России” на первом месте контакт, да и по другим искусственно составленным запросам, содержащим этот термин, вконтакт вылезет достаточно высоко. Это, пожалуй достаточно яркий пример тех косяков в выдаче, которые особенно остро вылезли после введения Снежинска.

Я заметил, что по ряду многословных запросов, содержащих термины, принимающие различное смысловое значение в зависимости от контекста, в выдаче находятся документы, явно не соответствующие запросу (как в вышеприведенном примере с контактом). Однако наблюдалась и явная система в появлении этих документов – они все были релевантны для наиболее весомого термина, содержащегося в запросе, но в документе этот термин нес в себе совершенно другую смысловую нагрузку, нежели в запросе.

В принципе, насколько я себе предствляю систему функционирования поиска, это врожденная болезнь любого поиска, использующего матричную модель представления баз данных (а я считаю, что Яндекс как раз таковую и использует). И обострилась эта болезнь как раз после введения новой версии алгоритмов – MatrixNet. Я уверен, что возврат к уровню релевантности до Снежинска – лишь вопрос времени, времени на корректировку новых алгоритмов. Но если мыслить глобально, мне кажется все же будущее поисковых машин за пространственно-векторной системой представления данных. Или даже за пространственно-векторной, в которой само пространство сформировано из пересекающихся многомерных матриц. К счастью, я слишком невежественен, чтобы хоть примерно представить, как это может быть реализовано.

Хотелось бы подискутировать.