Другие языки программирования и технологии
Алгоритм поисковой системы, на подтверждения фактов
Этот вопрос скорее SEO-шникам, я читаю различные статьи и книги про поисковые системы. Все они описывают в основном ранжирование и релевантность поиска, но меня интересует алгоритм подтверждения запроса, это в основном вопросы от пользователей. Например запрос "Круг круглый?" и пусть поисковая система мне даст ответ "ДА" ну или "нет", естественно это надо подтвердить. Встречал кто нить такие статьи или книги? или тема "интеллектуальный поиск" слабо развита?
Мне кажется, что это очень сложная задача. По сути нужно понять смысл предложения. В общем виде едва ли кто-то такую задачу решил. В ограниченном варианте - понадобится поставить ограничения на структуру вопроса и предметную область, реализовать синтаксический разбор предложений (это отдельная сложная задача), чтобы определить где какие части предложения, в каком они взаимодействии - этим люди занимались и, скорее всего, для каких-то вариантов можно поискать готовые решения (скорее, в виде теории, а не в виде готовых алгоритмов). Потом перевести текст на какой-то логический язык, например язык предикатов (тоже не очевидная задача), после чего делать логический вывод (еще хуже). Ну и для такого вывода у вас должна быть готовая база фактов - тоже не понятно, откуда она возьмется. Ну и всякие проблемы с некорректно поставленными вопросами и вопросами, не переводимыми на выбранную логику.
Я не очень представляю как сейчас с этим дела обстоят, но даже лет 20 назад такое направление развивалось в локальных областях. Называется "экспертные системы". В общем случае точно не решено, иначе у нас уже бы был искусственный интеллект :-)
Альтернативный путь, наверное, возможен с использованием нейросети, которую нужно обучить (или пусть самообучается) на таких вопросах. Правда, если вопросы произвольные - не уверен, что получится создать сеть хоть для сколько-то широкого набора.
Я не очень представляю как сейчас с этим дела обстоят, но даже лет 20 назад такое направление развивалось в локальных областях. Называется "экспертные системы". В общем случае точно не решено, иначе у нас уже бы был искусственный интеллект :-)
Альтернативный путь, наверное, возможен с использованием нейросети, которую нужно обучить (или пусть самообучается) на таких вопросах. Правда, если вопросы произвольные - не уверен, что получится создать сеть хоть для сколько-то широкого набора.
Александр Зенков
вывод в том, что нужно иметь кучу данных, а если запросы какие то не известны или не понятны поиску, то он выдаст ответ в виде вероятностей, и чтоб это исправлять, то без вмешательства человека, это невозможно. Примерно так?)
Этим умела заниматься поисковая система Nigma, к сожалению разработчик переехал во Вьетнам
Александр Мезенцев
Я ей тоже пользовался. Нормальная была жалко что так....
Может быть эта тема коммерческая тайна? И конкретный алгоритм (актуальный) просто так в интернете не найти?
Александр Зенков
Алгоритм работает не первый год, и его за все время улучшают в разы, а старые алгоритмы обычно публикуют, т. к. они больше не актуальны. я надеюсь найти такие материалы
На самом деле секрет прост - опыт результатов поисковой системы. Просто подумай, что в день в Яндекс и Гугл отвечает на трилиарды запросов. Все разные.
Есть алгоритмы, которые подбирают ответ: зависит от множества факторов.
*Если брать во внимание твой случай, то здесь во-первых куки файлы: твоя история запросов. Если сначала ты вводил "онлайн казино", то при следующем запросе "рулетка" тебе покажет рулетку в казино, а не строительную. (ну по крайней мере в первых запросах точно).
Второй момент: поведенческие. Запросы и темы довольно часто сходятся. И такой же запрос как у тебя 100 раз уже задавали. Тот сайт или "ответ" после которого люди перестали задавать такие запросы считается правильным. Это и будет выходить в большинстве случаев.
Есть алгоритмы, которые подбирают ответ: зависит от множества факторов.
*Если брать во внимание твой случай, то здесь во-первых куки файлы: твоя история запросов. Если сначала ты вводил "онлайн казино", то при следующем запросе "рулетка" тебе покажет рулетку в казино, а не строительную. (ну по крайней мере в первых запросах точно).
Второй момент: поведенческие. Запросы и темы довольно часто сходятся. И такой же запрос как у тебя 100 раз уже задавали. Тот сайт или "ответ" после которого люди перестали задавать такие запросы считается правильным. Это и будет выходить в большинстве случаев.
Похожие вопросы
- Такой редирект грозит баном в поисковых системах? Если грозит, то какие есть варианты другие редиректа для браузера IE6?
- Здравствуйте. Подскажите, каким образом создается поисковая система?
- как выложить сайт в поисковые системы?
- Почему программирование на первый взгляд такое сложное? Потому что многие не умеют составлять алгоритмы?
- Как в с++ сложить два числа в двоичной системе? Алгоритм сложения двух чисел в двоичной системе! в с++!!
- Алгоритмы перевода чисел из одной системы счисления в другую, арифметика в различных системах счисления
- Нужно ли быть очень сильным математиком и хорошо уметь конструировать алгоритмы на позиции Software Engineer?
- алгоритм... по нахождению общих элементов двух массивов
- Вопрос про алгоритмы
- Подскажите мне пожалуиста что такое алгоритм и зачем компьютеру. нужен алгоритм.И что такое прога Паскаль и зачем она