АЮ
Александр Юрдин

как написать интернет спайдер

Здравствуйте! Меня интересует, как написать спайдер. Например, чтобы искал все ссылки на сайте. Важен именно принцип. Дайте, пожалуйста, ссылки на статьи с описанием.

АТ
Алексей Трефильев

На том-же php можно сделать следующим образом:
Через file_get_contents() запрашиваешь главную страничку сайта. Грузишь ее в string-переменную, регулярным выражением выбираешь из нее все ссылки и заносишь в базу данных. Дальше переходишь по первой ссылке в базе данных, опять через file_get_contents() грузишь страничку в переменную, находишь регулярным выражением ссылки, сверяешь их уникальность с ссылками в базе данных, уникальные дописываешь в ту-же табличку.. . но ничего не выйдет из-за max_execution_time. Разве что на Денвере.
file_get_contents() удобен тем, что ты можешь в контексте отправить заголовки, тот-же cookies или user-agent например.

Похожие вопросы
дайте инструкцию на микроробота спайдер хегсбаг. я потерял свою
как написать в паскале. как написать в паскале
База данных интернет магазина. Хочу написать БД под интернет магазин, но как правильно построить не получается .
Нужна программа, для мониторинга рынка цен по интернет-магазинам. Кто может написать???
Как мне написать мой эмайл в интернете?
что написать на английском про интернет?
Кто кого человек паук или спайдер мен?
Хочу написать книгу по интернету и здать на прочитавание в интернете где можно написать ?!
как написать код чтобы программа подключалась к интернету?
Помогите написать код интернет магазина журналов