Простейший парсинг HTML, но сильно критична скорость. На чем и как реализовать?
Допустим в текстовом файле есть 100500 сцылок.
Мне нужно по каждой ссылке достать содержимое тегов < title > и < / title>.
Написал сам на Python, с использованием HTMLParser и urllib.request
Но каждая ссылка обрабатывается 3-4 секунды (это слишком много, для большого объема ссылок) - это время загрузки страницы через request и парсинга вместе.
На чем и с какой либой можно переписать программу, чтобы работала быстрее? Мне-бы хоть на чистом Си, главное подскажите, куда копать.
Спасибо, Кэп! Вопрос закрыт.