Skip to content

Latest commit

 

History

History
7 lines (7 loc) · 880 Bytes

README.md

File metadata and controls

7 lines (7 loc) · 880 Bytes

Парсер предприятий Татарстана

Используемые библиотеки bs4,requests

Задание:

Спарсить информацию о предприятиях со всех страниц с сайта для дальнейшей рассылки коммерческого предложения.

Решение:

Изначально сам сайт очень криво сверстан,были проблемы с кодировкой при парсе. Сам парсинг осуществляется по диапозону объявлений,а не страниц. Потому что при удалении владельцем сайта какой то информации о предприятиях,она не удаляется из самой базы на сервере сайта.