Автор: Дмитрий Якименко
Для реализации одного из проектов, связанного с прохождением обязательной сертификации в отдельных сферах деятельности, команде потребовалось собрать данные отделений Ростехнадзора, расположенных по всем регионам России. Основное внимание было уделено сбору и систематизации юридических и банковских реквизитов, что являлось ключевым моментом для дальнейшей реализации и развития проекта..
Для более удобной классификации и сортировки информации команда приняла решение использовать возмоджности Excel. Это решение позволило структурировать данные и быстро находить нужную информацию при необходимости. Каждое подразделение имеет свой сайт на поддомене, что облегчает доступ к базовым данным, таким как ИНН и КПП. Эти идентификаторы можно было извлечь без особых усилий, что положительно сказалось наскорости и полноте сбора информации.
Тем не менее, ключевой проблемой оказались банковские реквизиты, которые не были указаны на сайтах отделений. Это создало сложности в автоматизации сбора данных, так как стандартные методы парсинга не сработали.
В результате команда разработала альтернативное решение: было решено искать бланки платежных документов каждого отделения. Изучая эти бланки, удалось извлечь необходимые поля с банковскими реквизитами. Этот процесс потребовал значительного времени — два с половиной дня. Однако, несмотря на временные затраты, вся информация была успешно собрана.
Так как сбор данных был разовой необходимостью, команда успешно справилась с задачей вручную. Однако если бы потребовалось регулярно собирать эту информацию, автоматизация процесса была бы крайне необходима, чтобы существенно ускорить сбор данных и минимизировать риски ошибок, связанных с ручным вводом.
Дата публикации: 09 окт, 2024