Подведомственная Роскомнадзору организация создаст интернет-бота, который будет сканировать сайты на наличие запрещенных к распространению персональных данных россиян.
Детали разработки
За реализацию проекта стоимостью до 41 млн рублей отвечает Главный радиочастотный центр (ГРЧЦ). Автоматизированная система должна проводить постоянный мониторинг интернет-ресурсов отечественного сегмента интернета и оценивать, насколько сайты соблюдают законодательство России о хранении и обработке персональных данных. Собранная роботом информация должна хранится не менее трех лет.
ГРЧЦ намерен привлечь исполнителя проекта через тендер, объявленный в формате конкурса. Принять участие в нем могут только предприятия малого и среднего бизнеса. Заявки ведомство рассматривает до 13 сентября. Победитель должен выполнить все работы до 13 декабря 2021 года.
Требования к проекту
Техническое задание тендера предусматривает, что система должна поддерживать одновременную работу не менее 200 авторизованных пользователей и проводить мониторинг 500 тыс. сайтов ежегодно и 15 тыс. – еженедельно.
В качестве архитектуры необходимо использовать многоуровневый подход, в котором применяются уровни хранения данных, приложений и представления. Система должна быть доступна пользователям через веб-браузер. Реализация компонентов и функциональных задач предусматривает использование микросервисной архитектуры на основе открытого ПО Docker.
Кроме того, разработчикам необходимо учесть требование, касающееся использования системой программного обеспечения от отечественных компаний, чьи решения включены в реестр российского ПО Минцифры. Если необходимое для работы приложение отсутствует в перечне, то следует сделать выбор в пользу open source продуктов.
Вопрос скорости
Заявленные технические параметры системы не способны охватить весь Рунет. Как сообщает «Технический центр Интернет», в августе этого года в домене верхнего уровня .RU делегировано 4,801 млн доменов, в .SU – 99 тыс., в .РФ – 637 тыс. Кроме того, к отечественному сегменту сети следует относить русскоязычные сайты в международных зонах .COM, .NET и т.д. Таким образом, робот ГРЧЦ сможет за год исследовать лишь малую часть Рунета на предмет наличия нелегальных персональных данных.
Однако не исключено, что система будет проводить мониторинг только определенной группы интернет-ресурсов. К примеру, сейчас в реестре операторов персональных данных Роскомнадзора находится около 429 тыс. организаций. Это число близко к заявленным техническим требованиям для разработки проекта.