Ученые из Великобритании и КНР решили помочь пользователям с расшифровкой капч. Они научили искусственный интеллект распознавать искаженные символы всего за 0,05 с. Причем не на сверхмощном сервере, а на обычном компьютере.
Капчи можно обойти
Капча – это простейший тест Тьюринга, который позволяет отличить человека разумного от бездушного алгоритма. Точнее, позволял. Попытки обойти капчи с помощью искусственного интеллекта были и ранее, но их эффективность нельзя назвать высокой. Но ученые из Великобритании и КНР смогли улучшить эти результаты. Они разработали алгоритм на базе GAN – генеративно-состязательной сети. В результате для уверенного распознавания капч достаточно 0,05 с.
Суть технологии
Генеративно-состязательная сеть (Generative Adversarial Network, GAN) – класс алгоритмов, который применяется в сценариях с небольшим количеством обучающих данных. Фактически в алгоритме строятся две нейронные сети. Первая сеть генерирует образцы, смешивая наборы исходных данных. Вторая сеть – дискриминативная: она пытается расшифровать образцы.
При этом сети противостоят друг другу. Первая пытается усложнить задачу, вторая –угадать ответы вне зависимости от сложности, пояснили ученые из английского Ланкастерского и китайских Северо-Западного и Пекинского университетов. Ученые тренировали GAN на 500 образцах из 11 сервисов капчи, которые используются на 32 сайтах из топ-50 в рейтинге Alexa. Подготовка данных заняла два часа. В процессе обучения первая подсеть синтезировала 200 тыс. капч. Вторая сеть обучалась на них и на исходных образцах.
Реальные Google-капчи и синтезированные ИИ версии
Опасно ли это
Обычно капчи используются для ограничения доступа к ресурсам или блокировки брутфорса – серийных попыток взлома аккаунтов за счет перебора возможных паролей. Стандартных ботов, которые пытаются обойти капчу, достаточно легко распознать и заблокировать.
Даже те боты, которые были созданы на базе искусственного интеллекта, ранее особого эффекта не имели. Они были требовательны к ресурсам и, как правило, запускались в ботнетах (сетях, объединявших десятки или сотни компьютеров). Новый алгоритм не требует ни огромного количества данных для обучения, ни больших вычислительных мощностей. Нейросеть запускается на обычном ПК или смартфоне и быстро учится. Потенциально это снижает порог входа для хакеров, планирующих атаки. Разработчики отметили, что алгоритм со 100% точностью распознал капчи на таких сайтах, как Megaupload, Blizzard и Authorize.NET, а также показал высокие результаты на сайтах Amazon, PayPal, Yahoo и др.
Нейросеть сгенерировала капчи на основе текстового задания. На одной из этих капч – ключ к одной интересной новогодней игре...
Защититься от автоматического распознавания капч ресурсы могут, только если внедрят альтернативные способы обнаружения ботов. Это, к примеру, анализ биометрических данных пользователей или шаблонов поведения. Но для решения таких задач придется вложить значительные средства в разработку еще более продвинутого искусственного интеллекта.