Ничего лишнего: Facebook научил нейросеть забывать устаревшие данные

Ничего лишнего: Facebook научил нейросеть забывать устаревшие данные
25.05.2021
14396

Социальная сеть разработала новый способ хранения данных, используемых для машинного обучения. Благодаря методу нейросеть сможет периодически избавляться от ненужных сведений.

Цель исследования

Изобретение Facebook под названием Expire-Span предназначено для более экономной обработки данных. Способ хранения предполагает присваивание каждому фрагменту информации срок годности в зависимости от значимости сведений для конкретной модели. Нейросеть будет со временем «забывать» отмеченные данные.

Исследователи компании объясняют, что искусственный интеллект самостоятельно не способен определить, какие сведения являются ключевыми, а какие – второстепенными. Из-за этого система обрабатывает их неэффективно, тратя одинаковое количество ресурсов на каждый фрагмент данных. Новая методика решает эту проблему, оптимизируя вычислительные ресурсы, затраченные на сортировку, хранение и обработку информации.

Кроме того, возрастет результативность работы нейросетей – они смогут дольше сохранять важные сведения и выдавать более точный итог в процессе обучения.

Как устроена технология

Каждый раз, когда нейросеть получает новый фрагмент данных, Expire-Span прогнозирует и назначает степень полезности информации в определенном контексте. Чем выше система установит приоритет, тем дольше ИИ будет сохранять сведения, т.к. им присваивается длительный срок годности. При загрузке дополнительных фрагментов разработка Facebook проводит переоценку всех данных в контексте новой информации, всегда поддерживая актуальность обрабатываемых переменных.

Чтобы проиллюстрировать метод Expire-Span, исследователи приводят в качестве примера работу системы с текстовым массивом данных. В зависимости от заданных в начале условий нейросеть может получить задачу прогнозировать слова на основе введенных символов. Благодаря разделению значимости информации ИИ будет запоминать только редкие слова: имена, географические названия и т.д. В изначальный массив не будет попадать часто употребимая лексика, такая как предлоги, союзы, местоимения.

При этом система сможет по-прежнему помнить, насколько часто каждое конкретное слово встречается в тексте, чтобы проводить корректные вычисления и правильно прогнозировать. Забыто будет лишь многократное повторение высказываний.

Перспективы технологии

Исследователи Facebook отмечают, что сейчас разработка находится на ранней стадии и не готова к публичному использованию. В планах у программистов создать для искусственного интеллекта аналог человеческой памяти, которая позволит хранить и обрабатывать данные гораздо быстрее, чем позволяют существующие технологии.

Автор:
Аналитик

См. также

Минцифры подготовило проект постановления по запуску платформы, на которой ИТ-специалисты могут пройти добровольное тестирование и подтвердить свою квалификацию.

11.12.2024    990    user1915669    3       

2

Федеральная налоговая служба запустила интерактивный сервис, позволяющий формировать в машиночитаемом виде договоры, контракты, соглашения и спецификации. Чтобы создать документ и скачать получившийся файл, регистрация не требуется.

03.12.2024    791    user2114475    0       

2

Российский Альянс по искусственному интеллекту обновил требования к специалистам по ИИ: вышла новая модель с основными профессиями и навыками. Теперь базовых профессий в сфере ИИ осталось только четыре.

01.11.2024    951    user1915669    0       

3

Система платежей «Волна» по планам сделает возможной бесконтактную оплату для владельцев IPhone в России, а BRICS Pay позволит совершать безналичные расчеты иностранцам по картам Visa и Mastercard.

23.10.2024    1259    AnastasiaKl    0       

4

Конструктор сайтов Wix уходит из России с 12 сентября 2024 года – перестанут работать все российский аккаунты. Сайты, привязанные к аккаунтам, также перестанут работать.

11.09.2024    1238    user1915669    2       

2

ИИ научат разработке цифровых интегральных микросхем – несколько российских научных институтов заявили об участии в проекте. Проект рассчитан на 3 года – с 2024 по 2026.

23.07.2024    874    user1915669    0       

2

Развитие искусственного интеллекта и цифровых сервисов в России стало причиной роста потребности в мощных центрах обработки данных. Эксперты прогнозируют, что дефицит ЦОД, который уже наблюдается сегодня, в ближайшие годы будет только усиливаться.

18.07.2024    988    AnastasiaKl    0       

1

В сентябре 2024 года видеоигры в России начнут маркировать – пока на добровольной основе. Геймерам будут сообщать о семи видах чувствительного (неприятного) контента в игре.

17.07.2024    1064    user1915669    0       

1
Инфостарт бот

Оставьте свое сообщение