Google провела исследование, в котором озвучила ключевые направления развития индустрии машинного обучения (МО) в 2021 году. Компания ожидает в ближайшие годы научных прорывов в отрасли.
Мощные модели
Первый тренд, отмеченный экспертами Google – появление все более крупных и мощных моделей машинного обучения. Всего несколько лет назад лингвистические модели с миллиардами параметров обучались на десятках миллиардов сегментов данных. Сегодня при оценке размеров специалисты все чаще оперируют триллионными цифрами.
При этом возрастает качество выходных данных у генеративных моделей. Нейросети натренированы создавать реалистичное изображение по текстовому описанию и повышать разрешение картинки, «додумывая» недостающие детали. Такое развитие тесно связано с укрупнением моделей – ИИ обучается более точно выполнять задачи.
Эффективность машинного обучения
Эксперты Google пришли к выводу, что предел вычислительных возможностей для тренировки сетей не достигнут – каждое новое поколение ускорителей МО обрабатывает данные лучше предыдущего. Повышение производительности может быть достигнуто благодаря выпуску новых чипов, оптимизации компиляторов и программного обеспечения, доработкам в архитектуре.
Также возможно внедрение технологии разреженности. Она предполагает использование лишь некоторой части высокоемкой модели при обучении на примере или фрагменте данных, что увеличивает скорость обработки информации.
Рост полезности
За последние годы машинное обучение стало более полезным для человека и общества. Применение ИИ в смартфонах позволяет устройствам лучше воспринимать контекст, особенно при работе с фотографиями или живой речью.
Нейросети помогают улучшить качество изображений, получаемых с камер мобильных устройств, и добавить для них поддержку новых функций: HDR+, съемка при слабом освещении, обработка портретов. При распознавании голоса смартфоны стали лучше понимать иностранный акцент, игнорировать посторонние шумы и наложение другого голоса.
Отраслевое применение
Машинное обучение все сильнее начинает влиять на науку, медицину и экологию. Нейросети позволили воспроизвести нервную соединительную структуру тканей головного мозга на основе фотографий. Врачи рассматривают применение МО-алгоритмов для диагностирования рака молочной железы или легких, ускорения лечения раковых больных, проходящих курс лучевой терапии.
Компьютерное зрение применяется для составления прогнозов погоды и раннего оповещения о катаклизмах. В 2021 году система Google по прогнозированию наводнений охватила 360 миллионов человек и отправила 115 млн предупреждений об угрозе затопления – это в три раза больше, чем в 2020 году.
Глубокое понимание ИИ
Специалисты стараются обеспечить справедливое и равноправное использование технологии машинного обучения. К примеру, группа Google, отвечающая за ИИ, ориентированный на человека, исследует рекомендательные системы, основанные на данных об активности пользователей в онлайн-сервисах. Для понимания справедливости и объективности функционирования таких алгоритмов необходимо разобраться, как их компоненты работают вместе и по отдельности. Эксперты смогли понять эти взаимоотношения и установить методы, которые повышают «справедливость» и системы в целом, и отдельных ее частей.