Свободная энциклопедия не раз выручала каждого из нас. Но как часто вы видели пометки вроде «Источник не указан 1000 дней»? Теперь за редактирование «Википедии» взялась система искусственного интеллекта, разработанная в Массачусетском технологическом институте (MIT - Massachusetts Institute of Technology). Ее научили переписывать устаревшие предложения в энциклопедии.
Что может ИИ
Разработчики умной системы отмечают: в «Википедии» – миллионы статей, которые нуждаются в регулярном обновлении. Материалы нужно расширять и серьезно переписывать, а также обновлять даты, номера, имена и местоположения.
Сейчас редактированием занимаются тысячи волонтеров по всему миру. Но отнюдь не всегда (намеренно или нечаянно) они указывают корректную информацию.
С помощью ИИ этот процесс можно автоматизировать. Искусственный интеллект находит в энциклопедии предложения, которые устарели. Затем он переписывает фрагменты материалов, сохраняя стиль редактора-человека и соблюдая правила грамматики. Это позволит редакторам тратить меньше времени и сил на актуализацию статей, а взамен пополнять свободную энциклопедию новым материалами.
Независимые эксперты оценили качество редактирования. Модель получила средние оценки 4 из 5 баллов за обновление фактов и 3,85 балла за соответствие новых предложений нормам грамматики.
Боты уже редактируют «Вики»
Дарш Шах, аспирант лаборатории информатики и искусственного интеллекта MIT и один из авторов системы, отметил: боты уже редактируют «Википедию». Но они в основном либо препятствуют вандализму (когда кто-то намеренно добавляет в энциклопедию неправдивую информацию), либо вставляют сведения в заранее определенные шаблоны.
Новая система куда сложнее. Она берет новый фрагмент неструктурированной информации и редактирует ее, получая осмысленное предложение.
Шах добавил: если сейчас боты в основном работают по четко заданным правилам, то новая система справится даже с анализом аргументов, которые противоречат друг другу. И сформирует из них связный текст.
Без людей пока не обойтись
Систему представили на конференции AAAI, посвященной искусственному интеллекту. Но разработчики признали: полностью отдать «Википедию» на откуп ИИ пока не получится.
Работает это так: человек вводит новую информацию в специальное поле. Он может не беспокоиться о структуре предложения и знаках препинания.
ИИ анализирует информацию и находит статьи, в которые ее нужно добавить. Затем он строит правильные предложения и вставляет их в статьи, а устаревшие фрагменты удаляет.
Множество применений
ИИ-редактор можно будет использовать для создания и других приложений, которые генерируют текст. Он решает новую для машинного обучения задачу: не генерирует текст с нуля, но аккуратно редактирует его.
Систему уже задействовали для автоматического синтеза предложений в популярном наборе данных для проверки фактов. ИИ позволил уменьшить величину системной ошибки, не заставляя ученых собирать дополнительные данные вручную.
Будущее системы
Разработчики верят, что уже скоро процесс можно будет сделать полностью автоматическим. ИИ будет сканировать интернет и находить обновленные данные, чтобы вставлять их в подходящие статьи.
Таким образом, система возьмет на себя большую часть рутинной работы. А редакторы-люди будут привлекаться только для выборочного контроля исправлений.