Искусственный интеллект научили редактировать «Википедию»

27.02.2020     

Свободная энциклопедия не раз выручала каждого из нас. Но как часто вы видели пометки вроде «Источник не указан 1000 дней»? Теперь за редактирование «Википедии» взялась система искусственного интеллекта, разработанная в Массачусетском технологическом институте (MIT - Massachusetts Institute of Technology). Ее научили переписывать устаревшие предложения в энциклопедии.

Что может ИИ

Разработчики умной системы отмечают: в «Википедии» – миллионы статей, которые нуждаются в регулярном обновлении. Материалы нужно расширять и серьезно переписывать, а также обновлять даты, номера, имена и местоположения. 

Сейчас редактированием занимаются тысячи волонтеров по всему миру. Но отнюдь не всегда (намеренно или нечаянно) они указывают корректную информацию. 

С помощью ИИ этот процесс можно автоматизировать. Искусственный интеллект находит в энциклопедии предложения, которые устарели. Затем он переписывает фрагменты материалов, сохраняя стиль редактора-человека и соблюдая правила грамматики. Это позволит редакторам тратить меньше времени и сил на актуализацию статей, а взамен пополнять свободную энциклопедию новым материалами.

Независимые эксперты оценили качество редактирования. Модель получила средние оценки 4 из 5 баллов за обновление фактов и 3,85 балла за соответствие новых предложений нормам грамматики. 

Боты уже редактируют «Вики»

Дарш Шах, аспирант лаборатории информатики и искусственного интеллекта MIT и один из авторов системы, отметил: боты уже редактируют «Википедию». Но они в основном либо препятствуют вандализму (когда кто-то намеренно добавляет в энциклопедию неправдивую информацию), либо вставляют сведения в заранее определенные шаблоны.

Новая система куда сложнее. Она берет новый фрагмент неструктурированной информации и редактирует ее, получая осмысленное предложение.

Шах добавил: если сейчас боты в основном работают по четко заданным правилам, то новая система справится даже с анализом аргументов, которые противоречат друг другу. И сформирует из них связный текст. 

Без людей пока не обойтись

Систему представили на конференции AAAI, посвященной искусственному интеллекту. Но разработчики признали: полностью отдать «Википедию» на откуп ИИ пока не получится.

Работает это так: человек вводит новую информацию в специальное поле. Он может не беспокоиться о структуре предложения и знаках препинания. 

ИИ анализирует информацию и находит статьи, в которые ее нужно добавить. Затем он строит правильные предложения и вставляет их в статьи, а устаревшие фрагменты удаляет.

Множество применений

ИИ-редактор можно будет использовать для создания и других приложений, которые генерируют текст. Он решает новую для машинного обучения задачу: не генерирует текст с нуля, но аккуратно редактирует его.

Систему уже задействовали для автоматического синтеза предложений в популярном наборе данных для проверки фактов. ИИ позволил уменьшить величину системной ошибки, не заставляя ученых собирать дополнительные данные вручную. 

Будущее системы

Разработчики верят, что уже скоро процесс можно будет сделать полностью автоматическим. ИИ будет сканировать интернет и находить обновленные данные, чтобы вставлять их в подходящие статьи. 

Таким образом, система возьмет на себя большую часть рутинной работы. А редакторы-люди будут привлекаться только для выборочного контроля исправлений.


Автор:
Ксения Шестакова Обозреватель


Комментарии
Избранное Подписка Сортировка: Древо развёрнутое
Свернуть все
1. ccserg 38 28.02.20 09:00 Сейчас в теме
так и историю можно переписать
Поручик; bashirov.rs; +2 Ответить
2. Jestery 28.02.20 13:36 Сейчас в теме
(1) так её и так переписывают в онлайн-режиме все кому не лень
Оставьте свое сообщение

См. также

В Беларуси заработал сервис видеоконференций на основе российской облачной платформы

Новость Облачные технологии Стартапы

Сервис видеоконференцсвязи на базе российской облачной платформы IVA MCU запустили в Беларуси. Услуги предоставляет республиканский провайдер облачных услуг beCloud. 

вчера в 15:52    212    user1015646    0       

Microsoft открыла исходники для 37-летнего языка GW-BASIC

Новость Новости компаний Языки программирования

Microsoft представила исходный код интерпретатора языка программирования GW-BASIC. 37 лет назад он был одним из самых популярных языков для написания программ и игр. 

вчера в 11:57    317    VKuser24342747    2       

Создатель Linux отказался от Intel в пользу AMD

Новость Linux Микроэлектроника

Линус Торвальдс стал использовать для работы компьютер на базе процессора AMD. Предыдущие 15 лет он отдавал предпочтение ПК на компонентах Intel. 

27.05.2020    537    user1015646    9       

Microsoft Build 2020: переход в онлайн и главные анонсы

Новость Infostart Software Partners Маркет Новости компаний

Компания Microsoft на конференции Build 2020 представила не только технологии будущего, но и полезные практические решения, которыми будут пользоваться миллионы людей по всему миру.

26.05.2020    780    user1015646    0       

Microsoft создаст единую платформу для разработки под Windows

Новость Infostart Software Partners Маркет Новости компаний

Компания представила единую платформу для разработки под Windows, функционал для ответственного использования машинного обучения и другие инструменты для разработчиков. 

25.05.2020    849    VKuser24342747    3       

Разработчик Node.js запустил новую JavaScript-платформу Deno 1.0

Новость Языки программирования

Создатель платформы для JavaScript-разработки Node.js Райан Даль выпустил первый официальный релиз нового проекта – Deno 1.0.

25.05.2020    544    user1015646    0       

Facebook создал тестовый клон своей сети и населил его умными ботами

Новость Соцсети

Компания Facebook разработала платформу-имитацию оригинальной соцсети. Ее населили ботами, чтобы разработчики отработали различные сценарии поведения без ущерба для пользователей

14.05.2020    849    user1015646    0       

GitHub представил сервис для облачной разработки Codespaces

Новость GitHub

Крупнейший сервис хранения репозиториев кода GitHub выпустил масштабное обновление – компания представила встроенную IDE с инструментами для облачной разработки Codespaces, форумы для обсуждения кода, средства защиты репозиториев и другие новшества

12.05.2020    1536    user1015646    1       

Состоялся релиз Linux-дистрибутива Ubuntu 20.04 LTS

Новость Linux Ubuntu

23 апреля, Canonical объявили о доступности дистрибутива Ubuntu 20.04 LTS, под кодовым названием Focal Fossa. Этот выпуск с долгосрочной поддержкой включает в себя новую тему для рабочего стола и темный режим. Под капотом вы найдете обновленное ядро Linux 5.4 и новый способ установки приложений.

08.05.2020    1399    SKravchenko    0       

Новые возможности видеомессенджера Google Duo

Новость Google Мессенджеры

Мессенджер Google Duo повысил качество видеозвонков благодаря новой технологии видеокодеков. Кроме этого разработчики добавили 4 новые функции, которые должны сделать его использование более комфортным.

07.05.2020    1065    SKravchenko    1       

Проверка на прочность: разработчиков заставили доказать надежность ОС «Аврора»

Новость ОС Безопасность Госзакупки Импортозамещение Мобильные приложения

Российская мобильная ОС «Аврора» должна была стать основной системой для смартфонов и планшетов, которые планировали закупать для чиновников и госкомпаний. Но чтобы госзакупки состоялись, правительство потребовало у разработчиков подтвердить надежность продукта.

07.05.2020    1580    user1015646    2       

Apple и Google объединились в борьбе с коронавирусом

Новость Mac OS Google

Apple и Google объединились для борьбы против COVID-19. В блогах компаний появился анонс разработки на основе Bluetooth, помогающей правительствам всего мира сдерживать распространение заражения

28.04.2020    1368    feva    3       

IBM возродит язык программирования COBOL

Новость Языки программирования

Компания IBM решила, что «древний» язык рано списывать со счетов, и намерена возродить его. 

28.04.2020    1988    user1015646    3       

Бесплатная конференция по управлению данными и искусственному интеллекту

Новость

24 апреля состоится бесплатная онлайн-конференция от сообщества лидеров цифровой трансформации Global CIO – «Управление данными и искусственный интеллект». 

22.04.2020    1367    kbazzh    0       

Git – 15 лет: как появилась и чего достигла самая популярная система контроля версий

Новость git

7 апреля система контроля версий Git отметила 15-летие. Решение, разработанное легендарным Линусом Торвальдсом, используют миллионы разработчиков по всему миру. Рассказываем, как создавалась система и почему она так популярна.

22.04.2020    1981    user1015646    0       

Нейросеть Microsoft будет помогать программистам допускать меньше багов

Новость ИТ-компания Искусственный интеллект Маркет Языки программирования

Microsoft планирует разработать ИИ, который сможет с большой вероятностью находить ошибки в коде. Искусственный интеллект сможет разделять их на критические, важные и малозначимые.

21.04.2020    1830    VKuser24342747    5       

Эксперты спрогнозировали рост рынка дата-центров из-за коронавируса

Новость Аналитика

Исследователи из iKS-Consulting пришли к выводу, что при позитивном сценарии развития пандемии российский рынок ЦОДов сохранит темп роста в 15%. При негативном произойдет замедление развития. 

20.04.2020    1341    VKuser24342747    0       

CorelDRAW Graphics Suite 2020: ИИ, быстродействие и возможность совместной работы

Новость Infostart Software Partners Искусственный интеллект Маркет

Разработчики снабдили пакет ИИ-технологиями, усовершенствовали производительность и добавили инструменты для совместной работы в облачном формате. 

16.04.2020    2015    iivanov1    13       

Российские медучреждения в прошлом году приобрели более 40 тыс. копий отечественных ОС

Новость Импортозамещение Медицина

Разработчики Astra Linux рассказали о популярности своей ОС в медицинских учреждениях. За прошлый год компания продала организациям здравоохранения более 24 тыс. лицензий. Еще 20 тыс. поставила «Базальт СПО».

15.04.2020    1440    VKuser24342747    0       

Нейросеть научили расшифровывать названия товаров в чеках

Новость

Для экономии знаков в чеках названия товарных позиций сокращают так, что они теряют всякий смысл в глазах покупателя. Российские разработчики создали нейросеть, которая поможет расшифровать подобные сокращения.

08.04.2020    1909    user1015646    2       

Видеозвонки для всех: Mail.ru провела ребрендинг старейшего мессенджера ICQ

Новость Mail.Ru Мессенджеры

Mailr.ru Group перезапустила мессенджер ICQ. Теперь он ориентирован на групповые видеозвонки, поддерживает возможность создания быстрых ответов и разработки ботов. 

08.04.2020    2210    VKuser24342747    6       

В Liberica JDK 14 улучшилась совместимость с российскими операционными системами

Новость Языки программирования

Российская компания Bellsoft представила Liberica Java Development Kit 14. Новая версия инструментов для Java-разработчиков обеспечивает улучшенную производительность и совместимость с отечественными ОС.

02.04.2020    1713    VKuser24342747    0       

Microsoft прекратит развитие Visual Basic в качестве языка программирования

Новость Языки программирования

Разработчикам VB корпорация предложила перенести свои наработки на платформы .NET Core или .NET 5.0, где сохранится поддержка языка.

31.03.2020    2447    AnastasiaKl    11       

Программирование без кода: обзор инструментов

Новость Языки программирования

Разработка без кода – форма визуального программирования, где пользователи манипулируют элементами кода, перетаскивая их в специальном интерфейсе. Рассказываем еще про несколько инструментов, позволяющих разрабатывать ПО, не написав ни строчки кода.

26.03.2020    3403    SKravchenko    7       

В России создадут систему для выявления «контактеров» с коронавирусом

Новость Минкомсвязь Мобильные приложения

Координационный совет по борьбе с коронавирусом объявил о создании системы по отслеживанию контактов между здоровыми людьми и зараженными коронавирусом. Данные об этих контактах поможет собрать геолокация смартфонов.

26.03.2020    1995    Senator_I    17