OpenAI научила нейросеть кратко пересказывать содержимое книг

OpenAI представила инструмент, который генерирует краткое содержание книг при помощи машинного обучения. Нейросеть способна ужать произведение из тысяч слов до нескольких сотен.

Как работает технология

Модель искусственного интеллекта, способная создавать выжимки из книг, разработана на базе GPT-3. Инструмент обрабатывает текст в несколько этапов. Сперва нейросеть анализирует структуру произведения и разбивает его на разделы, затем генерирует краткое содержимое каждой из частей, объединяет получившийся результат в один текст и снова укорачивает его, пока не получит финальную выжимку с заданными параметрами.

В качестве демонстрации работы ИИ исследователи OpenAI сократили «Алису в стране чудес». Книга Льюиса Кэрролла содержит более 26 тыс. слов. После первого этапа обработки нейросеть представила 66 выжимок по 6 тыс. слов, после сократила объем текста до шести разделов по 830 слов. На выходе получился краткий пересказ книги из 136 слов.

Как заявляют исследователи, нейросеть способна создавать выжимки на уровне литературного произведения, которые содержат большую часть исходной ключевой информации. Тем не менее, иногда ИИ допускает неточные утверждения из-за того, что не распознает контекст. Авторы проекта уточняют, что инструмент способен работать с книгами любого размера, даже состоящими из тысяч страниц.

Метод обучения

По словам представителей OpenAI, создание инструмента для генерации выжимок из литературы – часть постоянных исследований организации по совершенствованию возможностей искусственного интеллекта. Компания не намерена делать сервис доступным для других пользователей, публиковать его исходный код и делать проект открытым.

Для тренировки нейросети OpenAI использовала базу данных из художественных англоязычных книг в обучающем наборе GPT-3. Каждое произведение в среднем содержало не менее 100 тыс. слов. Чтобы оценить результаты генерации краткого содержания, исследователи отобрали 40 бестселлеров 2020 года и поручили двум людям прочитать эти книги и самостоятельно написать выжимку. После результаты человеческого труда сравнили с итогами машинной обработки текста.

Несмотря на достаточно детальное изложение фактов, нейросеть, по словам авторов проекта, скорее генерирует список событий из книги, а не связанный краткий пересказ. Кроме того, ИИ иногда принимает незначительные детали за существенные, особенно в детективных романах.

Если вам удобнее смотреть новости в телеграме, то вот наша группа – ИНФОСТАРТ.

Автор:

Александр Вашкевич

Аналитик

Хакатон «Лидеры цифровой трансформации»: открыт прием заявок

+3 –

Новость ИТ и 1С Бизнес-аналитик Программист

До 18 сентября подавайте заявку на цифровое событие года – хакатон «Лидеры цифровой трансформации». Участников ждут 20 задач от крупных компаний, 40 млн рублей призового фонда, 14 дней онлайн-кодинга и финальный фестиваль в Москве.

16.09.2025 2015 AnastasiaKl 0

Slack ушел – 1С-Коннект и другие российские мессенджеры занимают его место

+3 –

Новость Импортозамещение ИТ и 1С

После ухода Slack из России в 2024 году бизнес стал переходить на отечественные корпоративные мессенджеры. Один из самых универсальных — 1С-Коннект. Расскажем подробнее о нём и других решениях российских разработчиков.

24.04.2025 3791 AnastasiaKl 5

Российские решения готовы занять место зарубежных в трех классах ИТ-средств

+3 –3

Новость ИТ-компания ИТ и 1С

С января по март 2025 года Ассоциация КП ПОО провела исследование отечественных систем виртуализации, коммуникации и контейнеризации по 266 показателям. Результаты показали, что медианная технологическая зрелость у этих ИТ-решений превышает 75%.

04.04.2025 3422 orenk0t 1

Минцифры планирует создать платформу для подтверждения навыков ИТ-специалистов

+2 –

Новость ИТ и 1С

Минцифры подготовило проект постановления по запуску платформы, на которой ИТ-специалисты могут пройти добровольное тестирование и подтвердить свою квалификацию.

11.12.2024 3654 user1915669 3

ФНС открыла бесплатный сервис для формирования машиночитаемых документов

+2 –

Новость ИТ и 1С ФНС ЭДО

Федеральная налоговая служба запустила интерактивный сервис, позволяющий формировать в машиночитаемом виде договоры, контракты, соглашения и спецификации. Чтобы создать документ и скачать получившийся файл, регистрация не требуется.

03.12.2024 3165 user2114475 0

Альянс по ИИ опубликовал новую модель с профессиями и компетенциями

+3 –

Новость ИТ и 1С

Российский Альянс по искусственному интеллекту обновил требования к специалистам по ИИ: вышла новая модель с основными профессиями и навыками. Теперь базовых профессий в сфере ИИ осталось только четыре.

01.11.2024 3589 user1915669 0

В России планируют внедрять новые системы безналичных расчетов: «Волна» и BRICS Pay

+4 –

Новость ИТ и 1С

Система платежей «Волна» по планам сделает возможной бесконтактную оплату для владельцев iPhone в России, а BRICS Pay позволит совершать безналичные расчеты иностранцам по картам Visa и Mastercard.

23.10.2024 4051 AnastasiaKl 0

Конструктор сайтов Wix уходит из России с 12 сентября

+2 –

Новость ИТ-компания ИТ и 1С

Конструктор сайтов Wix уходит из России с 12 сентября 2024 года – перестанут работать все российский аккаунты. Сайты, привязанные к аккаунтам, также перестанут работать.

11.09.2024 3791 user1915669 2

Для отправки сообщения требуется регистрация/авторизация

OpenAI научила нейросеть кратко пересказывать содержимое книг

Как работает технология

Метод обучения

См. также

Журнал

База знаний

Лаборатория

Анализ & Управление

Сопровождение 1С

Корпоративные решения

Обучение

Маркетплейс

Проектный офис