Разработчик Михаил Гранкин создал сервис «Порфирьевич», который умеет дописывать тексты на русском языке. Гранкин взял за основу нейросеть GPT-2 компании OpenAI – «лучшую нейросеть в своем классе». Один из основателей компании – Илон Маск, создатель Tesla и SpaceX.
Фактически «Порфирьевич» – русскоязычная версия GPT-2. Сервис умеет анализировать начало истории (от слова до нескольких предложений) и создавать продолжение, которое обычно кажется вполне осмысленным. Разработчику оставалось обучить сеть русскому языку. За основу для обучения Гранкин взял произведения Достоевского, Пушкина, Толстого, Булгакова, Гоголя и Пелевина. Название «Порфирьевич» – отсылка к пелевинскому роману «iPhuck X» и его герою, полицейскому-литературному роботу Порфирию Петровичу.
Как работает сервис
Для начала работы «Порфирьевичу» понадобится связный текст на русском языке. Но даже если вы введете одно слово, сервис сможет начать анализ. После ввода достаточно нажать на кнопку «Варианты». Для каждого из них система способна сгенерировать бесконечное множество продолжений.
В расширенных настройках «Порфирьевича» можно задавать количество слов в дополнении – от 1 до 60. Также можно включать автодополнение – когда система анализирует начало предложения на этапе ввода и сразу предлагает варианты для продолжения.
Результат работы нейросети можно скопировать или сохранить в виде готовой картинки. Сеть запущена в облаке Amazon. А еще один бот Гранкина на том же движке пишет стихи.
Что может «Порфирьевич»
Нейросеть генерирует действительно осмысленные тексты. Мы решили взять несколько популярных фраз и посмотреть, что получится:
«Крупные IT-компании вкладывают огромные деньги в AI. Результаты исследований публикуются открыто, почти всегда вместе с кодом. То есть результат многомиллиардных инвестиций раздают бесплатно на GitHub каждый день. И компании ещё соревнуются в том, кто больше раздаст этого добра. Количество публикаций и качество результатов растут невероятными темпами. В результате образуется разрыв – индустрия не успевает применить на практике все, что публикуют исследователи.
Делать исследования, создавать новую архитектуру нейронных сетей —сложно, а пользоваться готовыми нейросетями – очень просто. Отсюда получается рецепт успеха: взять с полочки результат многомиллиардных инвестиций и применить его к своей задаче», – рассказал Гранкин изданию TJournal.