Книжный клуб: лучшие книги по машинному обучению для новичков

19.06.2023      2676

На этот раз в рубрике "Книжный клуб" говорим о книгах по машинному обучению. 

Машинное обучение (ML) – это такой класс методов, когда алгоритм учат думать и действовать как человек, на основе полученного опыта. То есть, специалист "кормит" машину примерами человеческого поведения: передает машине данные и объясняет, что хочет получить на выходе. Задача машины в этом случае – найти решение самостоятельно. Компьютер запоминает этот опыт, накапливает его и, таким образом, обучается действовать и "принимать решения" в разных ситуациях, почти как живой специалист.

Например, в Инфостарт мы используем ML / DL для анализа входящих обращений пользователей, обработки различных видов заказов и прогнозирования спроса.

Дата-аналитик в Инфостарт и автор собственной книги об ML для начинающих Елена Капаца составила личный топ книг, которые помогут погрузиться в тему. 

Себастьян Рашка: Python и Машинное обучение

Эта книга предлагает практический метод изучения машинного обучения с помощью языка программирования Python. В книге приведены примеры кода и методологии, которые могут помочь вам научиться выбирать и использовать подходящие алгоритмы машинного обучения. 

Допустим, перед вами встала задача выбрать ушедших без покупки пользователей, чтобы их потом “дожали” продающие отделы. Абы кого выделять бесполезно, стоит найти похожих на покупателей людей. Для такой задачи под названием Uplift Modeling вы быстро выберете кандидатов на уже “обкатанном” перечне решений – XGBoost, kNN и проч.

Орельен Жерон: Прикладное машинное обучение с помощью Scikit-Learn, Keras и TensorFlow

Книга содержит стратегии для создания и оценки моделей машинного обучения, используя библиотеки Scikit-Learn, TensorFlow и Keras. 

Орельен Жерон не только описывает теоретические концепции, но и предоставляет практические примеры и код в Python, используя библиотеки Scikit-Learn, Keras и TensorFlow. Также автор показывает, как подобрать параметры модели и использовать функции для оценки ее эффективности.

Андрей Бурков: Машинное обучение без лишних слов

В книге описаны основные алгоритмы машинного обучения, сопровождаемые кодом на Python. Очень важно, чтобы читатель, всерьез взявшийся осваивать дисциплину, сразу мог “пощупать” код, даже запустить его. Так вы расстанетесь с чувством страха при освоении непростой темы и, возможно, даже немного научитесь дебажить код, ведь с момента написания книги прошло время, и инструменты обновились.

В первой главе есть забавный философский раздел, которого не найти в других книгах – “Когда следует использовать Машинное обучение”. Наверное, из-за таких выводов на ML сегодня принято “сваливать” все, что другими средствами не решилось:

  • Когда задача слишком сложна для кодирования
  • Когда задача постоянно меняется
  • Когда речь идет о задаче восприятия
  • Когда это неизученное явление
  • Когда задача имеет простую целевую функцию
  •  Когда это экономически выгодно

Бенджио Иошуа, Гудфеллоу Ян, Курвилль Аарон: Глубокое обучение

Эта книга описывает глубокое обучение и охватывает теорию, алгоритмы и приложения. Книга разработана для тех, кто уже имеет некоторый опыт в машинном обучении и хочет расширить свои знания.

В книге представлены основы линейной алгебры, теории вероятности и теории информации, а также основы численных расчетов и машинного обучения, которые необходимы для полного понимания материала. При этом в книге содержится описание различных методов глубокого обучения, применяемых на практике, включая глубокие сети прямого распространения, алгоритмы оптимизации, сверточные сети, а также моделирование последовательностей. Помимо этого, книга охватывает множество областей применения глубокого обучения, таких как обработка естественных языков, распознавание речи, компьютерное зрение, онлайновые рекомендательные системы, биоинформатика и видеоигры.

Ричард Саттон, Эндрю Барто: Обучение с подкреплением

Это учебник, посвященный глубокому обучению, в котором исследуется, как модель выбирает действия на основе наград и штрафов. Эта книга обязательна для любого, кто прошел стадию новичка и готов принять в свою жизнь целый зверинец новых понятий – метод Монте-Карло, многорукие бандиты, SARSA и т.д.. 

Книга не даст заскучать: она состоит из 500+ страниц, насыщенных математическими формулами, кодом и непростыми иллюстрациями. Новичкам не подходит.

Эндрю Траск: Грокаем глубокое обучение

Книга представляет собой метод изучения глубокого обучения, основываясь на интуиции, в которой повествование и примеры основаны на аналогиях и образах, что делает книгу доступной для новичков.

 

 

К примеру, в задаче распознавания рукописных цифр Траск виртуозно, буквально за одну картинку знакомит читателя с понятиями “прогнозы” (выходные значения): модель, “наевшаяся” учебных изображений цифр с пометками, относит следующую, неразмеченную к девяткам с вероятностью 98%.

Джейк Вандер Плас: Python для сложных задач: наука о данных и машинное обучение

Книга описывает инструменты, необходимые для выполнения практических задач в науке о данных в Python. Входит в список “Бестселлеры o’Reilly” – ту самую “звериную” подборку книг по самым разнообразным технологиям, среди которых, кстати, найдется еще несколько интересных изданий про Машинное / Глубокое обучение.

 

 

Особенный интерес для меня представил подробнейший раздел про визуализацию с помощью инструмента Matplotlib. Казалось бы, через нее проходит 99% новичков в ML, и сказать что-то новое трудно, но нет. Больше 100 страниц Вандер Плас посвящает самым тонким нюансам dataviz (визуализации данных). Вот яркий пример “закрытого гештальта” для меня – визуализация графиков разного размера на одном прямоугольном “полотне”:

Андреас Мюллер, Сара Гвидо: Введение в машинное обучение с помощью Python. Руководство для специалистов по работе с данными

Книга предлагает простой и практичный подход к изучению машинного обучения. Она содержит множество примеров и задач в области предсказательного моделирования и классификации, используя библиотеки Scikit-Learn и Pandas.

 

 

Редакция добавила к этому списку и книгу Елены “Машинное обучение доступным языком”. Это краткий гайд для новичков по машинному и глубокому обучению с разбором кода. В книге вы найдете необходимый минимум по предмету: Елена описала его понятным языком, так что книга подойдет даже школьникам.  А некоторые разделы в книге написаны с помощью chatGPT. 

Книга включает море практических примеров: читатель сможет освоить базовый инструментарий подготовки данных, их загрузку в модель и ее донастройки. Подходит разработчикам, аналитикам и студентам технических специальностей.

Внимание, конкурс

Делитесь в комментариях собственными отзывами или опытом по использованию ML в решении рабочих задач. Автору лучшего комментария подарим книгу "Машинное обучение доступным языком”.


Автор:


Комментарии
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
1. John_d 5421 20.06.23 10:20 Сейчас в теме
Интересно кто-нибудь дочитал до конца статью. Дарите мне так как я дочитал)
user1559729; dimisa; Darklight; Aphanas; Светлый ум; +5 Ответить
2. Darklight 32 20.06.23 13:01 Сейчас в теме
Со времён первого выпуска Книжного клуба мне было интересно лишь одно - когда и как разыграли прошлую книгу «Идеальный программист» Роберта Мартина, и кто же её выиграл?
3. ubnkfl 20.06.23 13:02 Сейчас в теме
Дарить книгу не надо. Лучше скажите, где купить.
И вообще, если Инфостарт выпустит свой курс по машинному обучению для 1С-ников - будет замечательно.
Casey1984; +1 Ответить
4. ubnkfl 20.06.23 13:04 Сейчас в теме
(3) На Литресе нашел. В бумажном виде нет? Впрочем, 60 стр. 43 иллюстрации, можно и с экрана.
5. frkbvfnjh 787 21.06.23 05:54 Сейчас в теме
Книги доступным языком писали только до 90-х годов, видимо людей учили понятно писать, а теперь что бы понять книгу, нужно быть ее автором...
fitwist; ubnkfl; CK3; +3 Ответить
6. ЛЛ Юрий 25.06.23 07:51 Сейчас в теме
Не подскажите, в какой последовательности читать эти книги?
7. fitwist 27.07.23 14:38 Сейчас в теме
(6) Жесткой последовательности, конечно, нет, потому просто перечислю вам от простых к сложным:

ПРОСТЫЕ
Бурков
Вандер Плас

СЛОЖНЫЕ
Траск
Саттон
Рашка
Иошуа
Жерон
Мюллер
Оставьте свое сообщение

См. также

«Сколково» объявил отбор перспективных ИИ-проектов для получения грантов

Новость Искусственный интеллект ИТ-Новость

В 2024 году «Сколково» выделит пилотным проектам в сфере искусственного интеллекта гранты на общую сумму 554 млн рублей. В результате отбора финансирование получат проекты с применением ИИ в областях производства, операционной деятельности и в работе предоставляемых сервисов.

12.04.2024    620    AnastasiaKl    3       

3

В программу подготовки спортивных программистов вошли бег и скорость печати

Новость ИТ-Новость

Пятничное: в России вступил в силу стандарт подготовки по дисциплине «спортивное программирование». В стандарт вошли требования к физическим показателям спортсменов и скорости набора текста.

16.02.2024    732    VKuser24342747    2       

1

Росстандарт утвердил протокол LoRaWAN для интернета вещей

Новость ИТ-Новость

Федеральное агентство по техническому регулированию и метрологии (Росстандарт) утвердило национальный стандарт протокола LoRaWAN RU, таким образом он получил официальный статус. Технология используется для беспроводной передачи данных между устройствами интернета вещей.

19.01.2024    505    VKuser24342747    0       

2

Новый закон откладывает на год вступление в силу изменений в порядок регистрации на сайтах

Новость Законодательство ИТ-Новость

12 декабря вступил в силу Федеральный закон, меняющий срок, к которому все владельцы сайтов должны внести изменения в порядок авторизации пользователей на сайте. Закон вводит переходный период до 1 января 2025 года.

20.12.2023    673    VKuser24342747    2       

1

Вышло крупное обновление для Android Studio

Новость Мобильные приложения ИТ-Новость

Новая версия Android Studio под номером 2023.1 получила имя Hedgehog. Появились возможности контролировать производительность приложений и управлять подключенными устройствами.

07.12.2023    837    VKuser24342747    2       

3

GitHub опубликовал результаты ежегодного исследования проектов с открытым исходным кодом

Новость GitHub ИТ-Новость

GitHub собрал данные об Open Source проектах в рамках ежегодного исследования Octoverse. Компания изучила географию репозиториев, используемые языки программирования и нейросети, а также активность сообщества.

15.11.2023    549    VKuser24342747    1       

2

Некоммерческие проекты смогут получить бесплатный доступ к GigaChat API

Новость ИТ-компания ИТ-Новость

Компания «Сбер» заявила, что будет бесплатно предоставлять доступ к API нейросети для генерации текста GigaChat для некоммерческих проектов. Однако для них будет ограничено число доступных токенов.

01.11.2023    681    VKuser24342747    2       

3

Состоялся релиз свободной среды разработки Geany 2.0

Новость ИТ-Новость Программист

Вышла новая версия Geany 2.0. Обновление затронуло внешний вид программы, расширило поддержку файлов и сторонних проектов, добавило новые способы работы с кодом.

25.10.2023    731    VKuser24342747    0       

1

Минцифры подготовило критерии по выбору оператора реестра провайдеров хостинга

Новость Минцифры ИТ-Новость Роскомнадзор

Минцифры подготовило проект постановления, которое утверждает требования к организации, претендующей на статус оператора реестра провайдеров хостинга.

25.10.2023    399    VKuser24342747    0       

1

Минцифры составило алгоритм действий для компаний, у которых не работает VPN

Новость Минцифры ИТ-Новость

Минцифры подготовило разъяснения для российских организаций, у которых возникли перебои в работе VPN-сервисов для клиентов и сотрудников из-за блокировки запрещенных ресурсов Роскомнадзором.

24.10.2023    659    VKuser24342747    0       

0

«Сбер» объявила о доступности SberLinux OS Server для российских компаний

Новость Импортозамещение ИТ-Новость

«СберТех», дочерняя компания «Сбера», объявила о предоставлении доступа к собственной серверной операционной системе SberLinux OS Server российским компаниям. ОС включена в реестр отечественного ПО.

20.10.2023    927    VKuser24342747    0       

2

Минцифры внесло изменения в проект правил идентификации клиентов веб-хостингов

Новость Минцифры ИТ-Новость Роскомнадзор

Минцифры подготовило изменения в пакет документов, которые устанавливают новые требования для провайдеров хостинга. Ведомство расширило перечень допустимых методов идентификации клиентов.

18.10.2023    485    VKuser24342747    0       

1

Google выпустила финальную версию Android 14

Новость Android Google ИТ-Новость

Google выпустила новую версию мобильной ОС Android 14. Изменения затронули настройки внешнего вида и безопасности. Были расширены возможности камеры и инструментов для хранения данных.

12.10.2023    716    VKuser24342747    0       

1

Яндекс объявил об открытии исходного кода DataLens

Новость Аналитика ИТ-Новость Яндекс

BI-система Yandex DataLens теперь развивается в опенсорс. Код продукта выложен для всех на GitHub. Любой желающий сможет развернуть DataLens на своем железе и доработать его под свои сценарии применения.

03.10.2023    1478    ЕленаЧерепнева    1       

6

Роскомнадзор создаст реестр хостинг-провайдеров

Новость Минцифры ИТ-Новость Роскомнадзор

Минцифры подготовило несколько проектов постановлений, которые утверждают правила ведения реестра поставщиков хостинг-услуг, а также новые требования к провайдерам.

02.10.2023    625    VKuser24342747    0       

1

«СберТех» представил репозиторий GitVerse с ИИ-помощником для написания кода

Новость Импортозамещение ИТ-Новость Программист

«СберТех» начал прием заявок на тестирование веб-сервиса для публикации ИТ-проектов GitVerse. Платформа подходит для разработки программ с открытым и закрытым кодом.

26.09.2023    870    VKuser24342747    2       

1

ИП и юрлица смогут использовать смартфон для создания и замены электронной подписи

Новость ИТ-Новость ФНС Цифровая подпись

ФНС внесла изменения в правила оформления электронной подписи руководителя организации и ИП. Станет возможным продлевать ее и записывать при помощи мобильного устройства.

18.09.2023    450    VKuser24342747    1       

1

Журнал IEEE Spectrum опубликовал рейтинг популярности языков программирования

Новость ИТ-Новость Языки программирования

Журнал Института инженеров электротехники и электроники IEEE Spectrum подготовил рейтинг самых популярных языков программирования в 2023 году. Статистика разделена на три категории.

01.09.2023    1354    VKuser24342747    4       

2

В бета-версии Microsoft 365 появилась поддержка языка Python для Excel

Новость ИТ-Новость Языки программирования

С помощью библиотек и средств визуализации Python можно будет манипулировать данными Excel, а затем использовать полученные результаты в формулах, диаграммах и сводных таблицах.

28.08.2023    727    VKuser24342747    0       

2

Специалисты Калифорнийского университета установили, что боты справляются с CAPTCHA лучше, чем люди

Новость ИТ-Новость

Международная группа исследователей изучила эффективность тестов CAPTCHA. Ученые пришли к выводу, что технология больше мешает людям, потому что боты научились с ней справляться.

24.08.2023    1186    VKuser24342747    23       

2

Google Chrome начнет поддерживать квантово-устойчивые алгоритмы шифрования

Новость Google Безопасность ИТ-Новость

В версии Google Chrome 116 появится поддержка алгоритмов шифрования, устойчивых к попыткам дешифрации при помощи квантовых вычислений. Технология объединяет преимущества классической и инновационной криптографии.

24.08.2023    501    VKuser24342747    0       

1

В реестр российского ПО включен первый комплекс обработки больших данных

Новость Импортозамещение Минцифры ИТ-Новость Реестр ПО

Минцифры внесло в реестр отечественного ПО программно-аппаратный комплекс «Скала-Р», предназначенный для обработки больших данных. Это первый комплекс с таким функционалом, включенный в перечень.

22.08.2023    488    VKuser24342747    0       

1

Microsoft внедрила новые функции в GitHub Copilot и анонсировала Windows Copilot

Новость GitHub Искусственный интеллект

ИИ-помощник для разработчиков GitHub Copilot теперь не только в реальном времени анализирует код, предлагает варианты для его улучшения и помогает найти решение проблем в разработке, но и  показывает ссылки на репозитории, из которых взят код. 

17.08.2023    1202    VKuser24342747    0       

1

В JetBrains разработали ИИ-помощника для аналитиков данных

Новость Аналитика Искусственный интеллект

JetBrains представила нейросеть Ask AI для онлайн-блокнота Datalore. Виртуальный ассистент способен генерировать код на нескольких языках, предлагать доработки и упрощать процесс аналитики данных. 

16.08.2023    689    VKuser24342747    0       

1

Исследование: ChatGPT дает неправильный ответ на половину вопросов о программировании

Новость Искусственный интеллект ИТ-Новость

Чат-бот OpenAI ошибается в 52% случаев, когда отвечает на вопросы по программированию. Однако делает это так убедительно, что пользователи не замечают ошибки. 

14.08.2023    1082    VKuser24342747    5       

3