Udemy [udemy] - Предварительная обработка данных для машинного обучения в Python (2021)

  • Автор темы Amerikano
  • Дата начала
Amerikano
Amerikano
Модератор
Сообщения
19,287
Реакции
358,177
Автор: udemy
Название: Предварительная обработка данных для машинного обучения в Python


1652464205236 png


В этом курсе мы сосредоточимся на методах предварительной обработки для машинного обучения.

Предварительная обработка — это набор манипуляций, которые преобразуют необработанный набор данных, чтобы его можно было использовать в модели машинного обучения. Это необходимо для того, чтобы наши данные подходили для некоторых моделей машинного обучения, чтобы уменьшить размерность, лучше идентифицировать релевантные данные и повысить производительность модели . Это самая важная часть конвейера машинного обучения, и она может сильно повлиять на успех проекта. На самом деле, если мы не снабдим модель машинного обучения данными правильной формы , она вообще не будет работать.


Иногда начинающие специалисты по данным начинают изучать нейронные сети и другие сложные модели и забывают изучить , как манипулировать набором данных , чтобы использовать его в своих алгоритмах. Таким образом, им не удается создать хорошие модели, и только в конце они понимают, что хорошая предварительная обработка позволит им сэкономить много времени и повысить производительность своих алгоритмов. Таким образом, владение методами предварительной обработки является очень важным навыком . Вот почему я создал целый курс , посвященный только предварительной обработке данных.

Благодаря этому курсу вы узнаете:

  1. Очистка данных
  2. Кодирование категориальных переменных
  3. Преобразование числовых признаков
  4. Scikit-learn объекты Pipeline и ColumnTransformer
  5. Масштабирование числовых характеристик
  6. Анализ главных компонентов
  7. Выбор функций на основе фильтров
  8. Передискретизация с использованием SMOTE
Все примеры будут даны с использованием языка программирования Python и его мощной библиотеки scikit-learn . Среда, которая будет использоваться, — Jupyter , которая является стандартом в отрасли обработки данных. Все разделы этого курса заканчиваются некоторыми практическими упражнениями , и все блокноты Jupyter можно загрузить .

Для кого этот курс:
  • Разработчики Python
  • Начинающие специалисты по данным
  • Люди, интересующиеся машинным обучением и искусственным интеллектом
Требования
  • Базовые знания языка программирования Python

Материал на английском языке

Подробнее:

Скачать:

 
Сверху