Data Presentation with Pandas 1714994418

Бесплатный

Базовый уровень

SMART-курс

Доступно для сетевого взаимодействия

Уральский федеральный университет имени первого Президента России Б.Н. Ельцина (УрФУ)

Когда

Без срока

Длительность

10 часов

Формат обучения

Не указан

Документ об обучении

Сертификат Datalib

Не упустите возможность получить качественное образование по выгодной цене!

Курс предназначен для начинающих и будет особенно полезен тем, кто хочет освоить основы программирования и начать карьеру в IT-сфере.

Описание курса

The smart-course is intended for students of various fields who are faced with the tasks of data processing and analysis.

The course introduces the basic functionality of the Pandas library for loading, analyzing and processing a dataset.

The course also introduces the listener to data visualization methods that will help to visualize data and allow formulating basic hypotheses about the data.

Ответим на любой вопрос

Связанные дисциплины

Анализ данных

Визуализация данных

Технологии визуализации данных

Инструментальные средства анализа и визуализации данных

Введение в анализ данных

Компетенции, которые вы сможете освоить

Визуализация данных в личных и образовательных сферах

Анализ данных и обработка результатов с помощью цифровых инструментов

Работа в облачных хранилищах, онлайн-пакетах офисных приложениях

Содержание курса

3 месяца

65 часов теории, 74 часа практки

Модуль 1

In this lesson you will be able to deal with missing values in a DataFrame. During the study you will learn that we can simply remove corresponding column if there are a lot of missing values or we can fill missing values with either median or mode value, depending on the data type that is in the column.

In this lesson we learn how to analyze Information about DataFrame, identify and fix issues with decimal points in numerical values, as well as Remove Duplicates.

In this lesson you will be able to deal with missing values in a DataFrame. During the study you will learn that we can simply remove corresponding column if there are a lot of missing values or we can fill missing values with either median or mode value, depending on the data type that is in the column.

In this lesson we will learn how to add new features to DataFrame using existing columns. Also you will learn about mapping technique, which we can use to efficiently replace some string values with numerical values.

In this lesson we will learn how to navigate through our DataFrame using the indexation and how to select particular columns and/or rows, and how to perform sorting of our DataFrame. During the study you will learn how to sort DataFrame by values of some column and how to save DataFrame to a CSV file to open it in the future.

In this lesson we will learn about powerful technique called aggregation, which can be used to easily calculate quite complex statistics of your data. In particular the data aggregation methods using ".groupby()".

In this lesson we will get familiar with some basic visualization techniques which can be used with Pandas DataFrame. In particular built-in solutions for the boxplot and the histogram presentation.

In this lesson we'll get familiar with advanced visualization techniques using Seaborn library. Seaborn is a library for making variety of graphics in Python which is closely integrated with pandas data structures.

In this lesson we'll get familiar with interactive visualization techniques which can be used with Pandas DataFrame using Bokeh library. In the lesson we discuss the simple scatter plot, however students are encouraged to get familiar with other Bokeh visualizations.

This is a summary lesson.

Немного статистики

35%—45%

Снижение времени на обучение темы с помощью онлайн-курсов

15—25%

Увеличение скорости освоения материала

62,7%

Россиян когда-либо учились в онлайн-формате

* По результатам научных исследований за 2023 год

Узнайте больше

Курс cover

ФГАОУ ВО «Национальный исследовательский Томский политехнический университет»

Анализ и визуализация данных. Уровень Junior
Взаимодействие с участниками образовательной и научно-исследовательской деятельности во внутренних ИТ-системах образовательной организации (LMS, Moodle) Базовый уровень

Длительность: 23 часа


Бесплатно

Книги по теме курса

Откройте мир знаний!

Data Presentation with Pandas

Доступ к образовательным ресурсам предоставляется после входа в систему. Пожалуйста, авторизуйтесь, чтобы сохранять прогресс обучения и получать персонализированные рекомендации.

Авторизация

Используйте E-mail адрес, указанный вами при персональной регистрации или данные, предоставленные вашему учебному заведению для регистрации

    Еще нет учетной записи? Зарегистрироваться

    ;