Введение в tidyverse. Семинар 3.
Якушов В.Д.2024-02-27
На предыдущих семинарах, среди прочего, мы разобрались с основными командами пакета dplyr, позволяющими манипулировать табличными данными: отбирать столбцы, переименовывать их, делать преобразования, группировку, соединять таблицы по ключу и т.д. Команды были довольно незамысловатыми и позволяли управлять либо единичными столбцами, либо подчиняющимися одному простому принципу (например, идущие подряд). Но на практике могут возникать ситуации, когда размер анализируемого датасета слишком велик, а перечисление нужных столбцов может привести к чрезмерному замусориванию кода, особенно если возникает необходимость применить сразу несколько параллельных преобразований к каждому из них. К счастью, в tidyverse есть элегантное решение этой проблемы, с которым мы познакомимся на семинаре. Материал рассчитан на начинающих пользователей R.
Презентация недоступна
Ссылка на запись семинара
Введение в tidyverse. Занятие 2.
Якушов В.Д.2023-12-19
На семинаре мы продолжим разговор о возможностях tidyverse и о создании собственных функций в R. Примерный план:
1. Введение в циклы и условия.
2. Конвертация таблиц из «широкого» в «длинный» формат и наоборот.
3. Объединение таблиц по ключевому столбцу.
4. Построение графиков в ggplot2: индивидуальные и глобальные geoms, настройка внешнего вида.
5. Поговорим о том, что еще полезного, кроме dplyr и ggplot2, есть в tidyverse.
Презентация недоступна
Ссылка на запись семинара
Введение в tidyverse. Занятие 1.
Якушов В.Д.2023-11-28
R можно использовать не только для построения моделей и вычисления статистик, но и для многого другого, в том числе визуализации и предобработки массивов данных. Со этими задачами R справляется гораздо лучше часто используемого (особенно при предобработке) Excel.
На семинаре будет предпринята попытка знакомства с некоторыми пакетами системы tidyverse, а также будут рассмотрены некоторые способы организации рабочего процесса, предотвращающие потерю файлов и путаницу.
План семинара:
1. Организация хранения файлов
2. Структура скрипта
3. Базовые предобработка табличных данных с помощью dplyr, пайпы.
4. Построение базового графика в ggplot2
5. Написание простых собственных функций для повторяющихся действий.
Материал рассчитан на начинающих пользователей R, имеющих минимальные базовые знания (понятие о переменной, загрузка библиотек, типы данных в R).
Презентация недоступна
Ссылка на запись семинара