В пакете datasets есть некоторые наборы данных, с которыми мы будем работать. Давайте установим и подгрузим пакет.

# install.packages('datasets')
library(datasets)

Задание №1

Рассмотрим датасет trees.

data(trees)

Чтобы узнать о нем побольше, выспользуемся справкой.

?trees
  1. Посмотрите структуру данных и опишите какие типы переменных в нем присутствуют.
  2. Посмотрите на 15 первых элементов
  3. Выведите названия всех переменных и посмотрите на значение элементов 6-30 по всем переменным.
  4. Выведите описательные статистики по всем переменным
  5. Давайте перекодируем наши данные!
    • Cоздадим дамми-переменную для диаметра дерева: разделив выборку на две части, и зашифруем как TRUE, если диаметр больше среднего и FALSE, если меньше среднего и сохраним в новую переменную Wide_Tree
    • Cоздадим дамми-переменную для высоты дерева: разделив выборку на две части, и зашифруем как TRUE, если диаметр больше медианного значения и FALSE, если меньше него и сохраним в новую переменную Tall_Tree.
  6. Давайте посмотрим, сколько в каждой из категорий попало наблюдений.
  7. Выведем более подробные статистики для нашего датасета.
  8. А теперь посмотрим на статистики, разделив по подгруппам по переменной Wide_Tree.

Задание №2

А теперь рассмотрим датасет swiss.

data(swiss)

Чтобы узнать о нем побольше, выспользуемся справкой.

?swiss
  1. Посмотрим на структуру данных.
  2. Посмотрим на последние 3 элемента.
  3. Выведем статистики по всем переменным.
  4. Построим гистограммы распределения для детской смертности и для процента католиков в кантоне.
  5. Построим диаграмму рассеяния между образованием призывников и оценками за итоговую аттестацию призывников.
  6. Построим диаграмму рассеяния между процентом населения, занятого сельским хозяйством и образованием призывников.