Работа в RStudio

Логотип RStudio

Редактирование и выполнение кода

Общая информация

Редактор кода RStudio включает ряд возможностей для продуктивной работы, в частности подсветку кода, автоматическое завершение кода, одновременное редактирование нескольких файлов, поиск и замену определенных частей кода.

Кроме того, в RStudio имеются гибкие возможности по выполнению кода непосредственно из окна редактора. Для многих аналитиков именно RStudio является предпочтительным способом работы с R. Выполнение команд из окна Редактора кода вместо командной строки Консоли облегчает воспроизведение одних и тех же команд и позволяет “упаковать” такие команды в одну функцию для последующего использования.

Интерфейс RStudio

На картинке выше, показан общий интерфейс RStudio, как мы видим, среда разделена на 4 панели:

Панель консоли (Console)
В панели консоли можно давать команды и сразу получать результат. Такой стиль работы называется работа в интерактивном режиме. Режим интерактивен потому, что происходит как бы диалог пользователя с системой R.

Панель редактора кода
В панели редактора кода можно вводить целые программы, работа здесь не особо отличается от работы в обычном текстовом редакторе. Можно в консоли пробовать куски кода и потом переносить их в редактор. Можно наоборот фрагменты кода из редактора пробовать проиграть в консоли.

Вспомогательная панель 1
Здесь можно наблюдать за значениями переменных. Что такое переменные и как работать с этой панелью мы рассмотрим позже.

Вспомогательная панель 2
Здесь можно работать с папками и файлами, справкой, графиками и пакетами. Обо всём этом вы можете узнать из цикла статей на нашем сайте.

Создание нового файла

Для создания нового файла используйте меню File -> New:

Для открытия существующего файла необходимо воспользоваться меню File -> Open или Open Recent (для открытия файла, с которым работа осуществлялась недавно). Если открыто несколько файлов одновременно, быстрый переход от одного документа к другому выполняется при помощи соответствующих закладок в верхней части окна редактора кода.

Для навигация между большим количеством открытых файлов служит  иконка  >>  в правой верхней части окна Редактора; можно также воспользоваться меню View -> Switch to.

Поиск и замена частей кода

В Редакторе кода RStudio имеется возможность найти и заменить необходимые части текста. Для выполнения этой операции необходимо воспользоваться сочетанием клавиш Ctrl+F или разделом меню Edit -> Replace and Find . В верхней части окна редактора имеется кнопка в виде увеличительного стекла — ее нажатие также приводит к открытию диалогового окна, в котором задаются параметры поиска.

Выполнение кода

RStudio поддерживает выполнение кода непосредственно из окна Редактора (выполняемые команды посылаются в Консоль, где появляется также результат их выполнения).

Для выполнения текущей строки кода можно воспользоваться сочетанием клавиш Ctrl+Enter или кнопкой Run Line(s), расположенной в верхней части окна Редактора:

После выполнения кода курсор автоматически перейдет на следующую строку. Такой механизм обеспечивает возможность пошагового выполнения команд.

Имеются две возможности для одновременного выполнения нескольких строк кода:

  • Выделить необходимые строки и нажать клавиши Ctrl+Enter (или воспользоваться кнопкой Run Line(s), расположенной в верхней части окна Редактора);
  • Нажать Ctrl+Shift+Enter для выполнения всех строк, имеющихся в скрипте.

R Markdown

Но в рамках наших курсов мы будем просто создавать новые файлы в формате .Rmd в любом удобном месте, это может быть как непосредственно на диске вашего компьютера так и на сетевом диске.

Для этого нам потребуется перейти File -> New file -> R Markdown :

Далее называем проект(название файла может отличаться!!! см. ниже), указываем авторство данного проекта и в качестве выводимого формата данных выбираем Word для упрощенной генерации в формат .docx (можно также вызвать html или pdf на ваше усмотрение):

После нажатия OK мы получим следующий файл:

Обратите внимание что данный проект еще не сохранен на вашем компьютере, нажмите на значек дискеты или нажмите Ctrl + S после чего назовите его и выберете удобное место для проекта, но помните что исходные файлы с данными(например в формате .csv) и данный файл должны лежать в одной папке.

Чтение файлов из Excel

Самой базовой задачей для языка R является считывание файлов для дальнейшего анализа. Давайте разберемся какой формат данных мы можем считать и какой формат лучше.

Как правило для работы с таблицами используют Excel, который уже способен сохранить наши таблицы в формат xls, xlsx, csv.

Файлы csv содержат простой текст как ряд значений (ячеек), разделенных запятыми (,) в ряду строк. Фактически вы можете открыть csv-файл в текстовом редакторе и прочитать его самостоятельно.

xls и xlsx – это рабочие книги Excel, в которых содержится информация обо всех листах рабочей книги, включающая как контент, так и форматирование (маскирование номеров, раскраска, условное форматирование и т.д.), А также может хранить дополнительные изображения, такие как диаграммы и изображения. xls файлы могут быть созданы и прочитаны только приложениями, которые были специально написаны для чтения такого формата.

Таким образом, в рамках работы в RStudio, для нас удобнее формат csv, поскольку он легче, универсальнее и содержит в себе только необходимые для RStudio данные.

Давайте сохраним небольшую таблицу в формате csv. Для этого достаточно открыть в программе Excel уже существующую таблицу с данными или создать новую, после чего пройти в File -> Save As -> Browse и в выпадающем списке выберете формат csv.

Скачайте наш тестовый пример данных в формате csv и наш тестовый скрипт который считывает эти данные и выводит общую статистику по ним.

Сохраните оба файла в одной папке в любом удобном для вас месте. После чего откройте файл test_smdlab.Rmd в RStudio, пользуясь инструкцией выше. Вы должны увидеть следующее окно:

Теперь запустим данный код нажав на Ctrl + Alt + R или пройдя по выпаюащему списку Run и выбрав Run All:

В результате вы должны увидеть следующий результат работы нашего кода:

Поздравляем, вы только что успешно загрузили ваши данные в RStudio и они полностью готовы к дальнейшему анализу. А об этом вы сможете прочитать из цикла наших статей на сайте smdlab.ru.

Leave a Reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>