Eksportowanie danych z R: Jak eksportować dane z R do CSV, Excel

Spisie treści:

Anonim

Jak wyeksportować dane z R.

W tym samouczku dowiemy się, jak eksportować dane ze środowiska R do różnych formatów.

Aby wyeksportować dane na dysk twardy, potrzebujesz ścieżki pliku i rozszerzenia. Przede wszystkim ścieżka to lokalizacja, w której będą przechowywane dane. W tym samouczku zobaczysz, jak przechowywać dane na:

  • Dysk twardy
  • dysk Google
  • Dropbox

Po drugie, R umożliwia użytkownikom eksportowanie danych do różnych typów plików. Obejmujemy podstawowe rozszerzenie pliku:

  • csv
  • xlsx
  • RDS
  • SAS
  • SPSS
  • STATA

Ogólnie nie jest trudno wyeksportować dane z R.

W tym samouczku nauczysz się:

  • Eksportuj na dysk twardy
  • Jak wyeksportować DataFrame do pliku CSV w R
  • Jak wyeksportować dane z R do pliku Excel
  • Eksportowanie danych z R do innego oprogramowania
  • Eksportowanie danych z R do pliku SAS
  • Jak wyeksportować dane z R do pliku STATA
  • Interakcja z usługami w chmurze
  • dysk Google
  • Eksportuj do Dropbox

Eksportuj na dysk twardy

Na początek możesz zapisać dane bezpośrednio w katalogu roboczym. Poniższy kod wyświetla ścieżkę do katalogu roboczego:

directory <-getwd()directory

Wynik:

## [1] "/Users/15_Export_to_do" 

Domyślnie plik zostanie zapisany w poniższej ścieżce.

W przypadku systemu Mac OS:

/Users/USERNAME/Downloads/ 

Dla Windowsa:

C:\Users\USERNAME\Documents\

Możesz oczywiście wyznaczyć inną ścieżkę. Na przykład możesz zmienić ścieżkę do folderu pobierania.

Utwórz ramkę danych

Przede wszystkim zaimportujmy zestaw danych mtcars i uzyskaj średnią mpg i pogrupujmy według biegów.

library(dplyr)df <-mtcars % > %select(mpg, disp, gear) % > %group_by(gear) % > %summarize(mean_mpg = mean(mpg), mean_disp = mean(disp))df

Dane wyjściowe ::

## # A tibble: 3 x 3## gear mean_mpg mean_disp##   lt;dbl>## 1 3 16.10667 326.3000## 2 4 24.53333 123.0167## 3 5 21.38000 202.4800

Tabela zawiera trzy wiersze i trzy kolumny. Możesz utworzyć plik CSV za pomocą funkcji write.csv w języku R.

Jak wyeksportować DataFrame do pliku CSV w R

Podstawowa składnia write.csv w R, aby wyeksportować DataFrame do CSV w R:

write.csv(df, path)arguments-df: Dataset to save. Need to be the same name of the data frame in the environment.-path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory

Przykład:

write.csv(df, "table_car.csv")

Objaśnienie kodu

  • write.csv (df, "table_car.csv"): Utwórz plik CSV na dysku twardym:
    • df: nazwa ramki danych w środowisku
    • "table_car.csv": Nazwij plik table_car i zapisz go jako csv

Uwaga : Możesz użyć funkcji write.csv w R jako write.csv2 (), aby oddzielić wiersze średnikiem w celu eksportu R do danych csv.

write.csv2(df, "table_car.csv")

Uwaga : wyłącznie do celów pedagogicznych stworzyliśmy funkcję o nazwie open_folder (), aby otworzyć dla Ciebie folder katalogu. Wystarczy uruchomić poniższy kod i zobaczyć, gdzie jest przechowywany plik csv. Powinieneś zobaczyć plik o nazwach table_car.csv dla eksportu danych R do csv.

# Run this code to create the functionopen_folder <-function(dir){if (.Platform['OS.type'] == "windows"){shell.exec(dir)} else {system(paste(Sys.getenv("R_BROWSER"), dir))}}# Call the function to open the folderopen_folder(directory)

Jak wyeksportować dane z R do pliku Excel

Teraz nauczymy się, jak eksportować dane z R do Excela:

Eksport danych z R do Excela jest trywialny dla użytkowników Windows i trudniejszy dla użytkowników Mac OS. Obaj użytkownicy będą używać biblioteki xlsx do tworzenia pliku Excel. Niewielka różnica wynika z instalacji biblioteki. Rzeczywiście, biblioteka xlsx używa języka Java do tworzenia pliku. Java musi być zainstalowana, jeśli nie jest obecna na komputerze, aby wyeksportować dane R do programu Excel.

Użytkownicy systemu Windows

Jeśli jesteś użytkownikiem systemu Windows, możesz zainstalować bibliotekę bezpośrednio z conda, aby wyeksportować Dataframe do programu Excel R:

conda install -c r r-xlsx

Po zainstalowaniu biblioteki możesz użyć funkcji write.xlsx (). W katalogu roboczym tworzony jest nowy skoroszyt programu Excel do eksportu R do danych programu Excel

library(xlsx)write.xlsx(df, "table_car.xlsx")

Jeśli jesteś użytkownikiem systemu Mac OS, musisz wykonać następujące czynności:

  • Krok 1: Zainstaluj najnowszą wersję oprogramowania Java
  • Krok 2: Zainstaluj bibliotekę rJava
  • Krok 3: Zainstaluj bibliotekę xlsx

Krok 1) Możesz pobrać Javę z oficjalnej strony Oracle i zainstalować ją.

Możesz wrócić do Rstudio i sprawdzić, która wersja Java jest zainstalowana.

system("java -version")

W czasie trwania samouczka najnowsza wersja Java to 9.0.4.

Krok 2) Musisz zainstalować rjava w R. Zalecamy zainstalowanie R i Rstudio z Anacondą. Anaconda zarządza zależnościami między bibliotekami. W tym sensie Anaconda zajmie się zawiłościami instalacji rJava.

Przede wszystkim musisz zaktualizować condę, a następnie zainstalować bibliotekę. Możesz skopiować i wkleić następne dwa wiersze kodu w terminalu.

conda - conda updateconda install -c r r-rjava

Następnie otwórz rjava w Rstudio

library(rJava)

Krok 3) Wreszcie nadszedł czas, aby zainstalować xlsx. Po raz kolejny możesz to zrobić za pomocą conda:

conda install -c r r-xlsx

Podobnie jak użytkownicy systemu Windows, możesz zapisywać dane za pomocą funkcji write.xlsx ()

library(xlsx)

Wynik:

## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")

Eksportowanie danych z R do innego oprogramowania

Eksportowanie danych do innego oprogramowania jest tak proste, jak ich importowanie. Biblioteka „przystań” zapewnia wygodny sposób eksportowania danych do plików

  • spss
  • sas
  • stata

Przede wszystkim zaimportuj bibliotekę. Jeśli nie masz „przystani”, możesz przejść tutaj, aby ją zainstalować.

library(haven) 

Plik SPSS

Poniżej znajduje się kod do eksportu danych do oprogramowania SPSS:

write_sav(df, "table_car.sav") 

Eksportowanie danych z R do pliku SAS

Tak proste, jak spss, możesz eksportować do sas

write_sas(df, "table_car.sas7bdat")

Jak wyeksportować dane z R do pliku STATA

Wreszcie biblioteka Haven pozwala na zapisywanie plików .dta.

write_dta(df, "table_car.dta")

R

Jeśli chcesz zapisać ramkę danych lub dowolny inny obiekt R, możesz użyć funkcji save ().

save(df, file ='table_car.RData')

Możesz sprawdzić pliki utworzone powyżej w obecnym katalogu roboczym

Interakcja z usługami w chmurze

Wreszcie, R jest wyposażony w fantastyczne biblioteki do interakcji z usługami przetwarzania w chmurze. Ostatnia część tego samouczka dotyczy eksportu / importu plików z:

  • dysk Google
  • Dropbox

Uwaga : ta część samouczka zakłada, że ​​masz konto w Google i Dropbox. Jeśli nie, możesz szybko je utworzyć dla - Dysk Google: https://accounts.google.com/SignUp?hl=en - Dropbox: https://www.dropbox.com/h

dysk Google

Aby uzyskać dostęp do funkcji umożliwiającej interakcję z Dyskiem Google, musisz zainstalować bibliotekę googledrive.

Biblioteka nie jest jeszcze dostępna w Anaconda. Możesz go zainstalować za pomocą poniższego kodu w konsoli.

install.packages("googledrive") 

i otwierasz bibliotekę.

library(googledrive)

Dla użytkownika non-conda instalacja biblioteki jest łatwa, możesz użyć funkcji install.packages ('NAZWA PAKIETU) z nazwą pakietu w nawiasach. Nie zapomnij o znaku „”. Zauważ, że R powinien automatycznie zainstalować pakiet w `libPaths (). Warto zobaczyć to w akcji.

Prześlij na Dysk Google

Aby przesłać plik na dysk Google, musisz użyć funkcji drive_upload ().

Za każdym razem, gdy ponownie uruchomisz Rstudio, zostaniesz poproszony o zezwolenie na dostęp do Tidyverse do Dysku Google.

Podstawowa składnia drive_upload () to

drive_upload(file, path = NULL, name = NULL)arguments:- file: Full name of the file to upload (i.e., including the extension)- path: Location of the file- name: You can rename it as you wish. By default, it is the local name. 

Po uruchomieniu kodu musisz potwierdzić kilka pytań

drive_upload%<("table_car.csv", name ="table_car")

Wynik:

## Local file:## * table_car.csv## uploaded into Drive file:## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk## with MIME type:## * text/csv

W konsoli wpisujesz 1, aby potwierdzić dostęp

Następnie zostaniesz przekierowany do Google API, aby zezwolić na dostęp. Kliknij Zezwól.

Po zakończeniu uwierzytelniania możesz zamknąć przeglądarkę.

W konsoli Rstudio możesz zobaczyć podsumowanie wykonanego kroku. Google pomyślnie przesłał plik znajdujący się lokalnie na Dysku. Firma Google przypisała identyfikator do każdego pliku na dysku.

Możesz zobaczyć ten plik w arkuszu kalkulacyjnym Google.

drive_browse("table_car")

Wynik:

Nastąpi przekierowanie do arkusza kalkulacyjnego Google

Importuj z Dysku Google

Prześlij plik z Dysku Google z identyfikatorem jest wygodny. Jeśli znasz nazwę pliku, możesz uzyskać jego identyfikator w następujący sposób:

Uwaga : w zależności od połączenia internetowego i rozmiaru Dysku może to zająć trochę czasu.

x <-drive_get("table_car")as_id(x)

Zapisałeś ID w zmiennej x. Funkcja drive_download () umożliwia pobranie pliku z Dysku Google.

Podstawowa składnia to:

drive_download(file, path = NULL, overwrite = FALSE)arguments:- file: Name or id of the file to download-path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive-overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.

Możesz wreszcie pobrać plik:

download_google & lt; - drive_download(as_id(x), overwrite = TRUE)

Objaśnienie kodu

  • drive_download (): funkcja pobierania pliku z Dysku Google
  • as_id (x): użyj identyfikatora, aby przeglądać plik na Dysku Google
  • overwrite = TRUE: Jeśli plik istnieje, nadpisz go, w przeciwnym razie wykonanie zatrzymane Aby zobaczyć nazwę pliku lokalnie, możesz użyć:

Wynik:

Plik jest przechowywany w katalogu roboczym. Pamiętaj, że musisz dodać rozszerzenie pliku, aby otworzyć go w R. Możesz utworzyć pełną nazwę za pomocą funkcji paste () (np. Table_car.csv)

google_file <-download_google$local_pathgoogle_filepath <-paste(google_file, ".csv", sep = "")google_table_car <-read.csv(path)google_table_car

Wynik:

## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800

Na koniec możesz usunąć plik z dysku Google.

## remove filedrive_find("table_car") %>%drive_rm()

Wynik:

To powolny proces. Usunięcie zajmuje trochę czasu

Eksportuj do Dropbox

R współpracuje z Dropbox za pośrednictwem biblioteki rdrop2. Biblioteka nie jest również dostępna w Anaconda. Możesz go zainstalować za pomocą konsoli

install.packages('rdrop2')
library(rdrop2)

Musisz zapewnić tymczasowy dostęp do Dropbox za pomocą swoich poświadczeń. Po zakończeniu identyfikacji R może tworzyć, usuwać przesyłanie i pobieranie do Twojego Dropbox.

Przede wszystkim musisz przyznać dostęp do swojego konta. Poświadczenia są zapisywane w pamięci podręcznej podczas całej sesji.

drop_auth()

Zostaniesz przekierowany do Dropbox, aby potwierdzić uwierzytelnienie.

Otrzymasz stronę z potwierdzeniem. Możesz je zamknąć i wrócić do R.

Możesz utworzyć folder za pomocą funkcji drop_create ().

  • drop_create ('my_first_drop'): Utwórz folder w pierwszej gałęzi Dropbox
  • drop_create ('First_branch / my_first_drop'): Utwórz folder w istniejącym folderze First_branch.
drop_create('my_first_drop')

Wynik:

W DropBox

Aby przesłać plik .csv do Twojego Dropbox, użyj funkcji drop_upload ().

Podstawowa składnia:

drop_upload(file, path = NULL, mode = "overwrite")arguments:- file: local path- path: Path on Dropbox- mode = "overwrite": By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")

Wynik:

W DropBox

Możesz odczytać plik csv z Dropbox za pomocą funkcji drop_read_csv ()

dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv")dropbox_table_car

Wynik:

## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800

Kiedy skończysz używać pliku i chcesz go usunąć. Musisz wpisać ścieżkę do pliku w funkcji drop_delete ()

drop_delete('my_first_drop/table_car.csv')

Wynik:

Możliwe jest również usunięcie folderu

drop_delete('my_first_drop')

Wynik:

Podsumowanie

Wszystkie funkcje możemy podsumować w poniższej tabeli

Biblioteka

Cel

Funkcjonować

baza

Eksportuj plik csv

write.csv ()

xlsx

Eksport excel

write.xlsx ()

przystań

Eksportuj spss

write_sav ()

przystań

Export sas

write_sas ()

przystań

Eksportuj stata

write_dta ()

baza

Export R

zapisać()

dysk Google

Prześlij Dysk Google

drive_upload ()

dysk Google

Otwórz na Dysku Google

drive_browse ()

dysk Google

Pobierz identyfikator pliku

drive_get (as_id ())

dysk Google

Pobierz z Dysku Google

download_google ()

dysk Google

Usuń plik z Dysku Google

drive_rm ()

rdrop2

Uwierzytelnienie

drop_auth ()

rdrop2

Utwórz folder

drop_create ()

rdrop2

Prześlij do Dropbox

drop_upload ()

rdrop2

Przeczytaj plik CSV z Dropbox

drop_read_csv

rdrop2

Usuń plik z Dropbox

drop_delete ()