Jak wyeksportować dane z R.
W tym samouczku dowiemy się, jak eksportować dane ze środowiska R do różnych formatów.
Aby wyeksportować dane na dysk twardy, potrzebujesz ścieżki pliku i rozszerzenia. Przede wszystkim ścieżka to lokalizacja, w której będą przechowywane dane. W tym samouczku zobaczysz, jak przechowywać dane na:
- Dysk twardy
- dysk Google
- Dropbox
Po drugie, R umożliwia użytkownikom eksportowanie danych do różnych typów plików. Obejmujemy podstawowe rozszerzenie pliku:
- csv
- xlsx
- RDS
- SAS
- SPSS
- STATA
Ogólnie nie jest trudno wyeksportować dane z R.
W tym samouczku nauczysz się:
- Eksportuj na dysk twardy
- Jak wyeksportować DataFrame do pliku CSV w R
- Jak wyeksportować dane z R do pliku Excel
- Eksportowanie danych z R do innego oprogramowania
- Eksportowanie danych z R do pliku SAS
- Jak wyeksportować dane z R do pliku STATA
- Interakcja z usługami w chmurze
- dysk Google
- Eksportuj do Dropbox
Eksportuj na dysk twardy
Na początek możesz zapisać dane bezpośrednio w katalogu roboczym. Poniższy kod wyświetla ścieżkę do katalogu roboczego:
directory <-getwd()directory
Wynik:
## [1] "/Users/15_Export_to_do"
Domyślnie plik zostanie zapisany w poniższej ścieżce.
W przypadku systemu Mac OS:
/Users/USERNAME/Downloads/
Dla Windowsa:
C:\Users\USERNAME\Documents\
Możesz oczywiście wyznaczyć inną ścieżkę. Na przykład możesz zmienić ścieżkę do folderu pobierania.
Utwórz ramkę danych
Przede wszystkim zaimportujmy zestaw danych mtcars i uzyskaj średnią mpg i pogrupujmy według biegów.
library(dplyr)df <-mtcars % > %select(mpg, disp, gear) % > %group_by(gear) % > %summarize(mean_mpg = mean(mpg), mean_disp = mean(disp))df
Dane wyjściowe ::
## # A tibble: 3 x 3## gear mean_mpg mean_disp##lt;dbl>## 1 3 16.10667 326.3000## 2 4 24.53333 123.0167## 3 5 21.38000 202.4800
Tabela zawiera trzy wiersze i trzy kolumny. Możesz utworzyć plik CSV za pomocą funkcji write.csv w języku R.
Jak wyeksportować DataFrame do pliku CSV w R
Podstawowa składnia write.csv w R, aby wyeksportować DataFrame do CSV w R:
write.csv(df, path)arguments-df: Dataset to save. Need to be the same name of the data frame in the environment.-path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory
Przykład:
write.csv(df, "table_car.csv")
Objaśnienie kodu
- write.csv (df, "table_car.csv"): Utwórz plik CSV na dysku twardym:
- df: nazwa ramki danych w środowisku
- "table_car.csv": Nazwij plik table_car i zapisz go jako csv
Uwaga : Możesz użyć funkcji write.csv w R jako write.csv2 (), aby oddzielić wiersze średnikiem w celu eksportu R do danych csv.
write.csv2(df, "table_car.csv")
Uwaga : wyłącznie do celów pedagogicznych stworzyliśmy funkcję o nazwie open_folder (), aby otworzyć dla Ciebie folder katalogu. Wystarczy uruchomić poniższy kod i zobaczyć, gdzie jest przechowywany plik csv. Powinieneś zobaczyć plik o nazwach table_car.csv dla eksportu danych R do csv.
# Run this code to create the functionopen_folder <-function(dir){if (.Platform['OS.type'] == "windows"){shell.exec(dir)} else {system(paste(Sys.getenv("R_BROWSER"), dir))}}# Call the function to open the folderopen_folder(directory)
Jak wyeksportować dane z R do pliku Excel
Teraz nauczymy się, jak eksportować dane z R do Excela:
Eksport danych z R do Excela jest trywialny dla użytkowników Windows i trudniejszy dla użytkowników Mac OS. Obaj użytkownicy będą używać biblioteki xlsx do tworzenia pliku Excel. Niewielka różnica wynika z instalacji biblioteki. Rzeczywiście, biblioteka xlsx używa języka Java do tworzenia pliku. Java musi być zainstalowana, jeśli nie jest obecna na komputerze, aby wyeksportować dane R do programu Excel.
Użytkownicy systemu Windows
Jeśli jesteś użytkownikiem systemu Windows, możesz zainstalować bibliotekę bezpośrednio z conda, aby wyeksportować Dataframe do programu Excel R:
conda install -c r r-xlsx
Po zainstalowaniu biblioteki możesz użyć funkcji write.xlsx (). W katalogu roboczym tworzony jest nowy skoroszyt programu Excel do eksportu R do danych programu Excel
library(xlsx)write.xlsx(df, "table_car.xlsx")
Jeśli jesteś użytkownikiem systemu Mac OS, musisz wykonać następujące czynności:
- Krok 1: Zainstaluj najnowszą wersję oprogramowania Java
- Krok 2: Zainstaluj bibliotekę rJava
- Krok 3: Zainstaluj bibliotekę xlsx
Krok 1) Możesz pobrać Javę z oficjalnej strony Oracle i zainstalować ją.
Możesz wrócić do Rstudio i sprawdzić, która wersja Java jest zainstalowana.
system("java -version")
W czasie trwania samouczka najnowsza wersja Java to 9.0.4.
Krok 2) Musisz zainstalować rjava w R. Zalecamy zainstalowanie R i Rstudio z Anacondą. Anaconda zarządza zależnościami między bibliotekami. W tym sensie Anaconda zajmie się zawiłościami instalacji rJava.
Przede wszystkim musisz zaktualizować condę, a następnie zainstalować bibliotekę. Możesz skopiować i wkleić następne dwa wiersze kodu w terminalu.
conda - conda updateconda install -c r r-rjava
Następnie otwórz rjava w Rstudio
library(rJava)
Krok 3) Wreszcie nadszedł czas, aby zainstalować xlsx. Po raz kolejny możesz to zrobić za pomocą conda:
conda install -c r r-xlsx
Podobnie jak użytkownicy systemu Windows, możesz zapisywać dane za pomocą funkcji write.xlsx ()
library(xlsx)
Wynik:
## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")
Eksportowanie danych z R do innego oprogramowania
Eksportowanie danych do innego oprogramowania jest tak proste, jak ich importowanie. Biblioteka „przystań” zapewnia wygodny sposób eksportowania danych do plików
- spss
- sas
- stata
Przede wszystkim zaimportuj bibliotekę. Jeśli nie masz „przystani”, możesz przejść tutaj, aby ją zainstalować.
library(haven)
Plik SPSS
Poniżej znajduje się kod do eksportu danych do oprogramowania SPSS:
write_sav(df, "table_car.sav")
Eksportowanie danych z R do pliku SAS
Tak proste, jak spss, możesz eksportować do sas
write_sas(df, "table_car.sas7bdat")
Jak wyeksportować dane z R do pliku STATA
Wreszcie biblioteka Haven pozwala na zapisywanie plików .dta.
write_dta(df, "table_car.dta")
R
Jeśli chcesz zapisać ramkę danych lub dowolny inny obiekt R, możesz użyć funkcji save ().
save(df, file ='table_car.RData')
Możesz sprawdzić pliki utworzone powyżej w obecnym katalogu roboczym
Interakcja z usługami w chmurze
Wreszcie, R jest wyposażony w fantastyczne biblioteki do interakcji z usługami przetwarzania w chmurze. Ostatnia część tego samouczka dotyczy eksportu / importu plików z:
- dysk Google
- Dropbox
Uwaga : ta część samouczka zakłada, że masz konto w Google i Dropbox. Jeśli nie, możesz szybko je utworzyć dla - Dysk Google: https://accounts.google.com/SignUp?hl=en - Dropbox: https://www.dropbox.com/h
dysk Google
Aby uzyskać dostęp do funkcji umożliwiającej interakcję z Dyskiem Google, musisz zainstalować bibliotekę googledrive.
Biblioteka nie jest jeszcze dostępna w Anaconda. Możesz go zainstalować za pomocą poniższego kodu w konsoli.
install.packages("googledrive")
i otwierasz bibliotekę.
library(googledrive)
Dla użytkownika non-conda instalacja biblioteki jest łatwa, możesz użyć funkcji install.packages ('NAZWA PAKIETU) z nazwą pakietu w nawiasach. Nie zapomnij o znaku „”. Zauważ, że R powinien automatycznie zainstalować pakiet w `libPaths (). Warto zobaczyć to w akcji.
Prześlij na Dysk Google
Aby przesłać plik na dysk Google, musisz użyć funkcji drive_upload ().
Za każdym razem, gdy ponownie uruchomisz Rstudio, zostaniesz poproszony o zezwolenie na dostęp do Tidyverse do Dysku Google.
Podstawowa składnia drive_upload () to
drive_upload(file, path = NULL, name = NULL)arguments:- file: Full name of the file to upload (i.e., including the extension)- path: Location of the file- name: You can rename it as you wish. By default, it is the local name.
Po uruchomieniu kodu musisz potwierdzić kilka pytań
drive_upload%<("table_car.csv", name ="table_car")
Wynik:
## Local file:## * table_car.csv## uploaded into Drive file:## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk## with MIME type:## * text/csv
W konsoli wpisujesz 1, aby potwierdzić dostęp
Następnie zostaniesz przekierowany do Google API, aby zezwolić na dostęp. Kliknij Zezwól.
Po zakończeniu uwierzytelniania możesz zamknąć przeglądarkę.
W konsoli Rstudio możesz zobaczyć podsumowanie wykonanego kroku. Google pomyślnie przesłał plik znajdujący się lokalnie na Dysku. Firma Google przypisała identyfikator do każdego pliku na dysku.
Możesz zobaczyć ten plik w arkuszu kalkulacyjnym Google.
drive_browse("table_car")
Wynik:
Nastąpi przekierowanie do arkusza kalkulacyjnego Google
Importuj z Dysku Google
Prześlij plik z Dysku Google z identyfikatorem jest wygodny. Jeśli znasz nazwę pliku, możesz uzyskać jego identyfikator w następujący sposób:
Uwaga : w zależności od połączenia internetowego i rozmiaru Dysku może to zająć trochę czasu.
x <-drive_get("table_car")as_id(x)
Zapisałeś ID w zmiennej x. Funkcja drive_download () umożliwia pobranie pliku z Dysku Google.
Podstawowa składnia to:
drive_download(file, path = NULL, overwrite = FALSE)arguments:- file: Name or id of the file to download-path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive-overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.
Możesz wreszcie pobrać plik:
download_google & lt; - drive_download(as_id(x), overwrite = TRUE)
Objaśnienie kodu
- drive_download (): funkcja pobierania pliku z Dysku Google
- as_id (x): użyj identyfikatora, aby przeglądać plik na Dysku Google
- overwrite = TRUE: Jeśli plik istnieje, nadpisz go, w przeciwnym razie wykonanie zatrzymane Aby zobaczyć nazwę pliku lokalnie, możesz użyć:
Wynik:
Plik jest przechowywany w katalogu roboczym. Pamiętaj, że musisz dodać rozszerzenie pliku, aby otworzyć go w R. Możesz utworzyć pełną nazwę za pomocą funkcji paste () (np. Table_car.csv)
google_file <-download_google$local_pathgoogle_filepath <-paste(google_file, ".csv", sep = "")google_table_car <-read.csv(path)google_table_car
Wynik:
## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800
Na koniec możesz usunąć plik z dysku Google.
## remove filedrive_find("table_car") %>%drive_rm()
Wynik:
To powolny proces. Usunięcie zajmuje trochę czasu
Eksportuj do Dropbox
R współpracuje z Dropbox za pośrednictwem biblioteki rdrop2. Biblioteka nie jest również dostępna w Anaconda. Możesz go zainstalować za pomocą konsoli
install.packages('rdrop2')
library(rdrop2)
Musisz zapewnić tymczasowy dostęp do Dropbox za pomocą swoich poświadczeń. Po zakończeniu identyfikacji R może tworzyć, usuwać przesyłanie i pobieranie do Twojego Dropbox.
Przede wszystkim musisz przyznać dostęp do swojego konta. Poświadczenia są zapisywane w pamięci podręcznej podczas całej sesji.
drop_auth()
Zostaniesz przekierowany do Dropbox, aby potwierdzić uwierzytelnienie.
Otrzymasz stronę z potwierdzeniem. Możesz je zamknąć i wrócić do R.
Możesz utworzyć folder za pomocą funkcji drop_create ().
- drop_create ('my_first_drop'): Utwórz folder w pierwszej gałęzi Dropbox
- drop_create ('First_branch / my_first_drop'): Utwórz folder w istniejącym folderze First_branch.
drop_create('my_first_drop')
Wynik:
W DropBox
Aby przesłać plik .csv do Twojego Dropbox, użyj funkcji drop_upload ().
Podstawowa składnia:
drop_upload(file, path = NULL, mode = "overwrite")arguments:- file: local path- path: Path on Dropbox- mode = "overwrite": By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")
Wynik:
W DropBox
Możesz odczytać plik csv z Dropbox za pomocą funkcji drop_read_csv ()
dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv")dropbox_table_car
Wynik:
## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800
Kiedy skończysz używać pliku i chcesz go usunąć. Musisz wpisać ścieżkę do pliku w funkcji drop_delete ()
drop_delete('my_first_drop/table_car.csv')
Wynik:
Możliwe jest również usunięcie folderu
drop_delete('my_first_drop')
Wynik:
Podsumowanie
Wszystkie funkcje możemy podsumować w poniższej tabeli
Biblioteka |
Cel |
Funkcjonować |
---|---|---|
baza |
Eksportuj plik csv |
write.csv () |
xlsx |
Eksport excel |
write.xlsx () |
przystań |
Eksportuj spss |
write_sav () |
przystań |
Export sas |
write_sas () |
przystań |
Eksportuj stata |
write_dta () |
baza |
Export R |
zapisać() |
dysk Google |
Prześlij Dysk Google |
drive_upload () |
dysk Google |
Otwórz na Dysku Google |
drive_browse () |
dysk Google |
Pobierz identyfikator pliku |
drive_get (as_id ()) |
dysk Google |
Pobierz z Dysku Google |
download_google () |
dysk Google |
Usuń plik z Dysku Google |
drive_rm () |
rdrop2 |
Uwierzytelnienie |
drop_auth () |
rdrop2 |
Utwórz folder |
drop_create () |
rdrop2 |
Prześlij do Dropbox |
drop_upload () |
rdrop2 |
Przeczytaj plik CSV z Dropbox |
drop_read_csv |
rdrop2 |
Usuń plik z Dropbox |
drop_delete () |