Gegevens exporteren uit R
In deze zelfstudie leren we hoe we gegevens van de R-omgeving naar verschillende indelingen kunnen exporteren.
Om gegevens naar de harde schijf te exporteren, hebt u het bestandspad en een extensie nodig. Allereerst is het pad de locatie waar de gegevens worden opgeslagen. In deze tutorial leert u hoe u gegevens opslaat op:
- De harde schijf
- Google Drive
- Dropbox
Ten tweede stelt R de gebruikers in staat om de gegevens naar verschillende soorten bestanden te exporteren. We behandelen de extensie van het essentiële bestand:
- csv
- xlsx
- RDS
- SAS
- SPSS
- STATA
Over het algemeen is het niet moeilijk om gegevens uit R.
In deze tutorial leer je-
- Exporteren naar harde schijf
- Hoe u een dataframe exporteert naar een CSV-bestand in R.
- Gegevens exporteren van R naar Excel-bestand
- Gegevens exporteren van R naar verschillende software
- Gegevens exporteren van R naar SAS-bestand
- Gegevens exporteren van R naar STATA-bestand
- Communiceer met de Cloud Services
- Google Drive
- Exporteren naar Dropbox
Exporteren naar harde schijf
Om te beginnen kunt u de gegevens rechtstreeks in de werkmap opslaan. De volgende code drukt het pad van uw werkmap af:
directory <-getwd()directory
Uitgang:
## [1] "/Users/15_Export_to_do"
Standaard wordt het bestand opgeslagen in het onderstaande pad.
Voor Mac OS:
/Users/USERNAME/Downloads/
Voor ramen:
C:\Users\USERNAME\Documents\
U kunt natuurlijk een ander pad instellen. U kunt bijvoorbeeld het pad naar de downloadmap wijzigen.
Maak een dataframe
Laten we allereerst de mtcars-gegevensset importeren en het gemiddelde van mpg en disp gegroepeerd krijgen op versnelling.
library(dplyr)df <-mtcars % > %select(mpg, disp, gear) % > %group_by(gear) % > %summarize(mean_mpg = mean(mpg), mean_disp = mean(disp))df
Uitgang ::
## # A tibble: 3 x 3## gear mean_mpg mean_disp##lt;dbl>## 1 3 16.10667 326.3000## 2 4 24.53333 123.0167## 3 5 21.38000 202.4800
De tabel bevat drie rijen en drie kolommen. U kunt een CSV-bestand maken met de functie write.csv in R.
Hoe u een dataframe exporteert naar een CSV-bestand in R.
De basissyntaxis van write.csv in R om het DataFrame naar CSV in R te exporteren:
write.csv(df, path)arguments-df: Dataset to save. Need to be the same name of the data frame in the environment.-path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory
Voorbeeld:
write.csv(df, "table_car.csv")
Code Verklaring
- write.csv (df, "table_car.csv"): Maak een CSV-bestand op de harde schijf:
- df: naam van het dataframe in de omgeving
- "table_car.csv": Noem het bestand table_car en sla het op als csv
Opmerking : u kunt de functie write.csv in R gebruiken als write.csv2 () om de rijen te scheiden met een puntkomma voor het exporteren van R naar csv-gegevens.
write.csv2(df, "table_car.csv")
Opmerking : alleen voor pedagogische doeleinden hebben we een functie gemaakt met de naam open_folder () om de directorymap voor u te openen. U hoeft alleen de onderstaande code uit te voeren en te kijken waar het csv-bestand is opgeslagen. U zou de bestandsnamen table_car.csv moeten zien voor het exporteren van gegevens R naar csv.
# Run this code to create the functionopen_folder <-function(dir){if (.Platform['OS.type'] == "windows"){shell.exec(dir)} else {system(paste(Sys.getenv("R_BROWSER"), dir))}}# Call the function to open the folderopen_folder(directory)
Gegevens exporteren van R naar Excel-bestand
Nu zullen we leren hoe we gegevens van R naar Excel kunnen exporteren:
Gegevens exporteren van R naar Excel is triviaal voor Windows-gebruikers en lastiger voor Mac OS-gebruikers. Beide gebruikers zullen de bibliotheek xlsx gebruiken om een Excel-bestand te maken. Het kleine verschil komt van de installatie van de bibliotheek. Inderdaad, de bibliotheek xlsx gebruikt Java om het bestand te maken. Java moet worden geïnstalleerd als het niet aanwezig is op uw computer voor Data R-export naar Excel.
Windows-gebruikers
Als u een Windows-gebruiker bent, kunt u de bibliotheek rechtstreeks met conda installeren om dataframe naar Excel R te exporteren:
conda install -c r r-xlsx
Nadat de bibliotheek is geïnstalleerd, kunt u de functie write.xlsx () gebruiken. Er wordt een nieuwe Excel-werkmap gemaakt in de werkmap voor R-export naar Excel-gegevens
library(xlsx)write.xlsx(df, "table_car.xlsx")
Als u een Mac OS-gebruiker bent, moet u deze stappen volgen:
- Stap 1: Installeer de nieuwste versie van Java
- Stap 2: Installeer bibliotheek rJava
- Stap 3: Installeer bibliotheek xlsx
Stap 1) U kunt Java downloaden van de officiële Oracle-site en het installeren.
U kunt teruggaan naar Rstudio en controleren welke versie van Java is geïnstalleerd.
system("java -version")
Op het moment van de tutorial is de nieuwste versie van Java 9.0.4.
Stap 2) Je moet rjava installeren in R. We raden je aan om R en Rstudio met Anaconda te installeren. Anaconda beheert de afhankelijkheden tussen bibliotheken. In die zin zal Anaconda de fijne kneepjes van de rJava-installatie afhandelen.
Allereerst moet u conda bijwerken en vervolgens de bibliotheek installeren. U kunt de volgende twee regels code in de terminal kopiëren en plakken.
conda - conda updateconda install -c r r-rjava
Open vervolgens rjava in Rstudio
library(rJava)
Stap 3) Eindelijk is het tijd om xlsx te installeren. Nogmaals, je kunt conda gebruiken om het te doen:
conda install -c r r-xlsx
Net als de Windows-gebruikers kunt u gegevens opslaan met de functie write.xlsx ()
library(xlsx)
Uitgang:
## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")
Gegevens exporteren van R naar verschillende software
Het exporteren van gegevens naar verschillende software is net zo eenvoudig als het importeren ervan. De bibliotheek "haven" biedt een gemakkelijke manier om gegevens te exporteren naar
- spss
- sas
- stata
Importeer allereerst de bibliotheek. Als u geen "haven" heeft, kunt u hier naartoe gaan om het te installeren.
library(haven)
SPSS-bestand
Hieronder staat de code om de gegevens naar SPSS-software te exporteren:
write_sav(df, "table_car.sav")
Gegevens exporteren van R naar SAS-bestand
Net zo eenvoudig als spss, kunt u exporteren naar sas
write_sas(df, "table_car.sas7bdat")
Gegevens exporteren van R naar STATA-bestand
Ten slotte staat de haven-bibliotheek het schrijven van een .dta-bestand toe.
write_dta(df, "table_car.dta")
R
Als u een dataframe of een ander R-object wilt opslaan, kunt u de functie opslaan () gebruiken.
save(df, file ='table_car.RData')
U kunt de hierboven gemaakte bestanden in de huidige werkdirectory controleren
Communiceer met de Cloud Services
Last but not least is R uitgerust met fantastische bibliotheken om te communiceren met de cloud computing-services. Het laatste deel van deze tutorial behandelt het exporteren / importeren van bestanden van:
- Google Drive
- Dropbox
Opmerking : in dit deel van de tutorial wordt ervan uitgegaan dat je een account hebt bij Google en Dropbox. Als dit niet het geval is, kunt u er snel een maken voor - Google Drive: https://accounts.google.com/SignUp?hl=en - Dropbox: https://www.dropbox.com/h
Google Drive
U moet de bibliotheek googledrive installeren om toegang te krijgen tot de functie waarmee u met Google Drive kunt communiceren.
De bibliotheek is nog niet beschikbaar op Anaconda. Je kunt het installeren met de onderstaande code in de console.
install.packages("googledrive")
en je opent de bibliotheek.
library(googledrive)
Voor niet-conda-gebruikers is het installeren van een bibliotheek eenvoudig, u kunt de functie install.packages ('NAAM VAN PAKKET) gebruiken met de naam van het pakket tussen haakjes. Vergeet de ''. Merk op dat R verondersteld wordt het pakket automatisch in de `libPaths () te installeren. Het is de moeite waard om het in actie te zien.
Upload naar Google Drive
Om een bestand naar Google Drive te uploaden, moet u de functie drive_upload () gebruiken.
Elke keer dat u Rstudio opnieuw start, wordt u gevraagd om tidyverse toegang tot Google Drive toe te staan.
De basissyntaxis van drive_upload () is
drive_upload(file, path = NULL, name = NULL)arguments:- file: Full name of the file to upload (i.e., including the extension)- path: Location of the file- name: You can rename it as you wish. By default, it is the local name.
Nadat u de code heeft gestart, moet u verschillende vragen bevestigen
drive_upload%<("table_car.csv", name ="table_car")
Uitgang:
## Local file:## * table_car.csv## uploaded into Drive file:## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk## with MIME type:## * text/csv
U typt 1 in de console om de toegang te bevestigen
Vervolgens wordt u omgeleid naar de Google API om de toegang toe te staan. Klik op Toestaan.
Zodra de authenticatie is voltooid, kunt u uw browser afsluiten.
In de console van de Rstudio kunt u de samenvatting van de uitgevoerde stap zien. Google heeft met succes het bestand geüpload dat zich lokaal op de Drive bevindt. Google heeft een ID toegewezen aan elk bestand in de schijf.
U kunt dit bestand bekijken in Google Spreadsheet.
drive_browse("table_car")
Uitgang:
U wordt doorgestuurd naar Google Spreadsheet
Importeer uit Google Drive
Upload een bestand van Google Drive met de ID is handig. Als u de bestandsnaam kent, kunt u de ID als volgt opvragen:
Opmerking : afhankelijk van uw internetverbinding en de grootte van uw schijf, kan dit even duren.
x <-drive_get("table_car")as_id(x)
Je hebt de ID opgeslagen in de variabele x. Met de functie drive_download () kan een bestand van Google Drive worden gedownload.
De basissyntaxis is:
drive_download(file, path = NULL, overwrite = FALSE)arguments:- file: Name or id of the file to download-path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive-overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.
U kunt het bestand eindelijk downloaden:
download_google & lt; - drive_download(as_id(x), overwrite = TRUE)
Code Verklaring
- drive_download (): functie om een bestand te downloaden van Google Drive
- as_id (x): gebruik de ID om door het bestand in Google Drive te bladeren
- overwrite = TRUE: Als het bestand bestaat, overschrijf het, anders wordt de uitvoering gestopt. Om de naam van het bestand lokaal te zien, kunt u het volgende gebruiken:
Uitgang:
Het bestand wordt opgeslagen in uw werkmap. Onthoud dat je de extensie van het bestand moet toevoegen om het in R te openen. Je kunt de volledige naam aanmaken met de functie paste () (dwz table_car.csv)
google_file <-download_google$local_pathgoogle_filepath <-paste(google_file, ".csv", sep = "")google_table_car <-read.csv(path)google_table_car
Uitgang:
## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800
Ten slotte kunt u het bestand van uw Google-schijf verwijderen.
## remove filedrive_find("table_car") %>%drive_rm()
Uitgang:
Het is een langzaam proces. Het kost tijd om te verwijderen
Exporteren naar Dropbox
R werkt samen met Dropbox via de rdrop2-bibliotheek. De bibliotheek is ook niet beschikbaar bij Anaconda. U kunt het installeren via de console
install.packages('rdrop2')
library(rdrop2)
U moet tijdelijke toegang tot Dropbox verlenen met uw inloggegevens. Nadat de identificatie is voltooid, kan R een upload maken, verwijderen en downloaden naar je Dropbox.
Allereerst moet u toegang geven tot uw account. De inloggegevens worden tijdens alle sessies in de cache opgeslagen.
drop_auth()
Je wordt doorgestuurd naar Dropbox om de authenticatie te bevestigen.
U krijgt een bevestigingspagina. U kunt het sluiten en terugkeren naar R
U kunt een map aanmaken met de functie drop_create ().
- drop_create ('my_first_drop'): maak een map in de eerste tak van Dropbox
- drop_create ('First_branch / my_first_drop'): Maak een map in de bestaande First_branch-map.
drop_create('my_first_drop')
Uitgang:
In DropBox
Gebruik de functie drop_upload () om het .csv-bestand naar je Dropbox te uploaden.
Basissyntaxis:
drop_upload(file, path = NULL, mode = "overwrite")arguments:- file: local path- path: Path on Dropbox- mode = "overwrite": By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")
Uitgang:
Bij DropBox
Je kunt het csv-bestand van Dropbox lezen met de functie drop_read_csv ()
dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv")dropbox_table_car
Uitgang:
## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800
Als u klaar bent met het gebruik van het bestand en het wilt verwijderen. U moet het pad van het bestand schrijven in de functie drop_delete ()
drop_delete('my_first_drop/table_car.csv')
Uitgang:
Het is ook mogelijk om een map te verwijderen
drop_delete('my_first_drop')
Uitgang:
Overzicht
In onderstaande tabel kunnen we alle functies samenvatten
Bibliotheek |
Objectief |
Functie |
---|---|---|
baseren |
Exporteer csv |
write.csv () |
xlsx |
Excel exporteren |
write.xlsx () |
oase |
Exporteer spss |
write_sav () |
oase |
Exporteer sas |
write_sas () |
oase |
Exporteer stata |
write_dta () |
baseren |
Exporteren R |
opslaan() |
googledrive |
Upload Google Drive |
drive_upload () |
googledrive |
Open in Google Drive |
drive_browse () |
googledrive |
Ophalen bestands-ID |
drive_get (as_id ()) |
googledrive |
Downloaden van Google Drive |
download_google () |
googledrive |
Verwijder het bestand uit Google Drive |
drive_rm () |
rdrop2 |
Authentificatie |
drop_auth () |
rdrop2 |
Maak een map |
drop_create () |
rdrop2 |
Upload naar Dropbox |
drop_upload () |
rdrop2 |
Lees csv van Dropbox |
drop_read_csv |
rdrop2 |
Verwijder bestand uit Dropbox |
drop_delete () |