Gegevens exporteren van R: gegevens exporteren van R naar CSV, Excel

Inhoudsopgave:

Anonim

Gegevens exporteren uit R

In deze zelfstudie leren we hoe we gegevens van de R-omgeving naar verschillende indelingen kunnen exporteren.

Om gegevens naar de harde schijf te exporteren, hebt u het bestandspad en een extensie nodig. Allereerst is het pad de locatie waar de gegevens worden opgeslagen. In deze tutorial leert u hoe u gegevens opslaat op:

  • De harde schijf
  • Google Drive
  • Dropbox

Ten tweede stelt R de gebruikers in staat om de gegevens naar verschillende soorten bestanden te exporteren. We behandelen de extensie van het essentiële bestand:

  • csv
  • xlsx
  • RDS
  • SAS
  • SPSS
  • STATA

Over het algemeen is het niet moeilijk om gegevens uit R.

In deze tutorial leer je-

  • Exporteren naar harde schijf
  • Hoe u een dataframe exporteert naar een CSV-bestand in R.
  • Gegevens exporteren van R naar Excel-bestand
  • Gegevens exporteren van R naar verschillende software
  • Gegevens exporteren van R naar SAS-bestand
  • Gegevens exporteren van R naar STATA-bestand
  • Communiceer met de Cloud Services
  • Google Drive
  • Exporteren naar Dropbox

Exporteren naar harde schijf

Om te beginnen kunt u de gegevens rechtstreeks in de werkmap opslaan. De volgende code drukt het pad van uw werkmap af:

directory <-getwd()directory

Uitgang:

## [1] "/Users/15_Export_to_do" 

Standaard wordt het bestand opgeslagen in het onderstaande pad.

Voor Mac OS:

/Users/USERNAME/Downloads/ 

Voor ramen:

C:\Users\USERNAME\Documents\

U kunt natuurlijk een ander pad instellen. U kunt bijvoorbeeld het pad naar de downloadmap wijzigen.

Maak een dataframe

Laten we allereerst de mtcars-gegevensset importeren en het gemiddelde van mpg en disp gegroepeerd krijgen op versnelling.

library(dplyr)df <-mtcars % > %select(mpg, disp, gear) % > %group_by(gear) % > %summarize(mean_mpg = mean(mpg), mean_disp = mean(disp))df

Uitgang ::

## # A tibble: 3 x 3## gear mean_mpg mean_disp##   lt;dbl>## 1 3 16.10667 326.3000## 2 4 24.53333 123.0167## 3 5 21.38000 202.4800

De tabel bevat drie rijen en drie kolommen. U kunt een CSV-bestand maken met de functie write.csv in R.

Hoe u een dataframe exporteert naar een CSV-bestand in R.

De basissyntaxis van write.csv in R om het DataFrame naar CSV in R te exporteren:

write.csv(df, path)arguments-df: Dataset to save. Need to be the same name of the data frame in the environment.-path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory

Voorbeeld:

write.csv(df, "table_car.csv")

Code Verklaring

  • write.csv (df, "table_car.csv"): Maak een CSV-bestand op de harde schijf:
    • df: naam van het dataframe in de omgeving
    • "table_car.csv": Noem het bestand table_car en sla het op als csv

Opmerking : u kunt de functie write.csv in R gebruiken als write.csv2 () om de rijen te scheiden met een puntkomma voor het exporteren van R naar csv-gegevens.

write.csv2(df, "table_car.csv")

Opmerking : alleen voor pedagogische doeleinden hebben we een functie gemaakt met de naam open_folder () om de directorymap voor u te openen. U hoeft alleen de onderstaande code uit te voeren en te kijken waar het csv-bestand is opgeslagen. U zou de bestandsnamen table_car.csv moeten zien voor het exporteren van gegevens R naar csv.

# Run this code to create the functionopen_folder <-function(dir){if (.Platform['OS.type'] == "windows"){shell.exec(dir)} else {system(paste(Sys.getenv("R_BROWSER"), dir))}}# Call the function to open the folderopen_folder(directory)

Gegevens exporteren van R naar Excel-bestand

Nu zullen we leren hoe we gegevens van R naar Excel kunnen exporteren:

Gegevens exporteren van R naar Excel is triviaal voor Windows-gebruikers en lastiger voor Mac OS-gebruikers. Beide gebruikers zullen de bibliotheek xlsx gebruiken om een ​​Excel-bestand te maken. Het kleine verschil komt van de installatie van de bibliotheek. Inderdaad, de bibliotheek xlsx gebruikt Java om het bestand te maken. Java moet worden geïnstalleerd als het niet aanwezig is op uw computer voor Data R-export naar Excel.

Windows-gebruikers

Als u een Windows-gebruiker bent, kunt u de bibliotheek rechtstreeks met conda installeren om dataframe naar Excel R te exporteren:

conda install -c r r-xlsx

Nadat de bibliotheek is geïnstalleerd, kunt u de functie write.xlsx () gebruiken. Er wordt een nieuwe Excel-werkmap gemaakt in de werkmap voor R-export naar Excel-gegevens

library(xlsx)write.xlsx(df, "table_car.xlsx")

Als u een Mac OS-gebruiker bent, moet u deze stappen volgen:

  • Stap 1: Installeer de nieuwste versie van Java
  • Stap 2: Installeer bibliotheek rJava
  • Stap 3: Installeer bibliotheek xlsx

Stap 1) U kunt Java downloaden van de officiële Oracle-site en het installeren.

U kunt teruggaan naar Rstudio en controleren welke versie van Java is geïnstalleerd.

system("java -version")

Op het moment van de tutorial is de nieuwste versie van Java 9.0.4.

Stap 2) Je moet rjava installeren in R. We raden je aan om R en Rstudio met Anaconda te installeren. Anaconda beheert de afhankelijkheden tussen bibliotheken. In die zin zal Anaconda de fijne kneepjes van de rJava-installatie afhandelen.

Allereerst moet u conda bijwerken en vervolgens de bibliotheek installeren. U kunt de volgende twee regels code in de terminal kopiëren en plakken.

conda - conda updateconda install -c r r-rjava

Open vervolgens rjava in Rstudio

library(rJava)

Stap 3) Eindelijk is het tijd om xlsx te installeren. Nogmaals, je kunt conda gebruiken om het te doen:

conda install -c r r-xlsx

Net als de Windows-gebruikers kunt u gegevens opslaan met de functie write.xlsx ()

library(xlsx)

Uitgang:

## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")

Gegevens exporteren van R naar verschillende software

Het exporteren van gegevens naar verschillende software is net zo eenvoudig als het importeren ervan. De bibliotheek "haven" biedt een gemakkelijke manier om gegevens te exporteren naar

  • spss
  • sas
  • stata

Importeer allereerst de bibliotheek. Als u geen "haven" heeft, kunt u hier naartoe gaan om het te installeren.

library(haven) 

SPSS-bestand

Hieronder staat de code om de gegevens naar SPSS-software te exporteren:

write_sav(df, "table_car.sav") 

Gegevens exporteren van R naar SAS-bestand

Net zo eenvoudig als spss, kunt u exporteren naar sas

write_sas(df, "table_car.sas7bdat")

Gegevens exporteren van R naar STATA-bestand

Ten slotte staat de haven-bibliotheek het schrijven van een .dta-bestand toe.

write_dta(df, "table_car.dta")

R

Als u een dataframe of een ander R-object wilt opslaan, kunt u de functie opslaan () gebruiken.

save(df, file ='table_car.RData')

U kunt de hierboven gemaakte bestanden in de huidige werkdirectory controleren

Communiceer met de Cloud Services

Last but not least is R uitgerust met fantastische bibliotheken om te communiceren met de cloud computing-services. Het laatste deel van deze tutorial behandelt het exporteren / importeren van bestanden van:

  • Google Drive
  • Dropbox

Opmerking : in dit deel van de tutorial wordt ervan uitgegaan dat je een account hebt bij Google en Dropbox. Als dit niet het geval is, kunt u er snel een maken voor - Google Drive: https://accounts.google.com/SignUp?hl=en - Dropbox: https://www.dropbox.com/h

Google Drive

U moet de bibliotheek googledrive installeren om toegang te krijgen tot de functie waarmee u met Google Drive kunt communiceren.

De bibliotheek is nog niet beschikbaar op Anaconda. Je kunt het installeren met de onderstaande code in de console.

install.packages("googledrive") 

en je opent de bibliotheek.

library(googledrive)

Voor niet-conda-gebruikers is het installeren van een bibliotheek eenvoudig, u kunt de functie install.packages ('NAAM VAN PAKKET) gebruiken met de naam van het pakket tussen haakjes. Vergeet de ''. Merk op dat R verondersteld wordt het pakket automatisch in de `libPaths () te installeren. Het is de moeite waard om het in actie te zien.

Upload naar Google Drive

Om een ​​bestand naar Google Drive te uploaden, moet u de functie drive_upload () gebruiken.

Elke keer dat u Rstudio opnieuw start, wordt u gevraagd om tidyverse toegang tot Google Drive toe te staan.

De basissyntaxis van drive_upload () is

drive_upload(file, path = NULL, name = NULL)arguments:- file: Full name of the file to upload (i.e., including the extension)- path: Location of the file- name: You can rename it as you wish. By default, it is the local name. 

Nadat u de code heeft gestart, moet u verschillende vragen bevestigen

drive_upload%<("table_car.csv", name ="table_car")

Uitgang:

## Local file:## * table_car.csv## uploaded into Drive file:## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk## with MIME type:## * text/csv

U typt 1 in de console om de toegang te bevestigen

Vervolgens wordt u omgeleid naar de Google API om de toegang toe te staan. Klik op Toestaan.

Zodra de authenticatie is voltooid, kunt u uw browser afsluiten.

In de console van de Rstudio kunt u de samenvatting van de uitgevoerde stap zien. Google heeft met succes het bestand geüpload dat zich lokaal op de Drive bevindt. Google heeft een ID toegewezen aan elk bestand in de schijf.

U kunt dit bestand bekijken in Google Spreadsheet.

drive_browse("table_car")

Uitgang:

U wordt doorgestuurd naar Google Spreadsheet

Importeer uit Google Drive

Upload een bestand van Google Drive met de ID is handig. Als u de bestandsnaam kent, kunt u de ID als volgt opvragen:

Opmerking : afhankelijk van uw internetverbinding en de grootte van uw schijf, kan dit even duren.

x <-drive_get("table_car")as_id(x)

Je hebt de ID opgeslagen in de variabele x. Met de functie drive_download () kan een bestand van Google Drive worden gedownload.

De basissyntaxis is:

drive_download(file, path = NULL, overwrite = FALSE)arguments:- file: Name or id of the file to download-path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive-overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.

U kunt het bestand eindelijk downloaden:

download_google & lt; - drive_download(as_id(x), overwrite = TRUE)

Code Verklaring

  • drive_download (): functie om een ​​bestand te downloaden van Google Drive
  • as_id (x): gebruik de ID om door het bestand in Google Drive te bladeren
  • overwrite = TRUE: Als het bestand bestaat, overschrijf het, anders wordt de uitvoering gestopt. Om de naam van het bestand lokaal te zien, kunt u het volgende gebruiken:

Uitgang:

Het bestand wordt opgeslagen in uw werkmap. Onthoud dat je de extensie van het bestand moet toevoegen om het in R te openen. Je kunt de volledige naam aanmaken met de functie paste () (dwz table_car.csv)

google_file <-download_google$local_pathgoogle_filepath <-paste(google_file, ".csv", sep = "")google_table_car <-read.csv(path)google_table_car

Uitgang:

## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800

Ten slotte kunt u het bestand van uw Google-schijf verwijderen.

## remove filedrive_find("table_car") %>%drive_rm()

Uitgang:

Het is een langzaam proces. Het kost tijd om te verwijderen

Exporteren naar Dropbox

R werkt samen met Dropbox via de rdrop2-bibliotheek. De bibliotheek is ook niet beschikbaar bij Anaconda. U kunt het installeren via de console

install.packages('rdrop2')
library(rdrop2)

U moet tijdelijke toegang tot Dropbox verlenen met uw inloggegevens. Nadat de identificatie is voltooid, kan R een upload maken, verwijderen en downloaden naar je Dropbox.

Allereerst moet u toegang geven tot uw account. De inloggegevens worden tijdens alle sessies in de cache opgeslagen.

drop_auth()

Je wordt doorgestuurd naar Dropbox om de authenticatie te bevestigen.

U krijgt een bevestigingspagina. U kunt het sluiten en terugkeren naar R

U kunt een map aanmaken met de functie drop_create ().

  • drop_create ('my_first_drop'): maak een map in de eerste tak van Dropbox
  • drop_create ('First_branch / my_first_drop'): Maak een map in de bestaande First_branch-map.
drop_create('my_first_drop')

Uitgang:

In DropBox

Gebruik de functie drop_upload () om het .csv-bestand naar je Dropbox te uploaden.

Basissyntaxis:

drop_upload(file, path = NULL, mode = "overwrite")arguments:- file: local path- path: Path on Dropbox- mode = "overwrite": By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")

Uitgang:

Bij DropBox

Je kunt het csv-bestand van Dropbox lezen met de functie drop_read_csv ()

dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv")dropbox_table_car

Uitgang:

## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800

Als u klaar bent met het gebruik van het bestand en het wilt verwijderen. U moet het pad van het bestand schrijven in de functie drop_delete ()

drop_delete('my_first_drop/table_car.csv')

Uitgang:

Het is ook mogelijk om een ​​map te verwijderen

drop_delete('my_first_drop')

Uitgang:

Overzicht

In onderstaande tabel kunnen we alle functies samenvatten

Bibliotheek

Objectief

Functie

baseren

Exporteer csv

write.csv ()

xlsx

Excel exporteren

write.xlsx ()

oase

Exporteer spss

write_sav ()

oase

Exporteer sas

write_sas ()

oase

Exporteer stata

write_dta ()

baseren

Exporteren R

opslaan()

googledrive

Upload Google Drive

drive_upload ()

googledrive

Open in Google Drive

drive_browse ()

googledrive

Ophalen bestands-ID

drive_get (as_id ())

googledrive

Downloaden van Google Drive

download_google ()

googledrive

Verwijder het bestand uit Google Drive

drive_rm ()

rdrop2

Authentificatie

drop_auth ()

rdrop2

Maak een map

drop_create ()

rdrop2

Upload naar Dropbox

drop_upload ()

rdrop2

Lees csv van Dropbox

drop_read_csv

rdrop2

Verwijder bestand uit Dropbox

drop_delete ()