In deze tutorial leer je:
- Wat zijn de gegevenstypen in R?
- Variabelen
- Vectoren
- Rekenkundige operatoren
- Logische operators
Wat zijn de gegevenstypen in R?
Hieronder volgen de gegevenstypen of gegevensstructuren in R-programmering:
- Scalairen
- Vectoren (numeriek, teken, logisch)
- Matrices
- Dataframes
- Lijsten
Basistypen
- 4.5 is een decimale waarde die numeriek wordt genoemd .
- 4 is een natuurlijke waarde die gehele getallen wordt genoemd . Gehele getallen zijn ook numeriek.
- TRUE of FALSE is een Booleaanse waarde genaamd logische binaire operatoren in R.
- De waarde tussen "" of '' is tekst (string). Ze worden karakters genoemd .
We kunnen het type variabele controleren met de class-functie
Voorbeeld 1:
# Declare variables of different types# Numericx <- 28class(x)
Uitgang:
## [1] "numeric"
Voorbeeld 2:
# Stringy <- "R is Fantastic"class(y)
Uitgang:
## [1] "character"
Voorbeeld 3:
# Booleanz <- TRUEclass(z)
Uitgang:
## [1] "logical"
Variabelen
Variabelen zijn een van de basisgegevenstypen in R die waarden opslaan en zijn een belangrijk onderdeel van R-programmering, vooral voor een datawetenschapper. Een variabele in R-gegevenstypen kan een getal, een object, een statistisch resultaat, een vector, een gegevensset, een modelvoorspelling, eigenlijk alles wat R uitvoert, opslaan. We kunnen die variabele later gebruiken door simpelweg de naam van de variabele aan te roepen.
Om variabele datastructuren in R te declareren, moeten we een variabelenaam toewijzen. De naam mag geen spatie bevatten. We kunnen _ gebruiken om verbinding te maken met woorden.
Gebruik <- of = om een waarde toe te voegen aan de variabele in datatypes in R-programmering.
Hier is de syntaxis:
# First way to declare a variable: use the `<-`name_of_variable <- value# Second way to declare a variable: use the `=`name_of_variable = value
Op de opdrachtregel kunnen we de volgende codes schrijven om te zien wat er gebeurt:
Voorbeeld 1:
# Print variable xx <- 42x
Uitgang:
## [1] 42
Voorbeeld 2:
y <- 10y
Uitgang:
## [1] 10
Voorbeeld 3:
# We call x and y and apply a subtractionx-y
Uitgang:
## [1] 32
Vectoren
Een vector is een eendimensionale reeks. We kunnen een vector maken met alle elementaire R-gegevenstypen die we eerder hebben geleerd. De eenvoudigste manier om vectordatastructuren in R te bouwen, is door de opdracht c te gebruiken.
Voorbeeld 1:
# Numericalvec_num <- c(1, 10, 49)vec_num
Uitgang:
## [1] 1 10 49
Voorbeeld 2:
# Charactervec_chr <- c("a", "b", "c")vec_chr
Uitgang:
## [1] "a" "b" "c"
Voorbeeld 3:
# Booleanvec_bool <- c(TRUE, FALSE, TRUE)vec_bool
Uitgang:
##[1] TRUE FALSE TRUE
We kunnen rekenkundige berekeningen uitvoeren met binaire vectoroperatoren in R.
Voorbeeld 4:
# Create the vectorsvect_1 <- c(1, 3, 5)vect_2 <- c(2, 4, 6)# Take the sum of A_vector and B_vectorsum_vect <- vect_1 + vect_2# Print out total_vectorsum_vect
Uitgang:
[1] 3 7 11
Voorbeeld 5:
In R is het mogelijk om een vector te segmenteren. Soms zijn we alleen geïnteresseerd in de eerste vijf rijen van een vector. We kunnen het [1: 5] commando gebruiken om de waarde 1 tot 5 te extraheren.
# Slice the first five rows of the vectorslice_vector <- c(1,2,3,4,5,6,7,8,9,10)slice_vector[1:5]
Uitgang:
## [1] 1 2 3 4 5
Voorbeeld 6:
De kortste manier om een waardebereik te creëren, is door de: tussen twee getallen te gebruiken. Uit het bovenstaande voorbeeld kunnen we bijvoorbeeld c (1:10) schrijven om een vector met een waarde van één tot tien te creëren.
# Faster way to create adjacent valuesc(1:10)
Uitgang:
## [1] 1 2 3 4 5 6 7 8 9 10
Rekenkundige operatoren
We zullen eerst de elementaire rekenkundige operatoren in R-gegevenstypen zien. Hieronder volgen de rekenkundige en booleaanse operatoren in R-programmering die staan voor:
Operator |
Omschrijving |
---|---|
| Toevoeging |
| Aftrekken |
| Vermenigvuldiging |
| Divisie |
of ** | Machtsverheffing |
Voorbeeld 1:
# An addition3 + 4
Uitgang:
## [1] 7
U kunt de bovenstaande R-code eenvoudig kopiëren en in Rstudio Console plakken. De uitvoer wordt weergegeven na het teken #. We schrijven bijvoorbeeld de code print ('Guru99') en de uitvoer is ## [1] Guru99.
De ## betekent dat we een uitvoer afdrukken en het nummer tussen vierkante haakjes ([1]) is het nummer van het display
De zinnen die beginnen met # annotatie . We kunnen # in een R-script gebruiken om elke gewenste opmerking toe te voegen. R zal het niet lezen tijdens de lopende tijd.
Voorbeeld 2:
# A multiplication3*5
Uitgang:
## [1] 15
Voorbeeld 3:
# A division(5+5)/2
Uitgang:
## [1] 5
Voorbeeld 4:
# Exponentiation2^5
Uitgang:
Voorbeeld 5:
## [1] 32
# Modulo28%%6
Uitgang:
## [1] 4
Logische operators
Met logische operatoren willen we waarden binnen de vector retourneren op basis van logische voorwaarden. Hieronder volgt een gedetailleerde lijst van logische operators van gegevenstypen in R-programmering
De logische instructies in R zijn verpakt in de []. We kunnen veel voorwaardelijke uitspraken toevoegen zoals we willen, maar we moeten ze tussen haakjes plaatsen. We kunnen deze structuur volgen om een voorwaardelijke verklaring te maken:
variable_name[(conditional_statement)]
Met variabele_naam die verwijst naar de variabele, willen we gebruiken voor de instructie. We maken de logische instructie, dwz variabele_naam> 0. Ten slotte gebruiken we de vierkante haak om de logische instructie af te ronden. Hieronder een voorbeeld van een logische verklaring.
Voorbeeld 1:
# Create a vector from 1 to 10logical_vector <- c(1:10)logical_vector>5
Uitgang:
## [1]FALSE FALSE FALSE FALSE FALSE TRUE TRUE TRUE TRUE TRUE
In de bovenstaande uitvoer leest R elke waarde en vergelijkt deze met de instructie logical_vector> 5. Als de waarde strikt hoger is dan vijf, is de voorwaarde WAAR, anders ONWAAR. R geeft een vector terug van WAAR en ONWAAR.
Voorbeeld 2:
In het onderstaande voorbeeld willen we de waarden extraheren die alleen voldoen aan de voorwaarde 'is strikt hoger dan vijf'. Daarvoor kunnen we de voorwaarde tussen een vierkante haak plaatsen, voorafgegaan door de vector met de waarden.
# Print value strictly above 5logical_vector[(logical_vector>5)]
Uitgang:
## [1] 6 7 8 9 10
Voorbeeld 3:
# Print 5 and 6logical_vector <- c(1:10)logical_vector[(logical_vector>4) & (logical_vector<7)]
Uitgang:
## [1] 5 6