Top 23 Cassandra-interviewvragen & Antwoorden

Anonim

Download PDF

1) Leg uit wat Cassandra is?

Cassandra is een open source-gegevensopslagsysteem dat door Facebook is ontwikkeld voor het zoeken naar inboxen en is ontworpen voor het opslaan en beheren van grote hoeveelheden gegevens op commodity-servers. Het kan als beide worden gebruikt

  • Real-time gegevensopslagsysteem voor online toepassingen
  • Ook als leesintensieve database voor business intelligence-systeem

2) Wat is het gebruik van Cassandra en waarom Cassandra gebruiken?

Cassandra is ontworpen om big data-workloads op meerdere knooppunten af ​​te handelen zonder enig storingspunt. De verschillende factoren die verantwoordelijk zijn voor het gebruik van Cassandra zijn

  • Het is fouttolerant en consistent
  • Schaalbaarheden van gigabytes tot petabytes
  • Het is een kolomgeoriënteerde database
  • Geen enkel storingspunt
  • Geen aparte cachelaag nodig
  • Flexibel schemaontwerp
  • Het heeft flexibele gegevensopslag, gemakkelijke gegevensdistributie en snelle schrijfbewerkingen
  • Het ondersteunt ACID-eigenschappen (Atomicity, Consistentie, Isolatie en Duurzaamheid)
  • Geschikt voor meerdere datacenters en cloud
  • Data compressie

3) Leg uit wat een samengesteld type is in Cassandra?

In Cassandra maakt het composiettype het mogelijk om een ​​sleutel- of kolomnaam te definiëren met een aaneenschakeling van gegevens van een ander type. U kunt twee soorten samengestelde typen gebruiken

  • Rij-toets
  • Kolomnaam

4) Hoe Cassandra gegevens opslaat?

  • Alle gegevens zijn opgeslagen als bytes
  • Wanneer u validator opgeeft, zorgt Cassandra ervoor dat die bytes worden gecodeerd volgens de vereisten
  • Vervolgens rangschikt een vergelijker de kolom op basis van de volgorde die specifiek is voor de codering
  • Hoewel composiet slechts byte-arrays zijn met een specifieke codering, slaat het voor elke component een lengte van twee bytes op, gevolgd door de byte-gecodeerde component, gevolgd door een beëindigingsbit.

5) Noem wat de belangrijkste componenten van Cassandra Data Model zijn?

De belangrijkste componenten van Cassandra Data Model zijn

  • TROS
  • Sleutelruimte
  • Kolom
  • Column & Familie

6) Leg uit wat een kolomfamilie in Cassandra is?

Kolomfamilie in Cassandra wordt verwezen voor een verzameling rijen.

7) Leg uit wat een cluster in Cassandra is?

Een cluster is een container voor sleutelruimten. Cassandra-database is gesegmenteerd over verschillende machines die samen werken. Het cluster is de buitenste container die de knooppunten in een ringformaat rangschikt en er gegevens aan toewijst. Deze knooppunten hebben een replica die de leiding neemt in geval van een storing in de gegevensverwerking.

8) Maak een lijst van de andere componenten van Cassandra?

De andere componenten van Cassandra zijn

  • Knooppunt
  • Datacenter
  • TROS
  • Vastleglogboek
  • Mem-tafel
  • SSTable
  • Bloei-filter

9) Leg uit wat een sleutelruimte in Cassandra is?

In Cassandra is een sleutelruimte een naamruimte die de gegevensreplicatie op knooppunten bepaalt. Een cluster bestaat uit één sleutelruimte per knooppunt.

10) Wat is de syntaxis om keyspace te maken in Cassandra?

Syntaxis voor het maken van keyspace in Cassandra is

CREËER KEYSPACE MET

11) Wat zijn de waarden die zijn opgeslagen in de Cassandra-kolom?

In Cassandra Column zijn er in principe drie waarden

  • Kolomnaam
  • Waarde
  • Tijdstempel

12) Geef aan wanneer u Alter keyspace kunt gebruiken?

ALTER KEYSPACE kan worden gebruikt om eigenschappen te wijzigen, zoals het aantal replica's en de sustainable_write van een keyspace.

13) Leg uit wat Cassandra-Cqlsh is?

Cassandra-Cqlsh is een querytaal waarmee gebruikers kunnen communiceren met de database. Door Cassandra cqlsh te gebruiken, kunt u de volgende dingen doen

  • Definieer een schema
  • Voer een gegevens en in
  • Voer een zoekopdracht uit

14) Wat wordt er bepaald door de shell-commando's "Capture" en "Consistency"?

Er zijn verschillende Cqlsh-shell-opdrachten in Cassandra. Commando "Capture", legt de uitvoer van een commando vast en voegt het toe aan een bestand, terwijl commando "Consistentie" het huidige consistentieniveau weergeeft of een nieuw consistentieniveau instelt.

15) Wat is verplicht bij het aanmaken van een tabel in Cassandra?

Hoewel het maken van een primaire sleutel voor een tabel verplicht is, bestaat deze uit een of meer kolommen van een tabel.

16) Geef aan waar u op moet letten bij het toevoegen van een kolom?

Bij het toevoegen van een kolom moet u ervoor zorgen dat de

  • Kolomnaam is niet in strijd met de bestaande kolomnamen
  • Tafel is niet gedefinieerd met compacte opslagoptie

17) Wat zijn Cassandra-CQL-collecties?

Cassandra CQL-collecties helpen u om meerdere waarden in één variabele op te slaan. In Cassandra kunt u CQL-verzamelingen op de volgende manieren gebruiken

  • Lijst : wordt gebruikt wanneer de volgorde van de gegevens moet worden gehandhaafd en een waarde meerdere keren moet worden opgeslagen (bevat de lijst met unieke elementen)
  • SET : Het wordt gebruikt om een ​​groep elementen op te slaan en terug te sturen in gesorteerde volgorde (bevat herhalende elementen)
  • MAP : het is een gegevenstype dat wordt gebruikt om een ​​sleutelwaardepaar van elementen op te slaan

18) Leg uit hoe Cassandra gegevens schrijft?

Cassandra schrijft gegevens in drie componenten

  • Commitlog schrijven
  • Memtable schrijven
  • SStable schrijven

Cassandra schrijft eerst gegevens naar een vastleglogboek en vervolgens naar een in-memory tabelstructuur memtable en ten slotte in SStable

19) Leg uit wat Memtable is in Cassandra?

  • Cassandra schrijft de gegevens naar een in-memory-structuur die bekend staat als Memtable
  • Het is een in-memory cache met inhoud opgeslagen als sleutel / kolom
  • Op sleutel Memtable-gegevens worden gesorteerd
  • Er is een afzonderlijke Memtable voor elke ColumnFamily en deze haalt kolomgegevens op uit de sleutel

20) Leg uit waaruit SStable bestaat?

SStable bestaat voornamelijk uit 2 bestanden

  • Indexbestand (Bloom-filter & Key offset-paren)
  • Gegevensbestand (werkelijke kolomgegevens)

21) Leg uit waarvoor het Bloom Filter wordt gebruikt in Cassandra?

Een bloom-filter is een ruimtebesparende datastructuur die wordt gebruikt om te testen of een element lid is van een set. Met andere woorden, het wordt gebruikt om te bepalen of een SSTable gegevens heeft voor een bepaalde rij. In Cassandra wordt het gebruikt om IO op te slaan bij het uitvoeren van een KEY LOOKUP.

22) Leg uit hoe Cassandra gewijzigde gegevens naar een commitlogboek schrijft?

  • Cassandra concatenate veranderde gegevens in commitlog
  • Commitlog fungeert als een crashherstellogboek voor gegevens
  • Totdat de gewijzigde gegevens zijn samengevoegd tot het vastleggen van een logboek, wordt de schrijfbewerking nooit als succesvol beschouwd

Gegevens gaan niet verloren als de commitlog naar het bestand is gewist

23) Leg uit hoe Cassandra gegevens verwijdert?

SSTables zijn onveranderlijk en kunnen geen rij uit SSTables verwijderen. Wanneer een rij moet worden verwijderd, kent Cassandra de kolomwaarde een speciale waarde toe genaamd Tombstone. Wanneer de gegevens worden gelezen, wordt de Tombstone-waarde als verwijderd beschouwd.