Top 50 Teradata-sollicitatievragen & Antwoorden

Anonim

Download PDF

1) Hoe definieer je Teradata? Geef een aantal van de belangrijkste kenmerken van hetzelfde.

Teradata is in feite een RDMS dat wordt gebruikt om de Datamart, Datawarehouse, OLAP, OLTP en DSS-apparaten van het bedrijf aan te sturen. Enkele van de belangrijkste kenmerken van Teradata worden hieronder gegeven.

  • Kan zowel op enkele knooppunten als op meerdere knooppunten worden uitgevoerd.
  • Parallelliteit is in het systeem ingebouwd.
  • Zeer compatibel met de normen van ANSI.
  • Heeft de neiging zich op dezelfde manier te gedragen als een server.
  • Het is een open systeem dat in principe wordt uitgevoerd voor UNIX MR-RAS, Suse Linux ETC, WIN2K, enz.

2) Wat zijn de nieuw ontwikkelde functies van Teradata?

Enkele van de nieuw ontwikkelde functies van Teradata zijn: -

  • Geautomatiseerde temporele analyse
  • Uitbreiding van de compressiemogelijkheden die flexibele compressie van gegevens mogelijk maakt, ongeveer 20 keer meer gegevens dan de vorige versie.
  • Klantgerelateerde innovatie zoals tetradata-gezichtspunt.

3) Markeer enkele van de belangrijke componenten van Teradata.

Enkele van de belangrijke componenten van Teradata zijn: -

  • Bynet
  • Toegangsmoduleprocessor (AMP)
  • Parsing Engine (PE)
  • Virtuele schijf (vDisk)
  • Virtueel opslagsysteem (VSS)

4) Noem de procedure waarmee we Teradata-taken kunnen uitvoeren in een UNIX-omgeving.

Het enige dat u hoeft te doen, is de uitvoering in UNIX uitvoeren op de manier zoals hieronder vermeld.

$ Sh> BTEQ <[Scriptpad]> [Logbestandpad]

of

$ Sh> BTEQ <[Scriptpad] TEE [Logbestandpad]

5) Hoe genereren we in Teradata een sequentie?

In Teradata genereren we sequentie door gebruik te maken van de identiteitskolom

6) Hoe wordt de reeks gegenereerd door Teradata tijdens de weergavetijd?

Het enige dat u hoeft te doen, is CSUM gebruiken.

7) Er wordt elk uur een bepaalde belasting op de tafel gelegd. Het verkeer in de ochtend is relatief laag en dat van de nacht is erg hoog. Wat is in deze situatie het meest aan te raden hulpprogramma en hoe moet dat hulpprogramma worden geladen?

Het meest suggestieve hulpprogramma hier is Tpump. Door gebruik te maken van het verkleinen of vergroten van de pakketgrootte, kan het verkeer gemakkelijk worden afgehandeld.

8) Als Fast Load Script mislukt en alleen de fouttabellen voor u beschikbaar worden gesteld, hoe gaat u dan opnieuw opstarten?

In dit geval zijn er in principe twee manieren om opnieuw op te starten.

  • Het oude bestand laten draaien - Zorg ervoor dat u de fouttabellen niet volledig laat vallen. Probeer in plaats daarvan de fouten in het script of het bestand te corrigeren en voer het vervolgens opnieuw uit.
  • Een nieuw bestand uitvoeren - In dit proces wordt het script eenvoudig uitgevoerd met behulp van de instructies voor het laden en het begin van het einde. Dit zal helpen bij het verwijderen van het slot dat op de doeltafel is geplaatst en kan ook het gegeven record uit de fast-log-tabel verwijderen. Zodra dit is gebeurd, bent u vrij om het hele script nogmaals uit te voeren.

9) Noem enkele van de ETL-tools die onder Teradata vallen.

Enkele van de ETL-tools die vaak worden gebruikt in Teradata zijn DataStage, Informatica, SSIS, enz.

10) Benadruk enkele van de voordelen die ETL-tools hebben ten opzichte van TD.

Enkele van de voordelen die ETL-tools hebben ten opzichte van TD zijn: -

  • Er kunnen meerdere heterogene bestemmingen en bronnen worden bediend.
  • Het foutopsporingsproces is veel eenvoudiger met behulp van ETL-tools dankzij de volwaardige GUI-ondersteuning.
  • Componenten van ETL-tools kunnen eenvoudig worden hergebruikt, en als gevolg hiervan worden alle overeenkomstige applicaties die met de server zijn verbonden automatisch bijgewerkt als er een update is voor de hoofdserver.
  • De-pivoteren en draaien kan eenvoudig worden gedaan met behulp van ETL-tools.

11) Wat is de betekenis van caching in Teradata?

Caching wordt beschouwd als een bijkomend voordeel van het gebruik van Teradata, aangezien het voornamelijk werkt met de bron die in dezelfde volgorde blijft, dwz niet regelmatig verandert. Soms wordt de cache meestal gedeeld door applicaties.

12) Hoe kunnen we controleren welke versie van Teradata we momenteel gebruiken?

Geef gewoon het commando .SHOW VERSION.

13) Geef een gerechtvaardigde reden waarom Multi-load NUSI ondersteunt in plaats van USI.

De index-subtabelrij bevindt zich toevallig op dezelfde versterker op dezelfde manier als de datarij in NUSI. Elke Amp wordt dus afzonderlijk en parallel gebruikt.

14) Hoe wordt MLOAD Client System opnieuw opgestart na uitvoering?

Het script moet handmatig worden ingediend, zodat het gemakkelijk de gegevens kan laden vanaf het controlepunt dat het laatst komt.

15) Hoe wordt MLOAD Teradata Server opnieuw opgestart na uitvoering?

Het proces wordt in principe uitgevoerd vanaf het laatst bekende controlepunt, en zodra de gegevens zijn uitgevoerd na uitvoering van het MLOAD-script, wordt de server opnieuw opgestart.

16) Wat wordt bedoeld met een knooppunt?

Een knooppunt wordt in feite een assortiment van componenten van hardware en software genoemd. Meestal wordt een server een knooppunt genoemd.

17) Laten we zeggen dat er een bestand is dat uit 100 records bestaat, waarvan we de eerste en de laatste 20 records moeten overslaan. Wat zal het codefragment?

We hebben BTEQ Utility nodig om deze taak uit te voeren. In het script worden zowel 20 overslaan als 60 herhalen gebruikt.

18) Leg PDE uit.

PDE staat in feite voor Parallel Data Extension. PDE is in feite een interfacelaag van software die aanwezig is boven het besturingssysteem en geeft de database de kans om in een parallel milieu te werken.

19) Wat is TPD?

TPD staat in feite voor Trusted Parallel Database, en het werkt in principe onder PDE. Teradata is toevallig een database die voornamelijk onder PDE werkt. Dit is de reden waarom Teradata meestal wordt aangeduid als Trusted Parallel of Pure Parallel-database.

20) Wat wordt bedoeld met een kanaalstuurprogramma?

Een kanaalstuurprogramma is software die fungeert als communicatiemedium tussen PE's en alle applicaties die worden uitgevoerd op kanalen die aan de clients zijn gekoppeld.

21) Wat wordt bedoeld met Teradata Gateway?

Net als het kanaalstuurprogramma fungeert Teradata Gateway als een communicatiemedium tussen de Parse Engine en applicaties die zijn aangesloten op netwerkclients. Er wordt slechts één gateway per knooppunt toegewezen.

22) Wat wordt bedoeld met een virtuele schijf?

Virtual Disk is in feite een compilatie van een hele reeks cilinders die fysieke schijven zijn. Het wordt soms schijfmatrix genoemd.

23) Leg de betekenis van Amp uit?

Amp staat in feite voor Access Module Processor en is toevallig een processor die virtueel werkt en in feite wordt gebruikt voor het beheren van een enkel deel van de database. Dit specifieke deel van de database kan niet worden gedeeld door een andere versterker. Deze vorm van architectuur wordt dus gewoonlijk shared-nothing-architectuur genoemd.

24) Wat bevat Amp en wat zijn alle bewerkingen die het uitvoert?

Amp bestaat in feite uit een Database Manager-subsysteem en kan de onderstaande bewerkingen uitvoeren.

  • DML uitvoeren
  • DDL uitvoeren
  • Aggregaties en joins implementeren.
  • Sloten losmaken en aanbrengen, etc.

25) Wat wordt bedoeld met een parsing-engine?

PE is toevallig een vriendelijke Vproc. Zijn primaire functie is om SQL-verzoeken te accepteren en antwoorden in SQL te leveren. Het bestaat uit een breed scala aan softwarecomponenten die worden gebruikt om SQL op te splitsen in verschillende stappen en die stappen vervolgens naar AMP's te verzenden.

26) Wat bedoel je met parseren?

Parsing is een proces dat zich bezighoudt met de analyse van tekenreekssymbolen in computertaal of in natuurlijke taal.

27) Wat zijn de functies van een parser?

Een parser: -

  • Controleert semantische fouten
  • Controleert syntactische fouten
  • Controleert het bestaan ​​van objecten

28) Wat wordt bedoeld met een dispatcher?

Dispatcher neemt een hele verzameling verzoeken op en bewaart ze vervolgens in een wachtrij. Gedurende het hele proces wordt dezelfde wachtrij aangehouden om meerdere reeksen antwoorden te leveren.

29) Hoeveel MAX-sessies kan PE op een bepaald moment afhandelen?

PE kan in totaal 120 sessies op een bepaald moment afhandelen.

30) Leg BYNET uit.

BYNET dient in feite als een medium voor communicatie tussen de componenten. Het is primair verantwoordelijk voor het verzenden van berichten en ook voor het samenvoegen en sorteren.

31) Wat wordt bedoeld met een kliek?

Een Clique is in principe bekend als een assortiment van knooppunten die worden gedeeld door gewone schijfstations. Aanwezigheid van Clique is enorm belangrijk omdat het helpt bij het voorkomen van knooppuntstoringen.

32) Wat gebeurt er als een knooppunt een val lijdt?

Telkens wanneer het prestatieniveau van een knooppunt achteruitgaat, migreren alle corresponderende Vprocs onmiddellijk naar een nieuw knooppunt van het storingsknooppunt om alle gegevens terug te krijgen van gewone schijven.

33) Maak een lijst van alle vormen van SLOTEN die beschikbaar zijn in Teradata.

Er zijn in principe vier soorten SLOTEN die onder Teradata vallen. Dit zijn: -

  • Lees Lock
  • Toegangsvergrendeling
  • Exclusief slot
  • Schrijf Lock

34) Wat is het specifieke aangewezen niveau waarop een SLOT kan worden toegepast in Teradata?

  • Tabelniveau - Alle rijen die in een tabel aanwezig zijn, worden zeker vergrendeld.
  • Vergrendeling op databaseniveau - Alle objecten die in de database aanwezig zijn, worden vergrendeld.
  • Row Hash Level Lock - Alleen de rijen die overeenkomen met de betreffende rij, worden vergrendeld.

35) Wat is de score van de AMP's die actief betrokken zijn in de Primary Index?

Slechts één AMP is actief betrokken bij een primaire index.

36) Wat is in Teradata de betekenis van het UPSERT-commando?

UPSERT staat in feite voor Update Else Insert. Deze optie is alleen beschikbaar in Teradata.

37) Benadruk de voordelen van PPI (Partition Primary Index).

PPI wordt in principe gebruikt voor gegevensopslagdoeleinden op basis van bereik of categorie. Als het gaat om bereikquery's, is het gebruik van de volledige tabelscan niet nodig, omdat het meteen naar de daaropvolgende partitie gaat en alle andere partities overslaat.

38) Geef de maten SMALLINT, BYTEINT en INTEGER.

SMALLINT - 2 Bytes - 16 Bites -> -32768 tot 32767

BYTEINT - 1 bytes - 8 bits -> -128 tot 127

INTEGER - 4 bytes - 32 bits -> -2.147.483.648 tot 2.147.483.647

39) Wat wordt bedoeld met een Least Cost Plan?

Een Least Cost Plan wordt in principe in minder tijd uitgevoerd over het kortste pad.

40) Markeer de verschillen tussen de database en de gebruiker in Teradata.

  • Een database is in feite passief, terwijl een gebruiker actief is.
  • Een database slaat primair alle objecten van de database op, terwijl een gebruiker elk object kan opslaan, of dat nu een macro, tabel, weergave, enz. Is.
  • Database heeft geen wachtwoord terwijl de gebruiker het wachtwoord moet invoeren.

41) Markeer de verschillen tussen de primaire sleutel en de primaire index.

  • Primaire index is vrij verplicht, terwijl primaire sleutel optioneel is.
  • Primaire index heeft een limiet van 64 tabellen / kolommen, terwijl primaire sleutel geen limiet heeft.
  • Primaire index staat duplicaten en null-waarden toe, terwijl primaire sleutel dat niet doet.
  • Primaire index is een fysiek mechanisme, terwijl primaire sleutel een puur logisch mechanisme is.

42) Leg uit hoe de spoolruimte wordt gebruikt.

Spoolruimte in Teradata wordt in principe gebruikt voor het uitvoeren van query's. Van de totale beschikbare ruimte in Teradata, wordt 20% van de ruimte in principe toegewezen aan spoolruimte.

43) Benadruk de noodzaak van Performance Tuning.

Prestatieafstemming in Teradata wordt in feite gedaan om alle knelpunten te identificeren en vervolgens op te lossen.

44) Geef aan of het knelpunt een fout is of niet.

Technisch gezien is bottleneck geen vorm van fout, maar het zorgt zeker voor een zekere vertraging in het systeem.

45) Hoe kunnen knelpunten worden geïdentificeerd?

Er zijn in principe vier manieren om een ​​bottleneck te identificeren. Dit zijn: -

  • Teradata Visual Explain
  • Leg Request Modifier uit
  • Teradata Manager
  • Prestatie monitor

46) Wat wordt bedoeld met een hoogste kostenplan?

Volgens het Highest Cost Plan is de tijd die nodig is om het proces uit te voeren langer en duurt het de langste beschikbare weg.

47) Markeer alle modi die aanwezig zijn onder Betrouwbaarheidsniveau.

Laag, Nee, Hoog en Deelnemen zijn de vier modi die aanwezig zijn onder Betrouwbaarheidsniveau.

48) Noem de vijf fasen die onder MultiLoad Utility vallen.

Voorfase, DML-fase, data-acquisitiefase, toepassingsfase en eindfase.

49) Benadruk de beperkingen van TPUMP Utility.

Hieronder volgen de beperkingen van het TPUMP-hulpprogramma: -

  • We kunnen de SELECT-instructie niet gebruiken.
  • Gegevensbestanden kunnen niet worden samengevoegd.
  • Aggregate en Exponential operators worden niet ondersteund.
  • Rekenkundige functies worden niet ondersteund.

50) Hoe worden in BTEQ de parameters van de sessiemodus ingesteld?

.set sessie transactie BTET -> Teradata transactiemodus

.set sessie transactie ANSI -> ANSI-modus

Deze opdrachten werken alleen als ze zijn ingevoerd voordat u zich aanmeldt bij de sessie.