Tabelbewerkingen zoals het maken , wijzigen en neerzetten van tabellen in Hive kunnen in deze zelfstudie worden geobserveerd.
In de onderstaande schermafbeelding maken we een tabel met kolommen en wijzigen we de tabelnaam.
1. Tabel guru_sample maken met twee kolomnamen, zoals "empid" en "empname"
2. Tonen van tabellen die aanwezig zijn in de guru99-database
3. Guru_sample wordt weergegeven onder tabellen
4. De tabel "guru_sample" wijzigen als "guru_sampleNew"
5. Nogmaals, als je het "show" commando uitvoert, zal het de nieuwe naam Guru_sampleNew tonen
Dropping table guru_sampleNew:
Tabeltypes en het gebruik ervan:
Naar tabellen komen is net als de manier waarop we creëren in traditionele relationele databases. De functionaliteiten zoals filteren, joins kunnen op de tabellen worden uitgevoerd.
Hive behandelt twee soorten tabelstructuren, zoals interne en externe tabellen, afhankelijk van het laden en ontwerpen van schema in Hive.
Interne tafels
- Internal Table is van nature nauw gekoppeld. In dit type tabel moeten we eerst een tabel maken en de gegevens laden.
- We kunnen dit een gegevens over schema noemen .
- Door deze tabel te verwijderen, worden zowel de gegevens als het schema verwijderd.
- De opgeslagen locatie van deze tabel is / user / hive / warehouse.
Wanneer moet u een interne tafel kiezen:
- Als de verwerkingsgegevens beschikbaar zijn in het lokale bestandssysteem
- Als we willen dat Hive de volledige levenscyclus van gegevens beheert, inclusief de verwijdering
Voorbeeld van codefragment voor interne tabel
1. Om de interne tabel te maken
Hive>CREATE TABLE guruhive_internaltable (id INT,Name STRING);Row format delimitedFields terminated by '\t';
2. Laad de gegevens in de interne tabel
Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO table guruhive_internaltable;
3. Geef de inhoud van de tabel weer
Hive>select * from guruhive_internaltable;
4. Om de interne tafel te laten vallen
Hive>DROP TABLE guruhive_internaltable;
Als je de guruhive_internaltable hebt laten vallen, worden de metagegevens en de gegevens uit Hive verwijderd.
Uit de volgende schermafbeelding kunnen we de uitvoer bekijken
In bovenstaande code en vanaf schermafdruk doen we de volgende dingen,
- Maak de interne tafel
- Laad de gegevens in de interne tabel
- Geef de inhoud van de tabel weer
- Om de interne tafel te laten vallen
Externe tafels
- Externe tafel is losjes gekoppeld van aard. Gegevens zullen beschikbaar zijn in HDFS. De tabel gaat aanmaken op HDFS-gegevens.
- Op een andere manier kunnen we zeggen dat het een schema voor gegevens maakt .
- Op het moment dat de tabel wordt verwijderd, wordt alleen het schema verwijderd, de gegevens zijn nog steeds beschikbaar in HDFS zoals voorheen.
- Externe tabellen bieden een optie om meerdere schema's te maken voor de gegevens die zijn opgeslagen in HDFS in plaats van de gegevens elke keer te verwijderen wanneer het schema wordt bijgewerkt
Wanneer externe tafel kiezen:
- Als gegevens worden verwerkt die beschikbaar zijn in HDFS
- Handig als de bestanden buiten Hive worden gebruikt
Voorbeeld van codefragment voor externe tabel
1. Maak een externe tabel
Hive>CREATE EXTERNAL TABLE guruhive_external(id INT,Name STRING)Row format delimitedFields terminated by '\t'LOCATION '/user/guru99hive/guruhive_external;
2. Als we de locatie niet specificeren op het moment dat de tabel wordt gemaakt, kunnen we de gegevens handmatig laden
Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO TABLE guruhive_external;
3. Geef de inhoud van de tabel weer
Hive>select * from guruhive_external;
4. Om de interne tafel te laten vallen
Hive>DROP TABLE guruhive_external;
Vanaf de volgende schermafbeelding kunnen we de uitvoer bekijken
In bovenstaande code doen we de volgende dingen
- Maak de externe tabel
- Laad de gegevens in de externe tabel
- Geef de inhoud van de tabel weer
- Externe tafel laten vallen
Verschil tussen interne versus externe tabellen
Voorzien zijn van | Intern | Extern |
---|---|---|
Schema | Gegevens over schema | Schema op gegevens |
Opslaglocatie | / usr / hive / warehouse | HDFS-locatie |
Beschikbaarheid van data | Binnen lokaal bestandssysteem | Binnen HDFS |