IT-Swarm.Net

hadoop

Wie können Sie Hive- und Hadoop-Versionen von der Eingabeaufforderung aus kennen?

So löschen und aktualisieren Sie einen Datensatz in Hive

Parkett gegen ORC gegen ORC mit bissigem

So beheben Sie beschädigte HDFS-Dateien

Gibt es eine Möglichkeit, den Spaltennamen zusammen mit der Ausgabe abzurufen, während eine Abfrage in Hive ausgeführt wird?

Was ist Hive: Rückgabecode 2 von org.Apache.hadoop.Hive.ql.exec.MapRedTask

Kann Apache Spark ohne Hadoop laufen?

Wie kann man eine HDFS-Verzeichnisgröße überprüfen?

Wo speichert Hive Dateien in HDFS?

Verketten mehrerer MapReduce-Jobs in Hadoop

PIG, wie eine Anzahl von Zeilen in Alias ​​gezählt wird

Namenode fängt nicht an

Laden Sie CSV mit Kommas in zitierten Feldern

Anzahl der Kartenaufgaben festlegen und Aufgaben reduzieren

Hbase zählt schnell die Anzahl der Zeilen

ausgabedateien nach der Reduzierungsphase zusammenführen

Hive-Cluster nach vs sortieren nach vs sortieren nach

Datei kann nicht mit Spark aus HDFS gelesen werden

Der Standard-Namenode-Port von HDFS ist 50070.Aber ich bin an einigen Stellen auf 8020 oder 9000 gestoßen

Datanode-Prozess wird nicht in Hadoop ausgeführt

Speichern Sie Spark-Datenrahmen als dynamische partitionierte Tabelle in Hive

So laden Sie eine Textdatei in eine Hive-Tabelle, die als Sequenzdateien gespeichert ist

Wie lösche ich Dateien vom HDFS?

Wählen Sie die beiden oberen Reihen in Hive aus

http: // localhost: 50070 funktioniert nicht HADOOP

Überschreiben der vorhandenen Dateien mit dem Befehl hadoop fs -copyToLocal

Hive-Abfrage zum schnellen Auffinden der Tabellengröße (Anzahl der Zeilen)

Wie bekomme ich den Namen der Eingabedatei in einem Hadoop-Programm im Mapper?

SparkSQL vs Hive on Spark - Unterschiede und Vor- und Nachteile?

Wie kopiere ich Daten von einem HDFS auf ein anderes HDFS?

Hadoop 2.2 Installation `. ' Keine solche Datei oder Ordner

Es werden keine Datenknoten gestartet

Hadoop: Die Verbindung zum ResourceManager ist fehlgeschlagen

Ändern Sie die Spalte zum Hinzufügen oder Ablegen der Hive-Tabelle

Hadoop Java.io.IOException: Mkdirs konnte/some/path nicht erstellen

Ursache: ERROR XSDB6: Eine andere Instanz von Derby hat möglicherweise bereits die Datenbank gebootet

Wie berechnet man den Datumsunterschied in Hive?

Woher wissen Sie, warum ClosedChannelException mit spark-Shell im YARN-Client-Modus verwendet wird?

Wie kann man Tabellen aus Hadoop-Hive löschen/kürzen?

Unterschied zwischen hadoop fs -put und hadoop fs -copyFromLocal

Wie kann ich Daten in Hive transponieren/schwenken?

Wie kann ich programmgesteuert in SparkSQL eine Verbindung zu einem Hive-Metastore herstellen?

Spark-Submit funktioniert nicht, wenn sich die Anwendungsjar in HDFS befindet

Die Anwendung ist aufgrund von AM-Container 2 Mal fehlgeschlagen: mit exitCode: 1 beendet

So ermitteln Sie die Größe einer HDFS-Datei

Warum meldet Hadoop "Ungesunde Knoten lokaler Verzeichnisse und Protokolldateien sind schlecht"?

Was ist ein Container in YARN?

Pyspark: Liste der Dateien/Verzeichnisse im HDFS-Pfad abrufen

So starten Sie das Garn bei AWS EMR erneut

Wie bekomme ich Schema-/Spaltennamen aus der Parkettdatei?

Was ist der Unterschied zwischen -hivevar und -hiveconf?

Angeben der AWS-Zugriffsschlüssel-ID und des geheimen Zugriffsschlüssels als Teil einer Amazon S3-URL

Können wir die Parkettdatei direkt in Hive laden?

Iterieren Sie das HDFS-Verzeichnis

Datei/Ordner von Hadoop löschen

Wie listet man alle Hive-Datenbanken auf, die bisher verwendet oder erstellt wurden?

java.net.URISyntaxException beim Starten von HIVE

HDFS_NAMENODE_USER, HDFS_DATANODE_USER & HDFS_SECONDARYNAMENODE_USER nicht definiert

Was bewirkt der Befehl "hadoop namenode -format"?

apache-Funken - Überprüfen Sie, ob eine Datei vorhanden ist

So navigieren Sie durch Verzeichnisse in Hadoop HDFS

Wie schreibe ich "Karte nur"? Hadoop-Jobs?

Der cygwin sshd-Dienst kann nicht gestartet werden

Hadoop-Namenode startet nicht

Die Ausgabe des Befehls Hive INSERT OVERWRITE DIRECTORY wird nicht durch ein Trennzeichen getrennt. Warum?

Hadoop: ... wird auf Knoten anstelle von minReplication (= 1) repliziert. Es sind 1 Datanode (n) aktiv und es werden keine Knoten ausgeschlossen

problem beim Ausführen des Spark-Jobs auf dem Garncluster

Wie kann man hadoop dazu bringen, Verzeichnisse anzulegen, wenn sie nicht existieren?

Wie entferne ich Dateien im hadoop-Verzeichnis auf einmal?

Wie füge ich eine Partition mit Hive bis zu einem bestimmten Datum hinzu?

Hive 2.1.1 MetaException (Nachricht: Versionsinformationen im Metastore nicht gefunden.)

MapReduce-Jobs bleiben im Status "Accepted" stecken

wie schreibe ich eine Unterabfrage und verwende "In" -Klausel in Hive

hadoop map reduziert die sekundärsortierung

Wie führt Hadoop Eingangssplits durch?

Hive-Fehler: Parseexception fehlt EOF

Hadoop ein Verzeichnis kopieren?

Sparsamkeit, Avro, Protokollpuffer - Sind sie alle tot?

Wie entferne ich Knoten in Hadoop richtig?

LeaseExpiredException: Kein Lease-Fehler bei HDFS

Wo ist die Konfigurationsdatei für HDFS in Hadoop 2.2.0?

Datenreplikationsfehler in Hadoop

Pig Latin: Laden mehrerer Dateien aus einem Datumsbereich (Teil der Verzeichnisstruktur)

Warum schlägt "hadoop fs -mkdir" mit Permission Denied fehl?

Spark - Java IOException: Fehler beim Erstellen eines lokalen Verzeichnisses in/tmp/blockmgr *

Eine gute Anleitung, wie Sie Hadoop 2.2.0 (Yarn) als Einzelknoten-Cluster unter MacOS installieren

Was ist der Unterschied zwischen Flume und Sqoop?

$ HADOOP_HOME ist veraltet

Splitgröße vs. Blockgröße in Hadoop

hadoop 2.2.0 64-Bit-Installation, kann jedoch nicht gestartet werden

Hadoop-Eingangssplitgröße vs. Blockgröße

Benennen Sie das Verzeichnis in HDFS um

Apache ZooKeeper WEB-UI

Wo speichert HDFS Dateien standardmäßig lokal?

Geben Sie eine Abweichung im Schlüssel von der Karte ein: erwartet org.Apache.hadoop.io.Text, erhalten org.Apache.hadoop.io.LongWritable

In welcher Beziehung stehen Spark, Hadoop und Cassandra?

beim Laden der Daten aus flachen Dateien in Hive-Tabellen werden Nullwerte abgerufen

Erster hadoop Projektfehler: "Eingabepfad existiert nicht"

Hauptklasse org.Apache.hadoop.hdfs.server.namenode.Namenode konnte nicht gefunden oder geladen werden

Hive: Summe über eine bestimmte Gruppe (HiveQL)