IT-Swarm.Net

hadoop

Cách sao chép tệp từ HDFS sang hệ thống tệp cục bộ

Sự khác biệt giữa lợn và tổ ong? Tại sao có cả hai?

Khi nào nên sử dụng Hadoop, HBase, Hive và Pig?

Apache Spark: Số lượng lõi so với số lượng người thi hành

Nút tên ở chế độ an toàn. Không thể rời đi

Không thể xác định vị trí nhị phân winutils trong đường dẫn nhị phân hadoop

Sự khác biệt giữa phân vùng và xô bảng trong Hive là gì?

Sự khác biệt giữa bảng nội bộ Hive và bảng bên ngoài?

Về mặt kỹ thuật, sự khác biệt giữa s3n, s3a và s3 là gì?

Làm thế nào để biết phiên bản Hive và Hadoop từ dấu nhắc lệnh?

Cách xóa và cập nhật bản ghi trong Hive

Sàn đấu vs ORC vs ORC với Snappy

Cách khắc phục lỗi HDFS FIles

Có cách nào để có được tên cột cùng với đầu ra trong khi thực hiện bất kỳ truy vấn nào trong Hive không?

Hive là gì: Trả về mã 2 từ org.Apache.hadoop.Hive.ql.exec.MapRedTask

Tia lửa Apache có thể chạy mà không có hadoop?

Cách kiểm tra kích thước thư mục HDFS?

Trường hợp Hive lưu trữ các tập tin trong HDFS?

Xâu chuỗi nhiều công việc MapReduce trong Hadoop

PIG làm thế nào để đếm một số hàng trong bí danh

Namenode không bắt đầu

Tải CSV bằng dấu phẩy trong các trường được trích dẫn

Đặt số lượng tác vụ bản đồ và giảm các tác vụ

Hbase nhanh chóng đếm số lượng hàng

hợp nhất các tập tin đầu ra sau khi giảm pha

Hive cluster by vs order by vs sort by

Cổng Namenode mặc định của HDFS là 50070. Nhưng tôi đã gặp ở một số nơi 8020 hoặc 9000

Không thể đọc tệp từ HDFS bằng Spark

Quá trình dữ liệu không chạy trong Hadoop

Lưu khung dữ liệu Spark dưới dạng bảng được phân vùng động trong Hive

Cách tải tệp văn bản vào bảng Hive được lưu dưới dạng tệp tuần tự

Làm cách nào để xóa các tập tin khỏi HDFS?

Chọn 2 hàng đầu trong Hive

http: // localhost: 50070 không hoạt động HADOOP

Cách ghi đè các tệp hiện có bằng lệnh hadoop fs -copyToLocal

Truy vấn Hive để nhanh chóng tìm kích thước bảng (số lượng hàng)

Làm cách nào để có được tên tệp đầu vào trong trình ánh xạ trong chương trình Hadoop?

SparkQuery vs Hive trên Spark - Sự khác biệt và ưu và nhược điểm?

Làm cách nào để sao chép dữ liệu từ một HDFS sang HDFS khác?

Không có nút dữ liệu nào được bắt đầu

Cài đặt Hadoop 2.2 `. ' Không có tập tin hoặc thư mục

Hadoop: Không thể kết nối với ResourceManager

Thay đổi bảng thêm hoặc thả cột

Hadoop Java.io.IOException: Mkdirs không thể tạo/some/path

Nguyên nhân do: ERROR XSDB6: Một phiên bản khác của Derby có thể đã khởi động cơ sở dữ liệu

Cách tính chênh lệch ngày trong Hive

Làm thế nào để biết lý do của chương trình ĐóngChannelException với spark-Shell trong chế độ máy khách YARN là gì?

Làm cách nào để xóa/cắt bớt các bảng từ Hadoop-Hive?

Sự khác biệt giữa hadoop fs -put và hadoop fs -copyFromLocal

Làm thế nào để chuyển đổi/trục dữ liệu trong tổ ong?

Spark-submit không hoạt động khi jar ứng dụng ở chế độ hdfs

Làm cách nào để kết nối với một siêu dữ liệu Hive được lập trình trong SparkQuery?

Cách tìm kích thước tệp HDFS

Ứng dụng thất bại 2 lần do AM Container: thoát với exitCode: 1

Tại sao Hadoop báo cáo "Node local-dirs và log-dirs không tốt"?

Một container trong YARN là gì?

Pyspark: lấy danh sách các tệp/thư mục trên đường dẫn HDFS

Cách khởi động lại sợi trên AWS EMR

Làm cách nào để có được tên lược đồ/cột từ tệp parquet?

Sự khác biệt giữa -hivevar và -hiveconf là gì?

Cách chỉ định ID khóa truy cập AWS và Khóa truy cập bí mật như một phần của URL s3n của Amazon

Chúng tôi có thể tải tập tin Parquet vào Hive trực tiếp không?

Thư mục Spark iterate HDFS

Xóa tập tin/thư mục từ Hadoop

Làm thế nào để liệt kê tất cả các cơ sở dữ liệu Hive đang được sử dụng hoặc tạo ra cho đến nay?

java.net.URISyntaxException khi bắt đầu HIVE

HDFS_NAMENODE_USER, HDFS_DATANODE_USER & HDFS_SECONDARYNAMENODE_USER không được xác định

Lệnh "hadoop namenode -format" sẽ làm gì

apache spark - kiểm tra nếu tập tin tồn tại

Cách điều hướng thư mục trong Hadoop HDFS

Làm thế nào để viết 'chỉ bản đồ' công việc hadoop?

Không thể bắt đầu dịch vụ sshd cygwin

Hadoop - namenode không khởi động

Đầu ra lệnh Hive INSERT OVERWRITE DIRECTORY không được phân tách bằng dấu phân cách. Tại sao?

vấn đề Chạy công việc Spark trên cụm sợi

Hadoop: ... được sao chép thành các nút thay vì minReplication (= 1). Có 1 nút dữ liệu đang chạy và không có nút nào bị loại trừ trong thao tác này

Cách lấy hadoop để tạo thư mục nếu chúng không tồn tại

Làm thế nào để loại bỏ các tập tin trong thư mục hadoop cùng một lúc?

Làm cách nào để thêm phân vùng bằng Hive vào một ngày cụ thể?

làm thế nào để viết truy vấn con và sử dụng mệnh đề "Trong" trong Hive

Các công việc MapReduce bị kẹt trong trạng thái Được chấp nhận

Hive 2.1.1 MetaException (thông báo: Không tìm thấy thông tin phiên bản trong metastore.)

bản đồ hadoop giảm phân loại thứ cấp

Làm thế nào để Hadoop thực hiện phân chia đầu vào?

Lỗi tổ ong: thiếu phân tích EOF

Hadoop sao chép một thư mục?

Thrift, Avro, Protocolbuffers - Có phải tất cả đều chết?

Làm cách nào để xóa chính xác các nút trong Hadoop?

HireExpiredException: Không có lỗi cho thuê trên HDFS

Lỗi sao chép dữ liệu trong Hadoop

Tệp cấu hình cho HDFS ở đâu trong Hadoop 2.2.0?

Pig Latin: Tải nhiều tệp từ một phạm vi ngày (một phần của cấu trúc thư mục)

Tại sao "hadoop fs -mkdir" không thành công với Quyền bị từ chối?

Hướng dẫn tốt về cách cài đặt Hadoop 2.2.0 (Sợi) làm cụm nút đơn trên MacOS

Sự khác biệt giữa Flume và Sqoop là gì?

$ HADOOP_HOME không được dùng nữa

Spark - Java IOException: Không thể tạo thư mục cục bộ trong/tmp/blockmgr *

Chia kích thước so với Kích thước khối trong Hadoop

cài đặt hadoop 2.2.0 64-bit nhưng không thể khởi động

Kích thước phân chia đầu vào Hadoop so với kích thước khối