cuốn sách gpt4 ai đã làm

csv - Tải lên/Nhập .csv ở Huế - Chỉ định các dấu phân cách chính xác, v.v.

In lại Tác giả: Hồ Xil Thời gian cập nhật: 2023-11-01 15:10:25 25 4
mua khóa gpt4 Nike

Tôi đang cố tải lên một tập dữ liệu thú vị mà tôi tìm thấy trên Kaggle.com/datasets, được chứa trong thư mục có tên "Vấn đề từ Trao đổi ngăn xếp xác thực chéo" (cụ thể là tệp được tìm thấy ở đây "Questions.csv":https://www.kaggle.com/stackoverflow/statsquestions) đến Cloudera's Hue cho phép tôi sử dụng Hive để truy vấn dữ liệu.

Tuy nhiên, tôi gặp khó khăn khi chọn dấu phân cách để tải .csv lên một cách chính xác. Tôi không thấy nơi để chọn bộ hạn định văn bản, ký tự thoát, v.v.

Tôi đang sử dụng máy Linux có Oracle VirtualBox VM được tải xuống từ:https://www.virtualbox.org/wiki/Downloads

Tôi đang sử dụng bản phân phối Cloudera của Hadoop để truy cập Huế:https://www.cloudera.com/downloads/quickstart_vms/5-8.htmlTôi đặc biệt đang sử dụng Trình quản lý Metastore ở Huế để thử tải lên tệp dữ liệu Câu hỏi.csv.

Bất kỳ trợ giúp nào về việc tải lên/nhập .csv đều được đánh giá cao.

câu trả lời hay nhất

Trước tiên bạn có thể tạo bảng với tham số này:

TẠO BẢNG cơ sở dữ liệuXX.tableXX (chuỗi cột1)
ĐỊNH DẠNG HÀNG CÁC TRƯỜNG ĐƯỢC GIỚI THIỆU ĐƯỢC KẾT THÚC BỞI ',';

https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL#LanguageManualDDL-CreateTableCreate/Drop/TruncateTable Thêm chi tiết về việc tạo bảng Hive trong

Sau đó, bạn phải tải tệp csv lên thư mục hdfs và sử dụng:

TẢI DỮ LIỆU INPATH '/tmp/myCsvFile' 
GHI ĐÈ VÀO BẢNG cơ sở dữ liệuXX.tableXX;

Tôi nhận thấy đây là cách dễ nhất để chuyển đổi tệp csv thành bảng bằng Hue.

Về csv - tải lên/nhập .csv ở Huế - chỉ định các dấu phân cách chính xác, v.v., chúng tôi đã tìm thấy một câu hỏi tương tự trên Stack Overflow: https://stackoverflow.com/questions/43312069/

25 4 0
Chứng chỉ ICP Bắc Kinh số 000000
Hợp tác quảng cáo: 1813099741@qq.com 6ren.com
Xem sitemap của VNExpress