cuốn sách gpt4 ai đã làm

Xuất bảng chứa các giá trị được trích dẫn sang csv cục bộ trong tổ ong

In lại Tác giả: Hồ Xil Thời gian cập nhật: 2023-11-01 14:49:05 26 4
mua khóa gpt4 Nike

Tôi đang cố gắng xuất bảng sang tệp csv cục bộ trong Hive.

CHÈN GHI ĐÈ THƯ MỤC ĐỊA PHƯƠNG '/home/sofia/temp.csv' 
ĐỊNH DẠNG HÀNG ĐƯỢC GIỚI THIỆU
CÁC TRƯỜNG KẾT THÚC BỞI ','
ĐÃ THOÁT BỞI '\\'
CÁC DÒNG KẾT THÚC BỞI '\n'
chọn * từ bảng của tôi;

Vấn đề là một số giá trị chứa dòng mới "\n" và tệp kết quả trở nên rất khó hiểu.

Khi xuất trong Hive, có cách nào để đặt các giá trị trong dấu ngoặc kép để file csv có thể chứa các ký tự đặc biệt (đặc biệt là dòng mới) không?

câu trả lời hay nhất

Một giải pháp khả thi là sử dụng Hive CSV SerDe (bộ tuần tự hóa/bộ giải tuần tự). Nó cung cấp một cách để xác địnhDấu phân cách, dấu ngoặc kép và ký tự thoát tùy chỉnh.

giới hạn:

nó không xử lý đượcKý tự dòng mới được nhúng

sẵn có:

Serde CSV hiện hữu Tổ ong 0,14 Có sẵn trong và lớn hơn.

背景:

Dịch vụ CSV dựa trên https://github.com/ogrodnek/csv-serde , và trong HIVE-7777. thêm vào Tổ ong phân phối

cách sử dụng:

SerDe Thích hợp cho hầu hếtdữ liệu CSV, nhưng không xử lýNhúng dòng mới. Để sử dụng SerDe, vui lòng chỉ định tên lớp đủ điều kiện org.apache.hadoop.hive.serde2.OpenCSVSerde .

Giấy tờ gốc có tại https://github.com/ogrodnek/csv-serde lấy.

TẠO BẢNG my_table(chuỗi a, chuỗi b, ...)
DỊCH VỤ ĐỊNH DẠNG HÀNG 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
VỚI TÍNH CHẤT SERDE (
"dấu phân cách" = "\t",
"quoteChar" = "'",
"escapeChar" = "\\"
)
LƯU TRỮ DƯỚI ĐÂY DƯỚI ĐÂY;

Dấu phân cách mặc định, dấu ngoặc kép và ký tự thoát (nếu không được chỉ định)

DEFAULT_ESCAPE_CHARACTER \
DEFAULT_QUOTE_CHARACTER "
DEFAULT_SEPARATOR ,

Trích dẫn:Hive csv-serde

Về csv - xuất bảng chứa các giá trị được trích dẫn sang csv cục bộ trong Hive, chúng tôi tìm thấy một câu hỏi tương tự trên Stack Overflow: https://stackoverflow.com/questions/33254183/

26 4 0
Chứng chỉ ICP Bắc Kinh số 000000
Hợp tác quảng cáo: 1813099741@qq.com 6ren.com
Xem sitemap của VNExpress