hive
샘플 데이터가있는 테이블 작성 스크립트
수색…
날짜 및 타임 스탬프 유형
CREATE TABLE all_datetime_types(
c_date date,
c_timestamp timestamp
);
최소 및 최대 데이터 값 :
insert into all_datetime_types values ('0001-01-01','0001-01-01 00:00:00.000000001');
insert into all_datetime_types values ('9999-12-31','9999-12-31 23:59:59.999999999');
텍스트 유형
CREATE TABLE all_text_types(
c_char char(255),
c_varchar varchar(65535),
c_string string
);
샘플 데이터 :
insert into all_text_type values ('some ****&&&%%% char value ','some $$$$#####@@@@ varchar value','some !!~~~++ string value' );
숫자 유형
CREATE TABLE all_numeric_types(
c_tinyint tinyint,
c_smallint smallint,
c_int int,
c_bigint bigint,
c_decimal decimal(38,3)
);
최소 및 최대 데이터 값 :
insert into all_numeric_types values (-128,-32768,-2147483648,-9223372036854775808,-99999999999999999999999999999999999.999);
insert into all_numeric_types values (127,32767,2147483647,9223372036854775807,99999999999999999999999999999999999.999);
부동 소수점 숫자 유형
CREATE TABLE all_floating_numeric_types(
c_float float,
c_double double
);
최소 및 최대 데이터 값 :
insert into all_floating_numeric_types values (-3.4028235E38,-1.7976931348623157E308);
insert into all_floating_numeric_types values (-1.4E-45,-4.9E-324);
insert into all_floating_numeric_types values (1.4E-45,4.9E-324);
insert into all_floating_numeric_types values (3.4028235E38,1.7976931348623157E308);
부울 및 이진 형식
CREATE TABLE all_binary_types(
c_boolean boolean,
c_binary binary
);
샘플 데이터 :
insert into all_binary_types values (0,1234);
insert into all_binary_types values (1,4321);
노트 :
- boolean의 경우 내부적으로 true 또는 false로 저장됩니다.
- 바이너리의 경우 base64로 인코딩 된 값을 저장합니다.
복잡한 유형
정렬
CREATE TABLE array_data_type(
c_array array<string>)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
COLLECTION ITEMS TERMINATED BY '&';
데이터가있는 data.csv
만들기 :
arr1&arr2
arr2&arr4
/tmp
폴더에 data.csv
를 넣고이 데이터를 하이브에로드하십시오.
LOAD DATA LOCAL INPATH '/tmp/data.csv' INTO TABLE array_data_type;
또는이 CSV를 /tmp
에 HDFS로 넣을 수 있습니다. 다음을 사용하여 HDFS에서 CSV의 데이터로드
LOAD DATA INPATH '/tmp/data.csv' INTO TABLE array_data_type;
지도
CREATE TABLE map_data_type(
c_map map<int,string>)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
COLLECTION ITEMS TERMINATED BY '&'
MAP KEYS TERMINATED BY '#';
data.csv
파일 :
101#map1&102#map2
103#map3&104#map4
하이브에 데이터로드 :
LOAD DATA LOCAL INPATH '/tmp/data.csv' INTO TABLE map_data_type;
구조
CREATE TABLE struct_data_type(
c_struct struct<c1:smallint,c2:varchar(30)>)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
COLLECTION ITEMS TERMINATED BY '&';
data.csv
파일 :
101&struct1
102&struct2
하이브에 데이터로드 :
LOAD DATA LOCAL INPATH '/tmp/data.csv' INTO TABLE struct_data_type;
유니온 타입
CREATE TABLE uniontype_data_type(
c_uniontype uniontype<int, double, array<string>)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
COLLECTION ITEMS TERMINATED BY '&';
data.csv
파일 :
0&10
1&10.23
2&arr1&arr2
하이브에 데이터로드 :
LOAD DATA LOCAL INPATH '/tmp/data.csv' INTO TABLE uniontype_data_type;
Modified text is an extract of the original Stack Overflow Documentation
아래 라이선스 CC BY-SA 3.0
와 제휴하지 않음 Stack Overflow