hive
Пользовательские функции пользователя Hive (UDF)
Поиск…
Создание UUF улья
Чтобы создать UDF, нам необходимо расширить класс UDF ( org.apache.hadoop.hive.ql.exec.UDF
) и реализовать метод оценки.
После выполнения UDF и создания JAR нам нужно добавить jar в контекст hive для создания временной / постоянной функции.
import org.apache.hadoop.hive.ql.exec.UDF;
class UDFExample extends UDF {
public String evaluate(String input) {
return new String("Hello " + input);
}
}
hive> ADD JAR <JAR NAME>.jar;
hive> CREATE TEMPORARY FUNCTION helloworld as 'package.name.UDFExample';
hive> select helloworld(name) from test;
Улей UDF для обрезки данной строки.
package MyHiveUDFs;
import org.apache.commons.lang.StringUtils;
import org.apache.hadoop.hive.ql.exec.UDF;
import org.apache.hadoop.io.Text;
public class Strip extends UDF {
private Text result = new Text();
public Text evaluate(Text str) {
if(str == null) {
return null;
}
result.set(StringUtils.strip(str.toString()));
return result;
}
}
экспортировать файл выше в jar
Перейдите в CLI Hive и добавьте UDF JAR
hive> ADD jar /home/cloudera/Hive/hive_udf_trim.jar;
Убедитесь, что JAR находится в интерфейсе Hive CLI Classpath
hive> list jars;
/home/cloudera/Hive/hive_udf_trim.jar
Создать временную функцию
hive> CREATE TEMPORARY FUNCTION STRIP AS 'MyHiveUDFs.Strip';
Выход UDF
hive> select strip(' hiveUDF ') from dummy;
OK
hiveUDF
Modified text is an extract of the original Stack Overflow Documentation
Лицензировано согласно CC BY-SA 3.0
Не связан с Stack Overflow