Suche…


Hive UDF-Erstellung

Um eine UDF zu erstellen, müssen wir die UDF-Klasse ( org.apache.hadoop.hive.ql.exec.UDF ) erweitern und die auswertende Methode implementieren.

Sobald UDF erfüllt ist und JAR erstellt ist, müssen wir dem Hive-Kontext jar hinzufügen, um eine temporäre / permanente Funktion zu erstellen.

import org.apache.hadoop.hive.ql.exec.UDF;    

class UDFExample extends UDF {
  
  public String evaluate(String input) {
    
    return new String("Hello " + input);
  }
}

hive> ADD JAR <JAR NAME>.jar;
hive> CREATE TEMPORARY FUNCTION helloworld as 'package.name.UDFExample';
hive> select helloworld(name) from test;

Hive UDF, um die angegebene Zeichenfolge zu trimmen.

package MyHiveUDFs;

import org.apache.commons.lang.StringUtils;
import org.apache.hadoop.hive.ql.exec.UDF;
import org.apache.hadoop.io.Text;

public class Strip extends UDF {

private Text result = new Text();
 public Text evaluate(Text str) {
 if(str == null) {
 return null;
 }
 result.set(StringUtils.strip(str.toString()));
 return result;
 }
}

Exportieren Sie die obigen Dateien in eine JAR-Datei

Gehen Sie zur Hive-CLI und fügen Sie den UDF-JAR hinzu

hive> ADD jar /home/cloudera/Hive/hive_udf_trim.jar;

Stellen Sie sicher, dass sich JAR im Hive-CLI-Klassenpfad befindet

hive> list jars;
/home/cloudera/Hive/hive_udf_trim.jar

Temporäre Funktion erstellen

hive> CREATE TEMPORARY FUNCTION STRIP AS 'MyHiveUDFs.Strip';

UDF-Ausgabe

 hive> select strip('   hiveUDF ') from dummy;
 OK
 hiveUDF


Modified text is an extract of the original Stack Overflow Documentation
Lizenziert unter CC BY-SA 3.0
Nicht angeschlossen an Stack Overflow