presto自带unbase64函数某些时候会报错,所以想要自定义一个unbase64函数。
presto自带unbase64函数,用法如下。
1
| FROM_UTF8(from_base64(nickname))
|
但是有些字符会报错。
1
| Query failed (#20220720_091551_00087_mkhun): Illegal base64 character -1a
|
idea新建maven项目
pom文件如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
| <dependencies>
<dependency>
<groupId>com.facebook.presto</groupId>
<artifactId>presto-spi</artifactId>
<version>0.272</version>
</dependency>
<dependency>
<groupId>com.google.guava</groupId>
<artifactId>guava</artifactId>
<version>18.0</version>
</dependency>
</dependencies>
<build>
<plugins>
<plugin>
<groupId>org.apache.maven.plugins</groupId>
<artifactId>maven-jar-plugin</artifactId>
<configuration>
<classesDirectory>target/classes/</classesDirectory>
<archive>
<manifest>
<mainClass>com.alibaba.dubbo.container.Main</mainClass>
<!-- 打包时 MANIFEST.MF文件不记录的时间戳版本 -->
<useUniqueVersions>false</useUniqueVersions>
<addClasspath>true</addClasspath>
<classpathPrefix>lib/</classpathPrefix>
</manifest>
<manifestEntries>
<Class-Path>.</Class-Path>
</manifestEntries>
</archive>
</configuration>
</plugin>
<plugin>
<groupId>org.apache.maven.plugins</groupId>
<artifactId>maven-dependency-plugin</artifactId>
<executions>
<execution>
<id>copy-dependencies</id>
<phase>package</phase>
<goals>
<goal>copy-dependencies</goal>
</goals>
<configuration>
<type>jar</type>
<includeTypes>jar</includeTypes>
<outputDirectory>
${project.build.directory}/lib
</outputDirectory>
</configuration>
</execution>
</executions>
</plugin>
<plugin>
<groupId>com.facebook.presto</groupId>
<artifactId>presto-maven-plugin</artifactId>
<version>0.3</version>
<extensions>true</extensions>
</plugin>
</plugins>
</build>
|
function开发
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
| package base64;
import com.facebook.presto.common.type.StandardTypes;
import com.facebook.presto.spi.function.Description;
import com.facebook.presto.spi.function.ScalarFunction;
import com.facebook.presto.spi.function.SqlType;
import io.airlift.slice.Slice;
import io.airlift.slice.Slices;
public class UnBase64Function {
@ScalarFunction("unBase64") // 固定参数,表示函数名的意思,也就我们在使用Presto的时候用的函数名
@Description("base64解密") // 函数的注释
@SqlType(StandardTypes.VARCHAR) // 表示数据类型
public static Slice unBase64(@SqlType(StandardTypes.VARCHAR) Slice input) {
// 解码
String res = "";
try {
byte[] decodeBytes = java.util.Base64.getDecoder().decode(input.toStringUtf8());
res = new String(decodeBytes, "utf-8");
} catch (Exception e) {
}
return Slices.utf8Slice(res);
}
}
|
plugin开发
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
| import java.util.Set;
import base64.Base64Function;
import base64.UnBase64Function;
import com.facebook.presto.spi.Plugin;
import com.google.common.collect.ImmutableSet;
public class PrestoUdfPlugin implements Plugin {
@Override
public Set<Class<?>> getFunctions() {
return ImmutableSet.<Class<?>>builder()
// 添加插件class
.add(UnBase64Function.class)
.build();
}
}
|
加载plugin
在src/main/resources下创建目录META-INF,再在META-INF目录下创建services目录,注意下图项目结构中META-INF是父目录 services是子目录,只是idea合并显示了,不是说文件夹名里面有点 “.” 。然后创建文件com.facebook.presto.spi.Plugin,文件内容为plugin的全类名。
例如本例:PrestoUdfPlugin
上线
- maven打包。
- 在所有presto节点服务器的presto安装目录${PRESTO_HOME}/plugin下新建一个my_plugin目录。
- 上传jar包,及相关依赖包(在lib目录下)到所有服务器新建的my_plugin目录下。
- 重启presto: ${PRESTO_HOME}/bin/launcher restart。
项目结构
参考:【presto】方法二:presto实现自定义UDF函数