一切福田,不離方寸,從心而覓,感無不通。

SpringBoot集成Hadoop3.2.4HDFS

前言

记录springboot集成hadoop3.2.4版本,并且调用HDFS的相关接口,这里就不展示springboot工程的建立了,这个你们自己去建工程很多教程。


一、springboot配置文件修改

1.1 pom文件修改

 

完整pom配置如下:

 

1.2 properties文件修改

加入以下配置

 

name-node是这个服务的地址,可以在hadoop的配置文件中找,或者直接看hadoop集群namenode网页也可以看到端口号。
我的集群的地址是以下这个:

 

在这里插入图片描述
namespace是在hdfs上文件的地址,就是写文件要写到这个目录下面去。

二、springboot相关类配置类

2.1 新建config类

代码如下:

 

2.2 新建hdfs操作类

代码如下:

 

2.3 新建HDFSutil类

 

2.4 新建controller类

 

三、遇到的问题

项目启动后是从windows调用linux集群,启动一定会报错,如果没有配置windows的环境。

3.1 windows环境配置

报错如下

 

报错的原因是缺少了hadoop的环境配置。要做以下的配置。

3.2 相关hadoop配置下载

https://gitee.com/nkuhyx/winutils.git
下载地址在上面,我这里的hadoop版本是3.2.4,这里我选择的是版本接近的3.2.1
在这里插入图片描述

3.3 修改电脑环境变量

我本地下载后安装到
D:\javaTools\hadoopwindowsclient\hadoop-3.2.1
添加系统变量HADOOP_HOME

 

添加到path

 

在这里插入图片描述

3.4 重启电脑

配置好后重启电脑或者使用dos命令刷新环境变量,我这里直接重启电脑了,就懒得去弄命令了。

四、测试

4.1 调用上传接口

上传文件
本地D盘新建了一个测试文件,内容如下
在这里插入图片描述
调用上传接口
srcfile为你本地的文件路径。

 

结果:
点击namenode进来可以看到文件路径。
在这里插入图片描述
点开这个文件
在这里插入图片描述
可以看到文件已经上传到hdfs了,这里需要注意一个细节。
文件的格式必须是utf-8的如果不是的话,上传中文里面的文件是乱码,这个需要注意下。

4.2 下载文件

这里的filename是下载文件的路径。

 

下载到d盘下,结果如下
在这里插入图片描述
打开内容和上传的一致,说明下载成功。

4.3 删除文件

 

删除后重新查看namenode网址
在这里插入图片描述
可以看到文件已经删除了。

总结

这里展示了springboot集成hadoopHDFS的相关操作以及遇到的问题解决,如果对你有帮助点个赞吧。

 

from:https://blog.csdn.net/qq_34526237/article/details/130059360