SpringCloud2025+SpringBoot3.5.0+gateway+webflux子服务路由报503
文章目录
- 前言
- 一、问题
- 二、原因
- 1.分析
- 2.配置静态路由再试
- 3.定位
- 总结
前言
本来昨天就应该也记录下,免得忘记的,但是有点晚了,酒没写,真的是被坑惨了。
当然这也是追求最新的代价,也是对新技术、老知识点的重温。
一、问题
就是网关调子服务的报503的问题,请求能进网关,子服务单独访问也正常,但是就是死活不能跳子服务,都进不了子服务在controller上打的断点(子服务也没有拦截)。
二、原因
- 我这里是SpringCloud2025.0.0 + Springboot3.5.0,
- 网关gateway用webflux,(spring-cloud-starter-gateway-server-webflux + spring-boot-starter-webflux)
- 子服务还是在用传统的web,不用webflux
- gateway配置采用动态路由
现在的现象就是服务在nacos都是正常的:
但是用ApiFox就是不能跳转到子服务:
网关能进,也不报错:
子服务直接访问是正常:
1.分析
首先,子服务是暴露了health的
management:
endpoints:
web:
exposure:
include: gateway,health,info # 开放 Gateway 相关端点
endpoint:
health:
show-details: always
gateway:
enabled: true # 确保 Gateway 端点启用(默认 true)
路由侧查看路由:
子服务侧查看健康状态:
然后,通过gateway访问子服务酒报503:
其实报503就已经说明网关已经正常转发子服务了,出503也就几个原因:
- 子服务被网关认为不健康,所以转发不成功
- 子服务服务名称不正确,这个可以检查配置,或在nacos的服务列表看(动态路由)
- 路由名称错误(静态路由)
- 网关转发没有截取前面的url (strip-prefix的属性设置true,就会自动截取)
2.配置静态路由再试
其实,我是一个怕麻烦的人,配置能少我绝不会多写,也怕误导其他人,但是这是在是把我逼的没有办法了。
在gateway的application.yaml增加配置
spring:
cloud:
gateway:
routes:
- id: test-device-route
uri: http://127.0.0.1:18081
predicates:
- Path=/test-device/**
filters:
- StripPrefix=1
网关试试静态路由地址:
居然正常,它怎么能正常呢?为什么动态路由不正常呢?
3.定位
静态路由正常、动态路由异常,只能说明:
- 动态路由服务名错误 (显然这个排查我做了无数遍了)
- 路由转发了,但是子服务不正常 (显然网关转发了,但是没有进子服务,那么就是子服务反馈给注册中心的状态不可用,但是实际又是可用)
综上,最后怀疑是服务负载均衡的有问题,现在负载均衡都是loadbalancer,应该没有Netflix Ribbon(springCloud2020后官方就移除了),那么是不是loadbalancer没有引入呢?
这个在之前搭建之前,其实我也疑惑,没有引入,以为现在新版本不需要引入了。也在ds查了:
显然,我没有自定义,我就直接用动态路由了,娜我还需要引入?不管了,引入试试就是,在gateway的pom增加
<dependency>
<groupId>org.springframework.cloudgroupId>
<artifactId>spring-cloud-starter-loadbalancerartifactId>
dependency>
然后,再试:
它居然正常了,真是一口老血,那么那就可以肯定是gateway的webflux包没有引入loadbalancer以来,现在反向点他们的依赖看他们的pom:
那这就可以结案了。
总结
用最新的,还是很多坑,但是这应该不是spring-cloud-starter-gateway-server-webflux的bug,这不在里面直接依赖了,这样处理:
- 依赖更粒度
- 让架构的知识面更高,需要非常清楚
- 另外说不定是有新的负载均衡要出现了,就想当初loadbalancer取代Ribbon一样
好了,真是坑了半夜,昨晚都没有写,今天才复盘,希望能帮到大家,让更多在坑里的技术人爬出来。