Margrop
Articles164
Tags361
Categories24
1password AC AP API AppDaemon Aqara Cron Date Diagrams.net HA HADashboard HomeAssistant IP IPv4 Java LVM‑Thin Linux MacOS MiniMax MySQL NAS OpenAI PPPoE PostgreSQL ProcessOn Proxmox VE SSL Shell TTS TimeMachine UML Uptime Kuma Web Windows activate ad adb adblock agent aligenie aliyun alpine annotation aop authy autofs backup baidupan bash bitwarden boot brew browser caddy2 cdn centos cert certbot charles chat chrome classloader client clone closures cloudflare cmd command commit container crontab ctyun ddsm demo dependency deploy developer devtools dll dns docker domain download draw drawio dsm dump dylib edge exception export fail2ban feign firewall-cmd flow frp frpc frps fuckgfw function gcc gfw git github golang gperftools gridea grub gvt-g hacs havcs heap hello hexo hibernate hidpi hoisting homeassistant hosts html htmlparser https idea image img img2kvm import index install intel io ios ip iptables iptv ipv6 iso java javascript jetbrains jni jnilib jpa js json jsonb jupter jupyterlab jvm k8s kernel key kid kms kodi koolproxy koolproxyr kvm lan lastpass launchctl learning lede letsencrypt linux live low-code lvm lxc m3u8 mac macos mariadb markdown maven md5 microcode mirror modem modules monitor mount mstsc mysql n2n n5105 nas network nfs node node-red nodejs nohup notepad++ npm nssm ntp oop openfeign openssl os otp ovz packet capture pat pdf pem perf ping pip plugin png powerbutton print pro proxy pve pvekclean python qcow2 qemu qemu-guest-agent rar reboot reflog remote remote desktop renew repo resize retina root route router rule rules runtime safari sata scipy-notebook scoping scp server slmgr so socks source spk spring springboot springfox ssh ssl stash string supernode svg svn swagger sync synology systemctl tap tap-windows tapwindows telecom template terminal tls token totp tvbox txt ubuntu udisk ui undertow uninstall unlocker upgrade url v2ray vhd vim vlmcsd vm vmdk web websocket wechat windows with worker wow xiaoya xml yum zip 中国电信 云电脑 交换机 光猫 公网IP 内存 内网IP 升级 启动 夏令时 天猫精灵 天翼云 安装 容器 导入 小米 常用软件 广告屏蔽 序列号 应用市场 异常 打工 技术 抓包 描述文件 日记 时区 显卡虚拟化 智能家居 智能音箱 梯子 模块 流程 流程图 浏览器 漫游 激活 火绒 电信 画图 直播源 续期 网关 网络风暴 群晖 腾讯 自动化 虚拟机 证书 路由 路由器 软件管家 软路由 运维 运维监控 镜像 镜像源 门窗传感器 问题排查 防火墙 阿里云 阿里源 集客

Hitokoto

Archive

记一次排查服务连接"被拒绝"问题的完整流程

记一次排查服务连接"被拒绝"问题的完整流程

前言

今天遇到一个经典的”连接被拒绝”问题,虽然最终解决方法很简单,但排查过程值得记录一下。希望能给遇到类似问题的同学一些参考。

问题现象

某服务的客户端在启动后一直无法正常连接,日志中持续出现”connection refused”或”连接被拒绝”的错误信息。服务进程明明在运行,但就是连不上。

排查过程

第一步:确认服务状态

首先通过SSH登录到目标服务器,检查服务进程是否在运行:

1
2
3
4
5
6
7
8
# 查看进程是否存活
ps aux | grep 服务名

# 查看端口监听状态
netstat -tlnp | grep 端口号

# 或者使用 ss 命令
ss -tlnp | grep 端口号

发现问题:进程确实在运行,端口也在监听。这说明服务本身没有问题,那么问题可能出在网络或者配置上。

第二步:检查网络连通性

从客户端所在机器尝试连接:

1
2
3
4
5
6
7
8
# 测试端口连通性
telnet 目标IP 端口

# 或者使用 nc 命令
nc -zv 目标IP 端口

# 如果有防火墙,还需要检查防火墙规则
iptables -L -n

发现问题:从客户端无法连接到服务端端口,但服务端本地localhost可以连接。这说明可能是防火墙或者网络策略的问题。

第三步:检查配置文件

仔细检查客户端配置文件:

1
2
3
4
5
6
7
8
# 查看配置文件
cat 配置文件路径

# 重点检查以下几项:
# 1. 服务器地址是否正确
# 2. 端口号是否正确
# 3. 认证信息是否有效
# 4. 协议版本是否匹配

发现问题:配置文件中配置的端口号是8080,但实际服务监听的是8081。这才明白为什么连接会被拒绝——你试图连接一个根本没有监听服务的端口,当然会被拒绝。

第四步:验证并修复

确认问题后,修改配置文件:

1
2
3
4
5
6
7
8
# 修改配置文件中的端口号
sed -i 's/8080/8081/g' 配置文件路径

# 重启服务
systemctl restart 服务名

# 再次测试连接
telnet 目标IP 8081

问题解决。

根因分析

这次问题的根本原因是:服务端悄悄修改了端口配置,但没有及时通知所有使用方。这属于典型的配置变更管理问题。

在实际生产环境中,建议:

  1. 配置集中管理:使用配置中心统一管理所有配置,避免分散在各处的配置文件不同步。

  2. 变更通知机制:任何配置变更都应该有通知机制,通知到所有相关方。

  3. 版本控制:对配置文件进行版本控制,方便追踪变更历史。

  4. 健康检查:在服务启动时进行健康检查,及时发现配置问题。

一键解决方案

如果你遇到了类似的”连接被拒绝”问题,可以尝试以下排查步骤:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
# 1. 确认服务进程是否运行
ps aux | grep 服务名

# 2. 确认端口是否监听
netstat -tlnp | grep 端口号

# 3. 测试本地连接
curl http://localhost:端口号/health

# 4. 测试远程连接
curl http://目标IP:端口号/health

# 5. 检查防火墙
iptables -L -n

常见问题解答

Q:服务明明在运行,为什么连接被拒绝?

A:可能的原因包括:端口配置错误、防火墙阻止、网络策略限制、协议不匹配等。建议按本文的排查步骤逐一排查。

Q:如何快速定位是网络问题还是服务问题?

A:先在服务端本地尝试连接(localhost),如果本地可以连但远程不行,那基本就是网络问题。如果本地也连不上,那可能是服务本身的问题。

Q:配置变更后需要重启服务吗?

A:大部分配置变更都需要重启服务才能生效。有些框架支持热加载,但为了保险起见,建议修改配置后都重启一下服务。

Q:如何避免类似问题再次发生?

A:建议建立配置变更管理流程,所有配置变更都需要记录、通知、验证。同时可以使用配置中心来集中管理配置。

总结

“连接被拒绝”是一个看似简单但排查起来可能很复杂的问题。本文记录了一次完整的排查过程,重点在于:

  1. 先确认服务本身是否正常运行
  2. 再排查网络连通性
  3. 最后检查配置文件是否正确

希望这篇文章能帮到你。如果有问题,欢迎在评论区讨论。


作者:小六,一个在上海努力搬砖的程序员

Author:Margrop
Link:http://blog.margrop.com/post/2026-02-27-troubleshooting-connection-refused/
版权声明:本文采用 CC BY-NC-SA 3.0 CN 协议进行许可