linux网络开发者定位问题、常用工具和命令总结

Linux网络开发者面临的问题往往比较复杂,因此需要使用一些工具和命令来进行定位和解决。在本篇博客中,我将总结一些常用的Linux网络开发者工具和命令,包括网络包观测、各层网络状况快速诊断、网络关键统计计数收集、性能诊断、问题复现等方面的命令总结。

分类 命令、工具 作用 备注
包观测

tcpdump

用于抓取网络数据包。通过 tcpdump 命令可以捕获网络数据包,并进行分析和诊断。

wireshark&&tshark

分析网络数据包。

wireshark可视化分析,tshark命令行分析。

tcpflow

用于抓取 TCP 流量并保存到文件。通过 tcpflow 命令可以捕获 TCP 流量,并将每个 TCP 连接的数据保存到不同的文件中。

比如可以快速将每个连接的包分发到不同文件保存。

ngrep

用于过滤和显示网络数据包。通过 ngrep 命令可以过滤和显示满足特定条件的数据包。

比如快速过滤http GET和POST请求。

快速验证各层网络情况

ping

用于测试主机之间是否能够互相通信。通过向目标主机发送 ICMP 报文,可以确定网络连接是否正常。

检查ip层是否ok。

telnet

用于远程登录和测试网络服务。通过 telnet 命令可以远程登录主机、测试网络服务是否可用,并进行交互式操作。

检查tcp握手是否ok。

curl

用于从命令行发送 HTTP 请求。通过 curl 命令可以发送 GET、POST 等 HTTP 请求,并查看服务器返回的响应。

检查http是否ok。

openssl

OpenSSL 是一个常用的加密工具库,可以用来实现 SSL/TLS 通信、数字证书签发和管理、密码学算法等功能。

检查ssl握手情况,证书内容等。

网络路径状况查看

traceroute

用于确定数据包从一个主机到另一个主机所经过的路由路径。

mtr

用于网络故障定位和性能分析。mtr 命令可以连续发送 ICMP 报文,并在每一跳的路由器上进行网络延迟和丢包率的统计,用于找出网络故障的根源。

网络状态和计数查看

netstat

用于查看网络连接、路由表、网络接口状态等信息。通过 netstat 命令可以了解当前系统的网络状况。

ss

ss 命令是 netstat 的替代品,用于查看网络连接状态、监听端口、网络接口等信息。与 netstat 不同的是,ss 命令提供了更快的速度和更多的选项。

ifconfig

用于查看和配置网络接口。通过 ifconfig 命令可以查看网络接口的 IP 地址、MAC 地址、网络状态等信息。

ip

配置和管理网络接口、路由表、ARP 缓存和其他网络相关的属性。

curl cip.cc

查看网络出口地址。

ethtool

用于查看和配置网络接口的驱动程序。通过 ethtool 命令可以查看网络接口的状态、速度、双工模式等信息,并进行网络性能调优。

iftop

用于实时监控网络流量。iftop 命令可以显示每个网络接口的实时流量、连接数、连接速度等信息,用于快速诊断网络瓶颈和流量异常。

nethogs

用于查看进程占用的网络带宽。通过 nethogs 命令可以查看每个进程占用的网络带宽、连接数和流量等信息,用于找出网络资源占用高的进程。

dns相关

nslookup

用于查询 DNS 服务器上的主机名和 IP 地址信息。通过 nslookup 命令可以查看主机名对应的 IP 地址、反向 DNS 解析等信息。

dig 

查询 DNS 服务器上的主机名和 IP 地址信息。与 nslookup 不同的是,dig 命令提供了更多的选项和功能。

系统异常查看

dmesg

用于查看内核日志。通过 dmesg 命令可以查看系统内核的日志信息,包括硬件检测、设备驱动加载等信息,用于排查和分析系统硬件和驱动问题。

比如oom、segment fault都可以在这里面看到相应的记录。

systemctl

用于管理 systemd 服务。通过 systemctl 命令可以启动、停止、重启和查询 systemd 服务的状态,用于排查和处理系统服务异常问题。

journalctl

用于查看系统日志。通过 journalctl 命令可以查看系统日志、过滤日志信息、按时间戳或者进程名等条件搜索日志信息,用于排查和分析系统异常和错误。

内存异常

valgrind

检查程序在运行时的内存访问错误、泄漏等问题。 无需修改代码

asan

可以检测常见的内存安全问题,例如缓冲区溢出、使用未初始化的内存等。

性能定位

top

实时监控系统 CPU、内存、进程等资源的使用情况,用于找出系统资源占用高的进程。

看出是用户态高还是内核态高,是否是io高等。

vmstat

用于显示系统虚拟内存(VM)的使用情况。它提供了对系统内存、进程、CPU 等性能数据的实时监控。

可快速看出上下文切换次数。

pidstat

进程级别统计cpu、io、上下文切换等信息。

看出上下文切换中自愿切换和非自愿切换次数。

sar

监测 CPU 使用率、磁盘 I/O、网络流量、内存使用情况、进程活动等多个方面的数据,并将这些数据保存到本地或远程系统中,以供后续分析和处理。

可快速统计流量。

perf

可以用于测量和分析系统各个方面的性能数据,包括 CPU、内存、磁盘、网络等方面的数据。

cpu采样一把好手,看哪些函数是高频出现。还可以结合其他工具生成火焰图。

pprof

用于分析 Go 应用程序性能的工具,可以分析 CPU、内存和代码分布等方面的性能问题。

go语言专用更强大的采样工具。

strace

用于跟踪进程的系统调用和信号。

bpftrace

动态跟踪工具,它使用 BPF(Berkeley Packet Filter)技术来实现高效的内核和用户空间跟踪功能。

比如打印某个函数的系统调用栈和用户空间调用栈。脚本的方式使用ebpf工具。

bcc

基于 BPF(Berkeley Packet Filter)技术的动态跟踪和性能分析工具集,主要用于 Linux 系统的内核和用户空间程序分析。

比bpftrace更灵活。

网络场景构造

iptables

用于设置和管理 Linux 内核的防火墙。通过 iptables 命令可以设置网络连接的规则、过滤数据包、进行网络地址转换等操作。

可以对特定特征进行丢包,转换。

tc

流量控制、网络流量调度和队列管理的工具,可用于实现各种 QoS(Quality of Service)和网络流量控制功能

比如对特定流量增加丢包率、时延等。

postman

一款流行的 API 测试工具,可以帮助开发人员快速创建、测试、调试和共享 API。

流量复制和重放

goreplay

一个 HTTP 实时流量复制工具。支持流量的放大、缩小,频率限制,还支持把请求记录到文件,方便回放和分析,也支持和 ElasticSearch 集成。

tcpreplay

一种 pcap 包的重放工具,它可以将用 ethreal、wireshark工具抓下来的包原样或经过任意修改后重放回去。它允许你对报文做任意的修改指定重放报文的速度等,这样tcpreplay 就可以用来复现抓包的情景以定位 bug,以极快的速度重放从而实现压力测试。

tcpcopy

一种请求复制工具 ,通过复制在线数据包,修改 TCP/IP 头部信息,发送给测试服务器,达到欺骗测试服务器的TCP 程序的目的。

性能压测

iperf

用于测试网络带宽和性能。通过 iperf 命令可以在两个主机之间进行带宽测试和性能测试,用于评估网络的实际性能。

适合传输层压测、带宽压测等场景。

ApacheBench (ab)

一个基于 Apache HTTP 服务器的性能测试工具,用于测试 Web 服务器的负载能力

适合应用层压测。

wrk

一个高性能的 HTTP 压力测试工具,支持多线程和支持 Lua 脚本扩展。

stress

一个简单但功能强大的 Linux 压力测试工具,可以测试 CPU、内存、I/O、网络等方面的性能。

在我的公众号中有一篇文章—怎样进行问题定位,总结了开发者定位问题的方法论。熟悉工具和命令只能帮我们快速收集信息和对假设做出验证。除了熟悉工具,更重要的是具备过硬的基础知识、熟悉代码流程,并懂什么时候收集什么信息,然后将这些命令和工具熟练的应用到工作中。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注