mysql连接测试不成功的原因有哪些
263
2022-11-28
【Linux云计算架构:第三阶段-Linux高级运维架构】第13章——CPU-内存-IO-网络调优
本节所讲内容: 12.1 有关CPU的调优 12.2 有关内存的调优 12.3 有关I/O的调优 12.4 有关网络的调优 12.5 有关内核参数的调优
12.1 关于CPU 中央处理器调优
12.1.1 CPU处理方式:
1. 批处理,顺序处理请求。(切换次数少,吞吐量大)2. 分时处理。(如同"独占",吞吐量小)(时间片,把请求分为一个一个的时间片,一片一片的分给CPU处理)我们现在使用x86就是这种架构3. 实时处理
例:
批处理——以前的大型机(Mainframe)上所采用的系统,需要把一批程序事先写好(打孔纸带),然后计算得出结果 分时——现在流行的PC机和服务器都是采用这种运行模式,即把CPU的运行分成若干时间片分别处理不同的运算请求实时——一般用于单片机上,比如电梯的上下控制,对于按键等动作要求进行实时处理
12.1.2 查看CPU一分钟有多个切换多少次。 查看内核一秒钟中断CPU次数:
[root@xuegod63 ~]# grep HZ /boot/config-3.10.0-693.el7.x86_64 CONFIG_NO_HZ=y# CONFIG_HZ_100 is not set# CONFIG_HZ_250 is not set# CONFIG_HZ_300 is not setCONFIG_HZ_1000=yCONFIG_HZ=1000 #1秒钟有1000次中断注: 此文件/boot/config-3.10.0-693.el7.x86_64 是编译内核的参数文件
12.1.3 调整进程优先级使用更多CPU 调整进程nice值,让进程使用更多的CPU
优先级控制:nice值 #范围, -20 ~ 19 越小优先级越高 普通用户0-19 作用:以什么优先级运行进程 。默认优先级是0语法: nice -n 优先级数字 命令
例:
# nice -n -5 vim a.txt # vim进程以-5级别运行
查看:
ps -axu | grep a.txt[root@xuegod63 ~]# ps -axu | grep a.txtWarning: bad syntax, perhaps a bogus '-'? See /usr/share/doc/procps-3.2.8/FAQroot 24318 0.0 0.2 143624 3280 pts/4 S+ 17:00 0:00 vim b.txt[root@xuegod63 ~]# top -p 24318 PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND 24129 root 15 -5 140m 3336 2200 S 0.0 0.3 0:00.08 vim
renice #修改正在运行的进程的优先级 #renice -n 5 PID #修改进程优先级 例:
#renice -n 5 24318[root@xuegod63 ~]# top -p 24318 PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND 24129 root 15 5 140m 3336 2200 S 0.0 0.3 0:00.08 vim
检测一下范围: -20 - 19
[root@xuegod63 ~]# renice -n -21 2412924129: old priority 5, new priority -20[root@xuegod63 ~]# renice -n 20 2412924129: old priority -20, new priority 19
12.1.4 CPU亲和力
taskset 作用:在多核情况下,可以认为指定一个进程在哪颗CPU上执行程序,减少进程在不同CPU之前切换的开销
安装:
[root@xuegod63 ~]# rpm -qf `which taskset `util-linux-2.23.2-43.el7.x86_64
语法: taskset -c N 命令 例1:本机是4核CPU ,指定vim命令在第一个CPU上运行
[root@xuegod63 ~]# taskset -c 0 vim a.txt #1号CPU ID是0[root@xuegod63 ~]# ps -axu | grep vimWarning: bad syntax, perhaps a bogus '-'? See /usr/share/doc/procps-3.2.8/FAQroot 2614 1.3 0.2 143696 3332 pts/0 S+ 18:39 0:00 vim a.txt[root@xuegod63 ~]# taskset -p 2614 # -p 要查看的进程IDpid 2614's current affinity mask: 1 #CPU亲和力掩码,1代表第一个CPU核心
例2:查sshd进程运行在哪几个CPU上
[root@xuegod63 ~]# ps -axu | grep sshdWarning: bad syntax, perhaps a bogus '-'? See /usr/share/doc/procps-3.2.8/FAQroot 2030 0.0 0.0 64068 1140 ? Ss 18:26 0:00 /usr/sbin/sshd [root@xuegod63 ~]# taskset -p 2030pid 2030's current affinity mask: f #说明sshd在4颗CPU上随机进行切换。
说明:
Cpu ID 号码,对应的16进制数为: CPU ID: 7 6 5 4 3 2 1 0对应的10数为: 128 64 32 16 8 4 2 1
当前, 我的系统中cpu ID 的为(0,1,2,3)
pid 2030's current affinity mask: f的值为cpu ID 16进制的值的和(1+2+4+8=f),转换成二进制为:1111 这个说明了(pid=2030)的这个sshd进程工作在cpu ID 分别为0,1,2,3这个四个cpu上面的切换。注: 我们的CPU是4核心,所以taskset -c后可以跟: 0,1,2,3
例:指定vim c.txt 程序运行在第2和第4个CPU上
[root@xuegod63 ~]# taskset -c 1,3 vim b.txt[root@xuegod63 ~]# ps -axu | grep vimWarning: bad syntax, perhaps a bogus '-'? See /usr/share/doc/procps-3.2.8/FAQroot 6314 1.5 0.2 143612 3280 pts/1 S+ 14:41 0:00 vim b.txtroot 6317 0.0 0.0 103300 848 pts/2 S+ 14:41 0:00 grep vim[root@xuegod63 ~]# taskset -p 6314 pid 6314's current affinity mask: a # a为十进制的10=2+8 注:在哪个CPU上运行,那一位就赋为1 。
12.1.5 CPU 性能监控
理解运行队列,利用率,上下文切换对怎样CPU 性能最优化之间的关系,早期提及到性能是相对于基准线数据的,在一些系统中,通常预期所达到的性能包括:Run Queues 每个处理器应该运行队列不超过13 个线程.
例如: 一个双核处理器应该运行队列不要超过6 个
注:有两个特殊的进程永远在运行队列中待着:当前进程和空进程idle。
12.1.6 CPU 利用率比例分配:
如果一个CPU 被充分使用,利用率分类之间均衡的比例应该是65% 70% User Time #用户态30% 35% System Time #内核态0% 5% Idle Time #空闲Context Switches 上下文切换的数目直接关系到CPU 的使用率,如果CPU 利用率保持在上述均衡状态时,有大量的上下文切换是正常的。
实例1:持续的CPU 利用率 在这个例子中,这个系统的CPU被充分利用
[root@xuegod63 ~]# vmstat 1 10 # 本机为单核CPU,执行vmstat显示以下内容procs --------memory---------- ---swap-- -----io---- --system-- -----cpu----- r b swpd free buff cache si so bi bo in cs us sy id wa st 3 0 0 130644 86244 609860 0 0 4 1 531 25 0 0 20 0 0 4 0 0 130620 86244 609860 0 0 0 0 638 62 0 0 14 0 02 0 0 130620 86244 609860 0 0 0 0 658 62 0 0 13 0 04 0 0 130620 86244 609860 0 0 0 0 688 62 0 0 11 0 0
注:根据观察值,我们可以得到以下结论:
1、有大量的中断(in) 和较少的上下文切换(cs)。这意味着一个单一的进程正在大量使用cpu2、进一步显示某单个应用,user time(us) 经常在86%或者更多。执行top -》按P-》查看使用CPU最多的进程3、运行队列还在可接受的性能范围内,其中有2个地方,是超出了允许限制.
实例2:超负荷调度
在这个例子中,内核调度中的上下文切换处于饱和# vmstat 1 #通过查看vmstat输出结果,分析当前系统中出现的问题procs memory swap io system cpur b swpd free buff cache si so bi bo in cs us sy wa id2 1 207740 98476 81344 180972 0 0 2496 0 900 2883 4 12 57 270 1 207740 96448 83304 180984 0 0 1968 328 810 2559 8 9 83 00 1 207740 94404 85348 180984 0 0 2044 0 829 2879 9 6 78 70 1 207740 92576 87176 180984 0 0 1828 0 689 2088 3 9 78 102 0 207740 91300 88452 180984 0 0 1276 0 565 1282 7 6 83 43 1 207740 90124 89628 180984 0 0 1176 0 551 1229 2 7 91 0
根据观察值,我们可以得到以下结论:
1、上下文切换数目高于中断数目,说明kernel中相当数量的时间都开销在:上下文切换线程.2、大量的上下文切换将导致CPU 利用率不均衡,很明显实际上等待io 请求的百分比(wa)非常高,以及user time百分比非常低(us). 说明磁盘比较慢,磁盘是瓶颈3、因为CPU 都阻塞在IO请求上,所以运行队列里也有相当数个的可运行状态线程在等待执行.
12.2 有关内存的调优
12.2.1内存调优相关内容:
关于内存,一般情况不用调优,我们在这里分析一些情况:BUFFER inode节点索引缓存 缓存 写时用,先写入到内存CACHE block块/页缓存 快取 读时用,先读入到内存buffers #缓存从磁盘读出的内容 ,这种理解是片面的cached #缓存需要写入磁盘的内容 ,这种理解是片面的
例1:
终端1: free -h 或:vmstat终端2:find / 终端1:free -m #查看 buffer 增长
例2:
终端1: free -m或:vmstat终端2: grep aaaa / -R终端1:free -m #查看 CAHCE 增长
.
CACHE:页缓存,内存页 一页尺寸 4KB对象文件系统 块block 1kB 2kB 4kB扇区sectors 512b
12.2.2 手动清空buffer+cache :
[root@xuegod63 ~]# cat /proc/sys/vm/drop_caches #默认是 00[root@xuegod63 ~]# free -m[root@xuegod64 ~]# free total used free shared buff/cache availableMem: 999720 290728 367972 7396 341020 495424Swap: 2097148 0 2097148[root@apache ~]# sync # 把内存中的数据写入磁盘[root@xuegod63 ~]# echo 1 > /proc/sys/vm/drop_caches[root@xuegod63 ~]# free -m total used free shared buff/cache availableMem: 976 283 484 7 208 495Swap: 2047 0 2047
12.3 I/O调优 相关内容
12.3.1 资源限制
限制用户资源配置文件:/etc/security/limits.conf[root@xuegod63 ~]# vim /etc/security/limits.conf每行的格式: 用户名/@用户组名 类型(软限制/硬限制) 选项 值
通常我们在服务器上需要开放的内容:
实例1: 永久修改一个进程可以打开的最大文件数
vim /etc/security/limits.conf #在最添加:* soft nofile 1024000* hard nofile 1024000注:soft是一个警告值,而hard则是一个真正意义的阀值,超过就会报错。soft一定要比hard小。最大打开的文件数(以文件描叙符,file descripter计数)
2、启动系统:
reboot #永久生效的缺点,必须重启系统
3、检查:
root@xuegod63 ~]# ulimit -n1024000[root@xuegod63 ~]# useradd kill #以普通用户登录,测试[root@xuegod63 ~]# su - kill[mkkk@xuegod63 ~]$ ulimit -n1024000
方法二:#临时修改
[root@xuegod63 ~]# ulimit -n 10000 [root@xuegod63 ~]# ulimit -n10000说明:/etc/security/limits.conf 是模块pam_limits.so的配置文件。
pam相关配置文件:
/lib64/security/ #pam模块所在目录/etc/security/ #pam每个模块的配置文件/etc/pam.d/ #使用pam功能的服务和应用程序的配置文件说明:查看系统中哪些应用程序和服务使用了:pam_limits.so 模块[root@xuegod63 ~]# grep pam_limits.so /etc/pam.d/ -R。。。/etc/pam.d/system-auth:session required pam_limits.so
例2:nproc #用户可以打开的最大进程数
[root@xuegod63 ~]# vim /etc/security/limits.d/90-nproc.conf #RHEL6 必须这个文件中配置改:* soft nproc 10240为:* soft nproc 66666* hard nproc 66666 [root@xuegod63 ~]# reboot #最好重启一下[root@xuegod63 ~]# ulimit -u66666
或: 再打一个终端,直接查看
[root@xuegod63 ~]# ulimit -u66666
临时:
[root@xuegod63 ~]# ulimit -u 60000[root@xuegod63 ~]# ulimit -u60000注:默认用户可用的最大进程数量1024.这样以apache用户启动的进程就数就不能大于1024了。[root@apache ~]# ulimit -acore file size (blocks, -c) 0 kdump转储功能打开后产生的core file大小限制data seg size (kbytes, -d) unlimited 数据段大小限制scheduling priority (-e) 0file size (blocks, -f) unlimited 文件大小限制pending signals (-i) 27955max locked memory (kbytes, -l) 32max memory size (kbytes, -m) unlimitedopen files (-n) 1024 打开的文件个数限制pipe size (512 bytes, -p) 8 管道大小的限制POSIX message queues (bytes, -q) 819200 消息队列大小real-time priority (-r) 0stack size (kbytes, -s) 10240 栈大小cpu time (seconds, -t) unlimited CPU时间使用限制max user processes (-u) 27955 最大的用户进程数限制virtual memory (kbytes, -v) unlimited 虚拟内存限制 file locks (-x) unlimited
测试硬盘速度: 安装:
[root@xuegod64 ~]# yum -y install hdparm[root@xuegod64 ~]# hdparm -T -t /dev/sda/dev/sda: Timing cached reads: 3850 MB in 2.00 seconds = 1926.60 MB/sec#2秒中直接从内存的 cache读取数据的速度读 3850 MB。 平均1926.60 MB/sec Timing buffered disk reads: 50 MB in seconds = 13.17 MB/sec#3.80秒中从硬盘缓存中读 50 MB。 seconds = 13.17 MB/sec
参数:
-t perform device read timings #不使用预先的数据缓冲, 标示了Linux下没有任何文件系统开销时磁盘可以支持多快的连续数据读取.-T perform cache read timings #直接从内存的 cache读取数据的速度。实际上显示出被测系统的处理器缓存和内存的吞吐量.
测试硬盘写命令: dd
在使用前首先了解两个特殊设备 /dev/null 伪设备,回收站.写该文件不会产生IO开销 /dev/zero 伪设备,会产生空字符流,读该文件不会产生IO开销
测试方法: a.测试磁盘的IO写速度
[root@xuegod64 ~]# dd if=/dev/zero of=/test.dbf bs=8k count=30003000+0 records in3000+0 records out24576000 bytes (25 MB) copied, 1.04913 s, 23.4 MB/s可以看到,在1.1秒的时间里,生成25M的一个文件,IO写的速度约为122.6MB/sec;当然这个速度可以多测试几遍取一个平均值,符合概率统计.
time 命令: 执行命令并计时
[root@xuegod64 ~]# time dd if=/dev/zero of=/test.dbf bs=8k count=30003000+0 records in3000+0 records out24576000 bytes (25 MB) copied, 1.04913 s, 23.4 MB/sreal 0m1.061s 12:00 出去吃饭user 0m0.002s 路上 20分sys 0m0.770s 吃10分钟
注释:
1)实际时间(real time): 从command命令行开始执行到运行终止的消逝时间;2)用户CPU时间(user CPU time): 命令执行完成花费的用户CPU时间,即命令在用户态中执行时间总和;3)系统CPU时间(system CPU time): 命令执行完成花费的系统CPU时间,即命令在核心态中执行时间总和。
其中,用户CPU时间和系统CPU时间之和为CPU时间,即命令占用CPU执行的时间总和。实际时间要大于CPU时间,因为Linux是多任务操作系统,往往在执行一条命令时,系统还要处理其它任务。排队时间没有算在里面。 另一个需要注意的问题是即使每次执行相同命令,但所花费的时间也是不一样,其花费时间是与系统运行相关的。
12.4 网络相关调优
12.4.1 网卡绑定技术
/双线冗余
功能
\带宽增备100M/8 = 12.5MByte/s
Bonding技术 什么是网卡绑定及简单原理 网卡绑定也称作"网卡捆绑",就是使用多块物理网卡虚拟成为一块网卡,以提供负载均衡或者冗余,增加带宽的作用。当一个网卡坏掉时,不会影响业务。这个聚合起来的设备看起来是一个单独的以太网接口设备,也就是这几块网卡具有相同的IP地址而并行链接聚合成一个逻辑链路工作。这种技术在Cisco等网络公司中,被称为Trunking和Etherchannel 技术,在Linux的内核中把这种技术称为bonding。
12.4.2 技术分类
1. 负载均衡 对于bonding的网络负载均衡是我们在文件服务器中常用到的,比如把三块网卡,当做一块来用,解决一个IP地址,流量过大,服务器网络压力过大的问题。为了解决同一个IP地址,突破流量的限制,**毕竟网线和网卡对数据的吞吐量是有限制的。**如果在有限的资源的情况下,实现网络负载均衡,最好的办法就是 bonding。
2. 网络冗余 对于服务器来说,网络设备的稳定也是比较重要的,特别是网卡。在生产型的系统中,网卡的可靠性就更为重要了。在生产型的系统中,大多通过硬件设备的冗余来提供服务器的可靠性和安全性,比如电源。bonding 也能为网卡提供冗余的支持。把多块网卡绑定到一个IP地址,当一块网卡发生物理性损坏的情况下,另一块网卡自动启用,并提供正常的服务,
即:默认情况下只有一块网卡工作,其它网卡做备份。
12.4.3 实战:配置多网卡绑定技术 RHEL 7 配置环境: xuegod63 配置两双网卡,网卡ens33和ens37都桥接
添加网卡:
[root@xuegod63 ~]# cd /etc/sysconfig/network-scripts/ [root@xuegod63 network-scripts]# ls ifcfg-ens3*ifcfg-ens33 ifcfg-ens37
12.4.3 双网卡绑定目标
网卡绑定模式:active-backup - 主备模式一个网卡处于活跃状态,另一个处于备份状态,所有流量都在主链路上处理,当活跃网卡down掉时,启用备份网卡。绑定网卡:ens33+ens37=bond0设置网卡ens33为主网卡(优先处于活跃状态),ens37为辅网卡(备份状态,主网卡链路正常时,辅网卡处于备份状态)。
12.4.5 双网卡绑定步骤: 查看物理网卡信息:
[root@xuegod63 ~]# nmcli device设备 类型 状态 连接 virbr0 bridge 连接的 virbr0 ens33 ethernet 连接的 ens33 ens37 ethernet 连接的 ens37[root@xuegod63 ~]# nmcli connection show名称 UUID 类型 设备 ens33 7cd11800-7199-4cae-8927-ec49303cfe52 802-3-ethernet ens33 ens37 605551ec-6f72-368f-a5f5-cf2ae3fedd45 802-3-ethernet ens37
12.4.6 删除网卡连接信息: 本次Network bonding配置中,需要将ens33和ens37绑定为bond0,并且设置ens33为主网卡,首先需要这两块网卡现有的配置信息,否则team0创建完成后,未删除的网卡配置信息会影响bond0的正常工作。 如果nmcli connection show命令输出中无将要进行配置的网卡连接信息,则无需进行删除操作。
[root@xuegod63 network-scripts]# nmcli connection delete ens33成功删除连接 'ens33'(7cd11800-7199-4cae-8927-ec49303cfe52)。[root@xuegod63 network-scripts]# nmcli connection delete ens37成功删除连接 'ens37'(605551ec-6f72-368f-a5f5-cf2ae3fedd45)。[root@xuegod63 network-scripts]# nmcli connection show名称 UUID 类型 设备 virbr0 0c6bda20-636e-4555-a5eb-10ebffc43c38 bridge virbr0 有线连接 1 33136afd-2e13-310d-9c9d-cf4858545cf0 802-3-ethernet ens33 有线连接 2 3b9c673a-53eb-3f0c-91ae-1b63015ec734 802-3-ethernet ens37网卡连接信息删除成功。
说明: 这里删除的其实就是/etc/sysconfig/network-scripts目录下两块网卡的配置文件
[root@xuegod63 network-scripts]# pwd/etc/sysconfig/network-scripts[root@xuegod63 network-scripts]# ls ifcfg-*ifcfg-lo[root@xuegod63 network-scripts]# nmcli connection add type bond ifname bond0 con-name bond0 miimon 100 mode active-backup primary ens33 ip4 192.168.1.63/24连接“bond0”(d558d571-3171-4a8d-b71c-2ff04aca68c1) 已成功添加。
注解:
primary ens33:指定主网卡为ens33mode active-backup:指定bonding模式为active-backup(主动备份)miimon 100:以毫秒为单位指定 MII 链接监控的频率(默认为0,即关闭此功能;配置miimon参数时,最好从100开始)。bonding内核模块必须在ifcfg-bondN中的BONDING_OPTS="bonding parameters"中指定,各参数间使用空格分隔,不要在/etc/modprobe.d/bonding.conf和已经弃用的/etc/modprobe.conf文件中指定bonding配置选项。
配置完成后,此时会在/etc/sysconfig/network-scripts目录下生成ifcfg-bond0的配置文件:
[root@xuegod63 network-scripts]# cat ifcfg-bond0DEVICE=bond0BONDING_OPTS="miimon=100 mode=active-backup primary=ens33"TYPE=BondBONDING_MASTER=yesPROXY_METHOD=noneBROWSER_ONLY=noBOOTPROTO=noneIPADDR=192.168.0.63PREFIX=24DEFROUTE=yesIPV4_FAILURE_FATAL=noIPV6INIT=yesIPV6_AUTOCONF=yesIPV6_DEFROUTE=yesIPV6_FAILURE_FATAL=noIPV6_ADDR_GEN_MODE=stable-privacyNAME=bond0UUID=d558d571-3171-4a8d-b71c-2ff04aca68c1ONBOOT=yes
12.4.7 创建bond0子接口: 将网卡ens33和ens37创建为bond0的子接口: 添加网卡ens33:设备类型:bond-slave;连接名称:bond0-p1;master:bond0
[root@xuegod63 network-scripts]# nmcli connection add type bond-slave ifname ens33 con-name bond0-p1 master bond0连接“bond0-p1”(fd76468d-a644-4f5f-855f-fbbc859f440a) 已成功添加。添加网卡ens37:设备类型:bond-slave;连接名称:bond0-p2;master:bond0[root@xuegod63 network-scripts]# nmcli connection add type bond-slave ifname ens37 con-name bond0-p2 master bond0连接“bond0-p2”(39d983d3-1549-4fc0-bc4b-392d52a8e24e) 已成功添加。[root@xuegod63 network-scripts]# cat ifcfg-bond0-p1TYPE=EthernetNAME=bond0-p1UUID=fd76468d-a644-4f5f-855f-fbbc859f440aDEVICE=ens33ONBOOT=yesMASTER=bond0SLAVE=yes[root@xuegod63 network-scripts]# cat ifcfg-bond0-p2TYPE=EthernetNAME=bond0-p2UUID=39d983d3-1549-4fc0-bc4b-392d52a8e24eDEVICE=ens37ONBOOT=yesMASTER=bond0SLAVE=yes
12.4.8 激活bond0及其子接口: 查看当前已激活的网络接口:
[root@xuegod63 network-scripts]# nmcli connection show --active名称 UUID 类型 设备 bond0 d558d571-3171-4a8d-b71c-2ff04aca68c1 bond bond0 virbr0 0c6bda20-636e-4555-a5eb-10ebffc43c38 bridge virbr0 有线连接 1 33136afd-2e13-310d-9c9d-cf4858545cf0 802-3-ethernet ens33 有线连接 2 3b9c673a-53eb-3f0c-91ae-1b63015ec734 802-3-ethernet ens37如果bond0-p1、bond0-p2、bond0没有激活,可使用下面命令进行激活:[root@xuegod63 network-scripts]# nmcli connection up bond0-p1连接已成功激活(D-Bus 活动路径:/org/freedesktop/NetworkManager/ActiveConnection/9)[root@xuegod63 network-scripts]# nmcli connection up bond0-p2连接已成功激活(D-Bus 活动路径:/org/freedesktop/NetworkManager/ActiveConnection/10)[root@xuegod63 network-scripts]# nmcli connection up bond0成功激活(主服务器等待从服务器)连接(D-Bus 激活路径:/org/freedesktop/NetworkManager/ActiveConnection/11)
12.4.9 查看bond0当前状态:
[root@xuegod63 network-scripts]# cd /proc/net/bonding/[root@xuegod63 bonding]# lsbond0[root@xuegod63 bonding]# cat bond0 Ethernet Channel Bonding Driver: v3.7.1 (April 27, 2011)Bonding Mode: fault-tolerance (active-backup)Primary Slave: ens33 (primary_reselect always)Currently Active Slave: ens33 //当前所使用的接口MII Status: upMII Polling Interval (ms): 100Up Delay (ms): 0Down Delay (ms): 0Slave Interface: ens33 //从接口MII Status: up //状态为开启Speed: 1000 MbpsDuplex: fullLink Failure Count: 0Permanent HW addr: 00:0c:29:72:33:dbSlave queue ID: 0Slave Interface: ens37 //从接口MII Status: upSpeed: 1000 MbpsDuplex: fullLink Failure Count: 0Permanent HW addr: 00:0c:29:72:33:e5Slave queue ID: 0
12.4.10 bonding切换测试:
[root@xuegod63 bonding]# ping 192.168.1.1PING 192.168.0.1 (192.168.0.1) 56(84) bytes of data.64 bytes from 192.168.0.1: icmp_seq=1 ttl=64 time=2.35 ms64 bytes from 192.168.0.1: icmp_seq=2 ttl=64 time=1.41 ms64 bytes from 192.168.0.1: icmp_seq=3 ttl=64 time=1.01 ms[root@xuegod63 bonding]# nmcli connection down bond0-p1成功取消激活连接 'bond0-p1'(D-Bus 活动路径:/org/freedesktop/NetworkManager/ActiveConnection/12)[root@xuegod63 bonding]# ping 192.168.1.1 //停止了bond0-p1,仍然可以Ping通过PING 192.168.0.1 (192.168.0.1) 56(84) bytes of data.64 bytes from 192.168.0.1: icmp_seq=1 ttl=64 time=0.922 ms64 bytes from 192.168.0.1: icmp_seq=2 ttl=64 time=0.604 ms64 bytes from 192.168.0.1: icmp_seq=3 ttl=64 time=0.551 ms
停止bond0-p1网卡,再次查看bond0状态:
[root@xuegod63 bonding]# cat bond0 Ethernet Channel Bonding Driver: v3.7.1 (April 27, 2011)Bonding Mode: fault-tolerance (active-backup)Primary Slave: NoneCurrently Active Slave: ens37 //原来的接口为ens33,目前变为ens37MII Status: upMII Polling Interval (ms): 100Up Delay (ms): 0Down Delay (ms): 0Slave Interface: ens37MII Status: upSpeed: 1000 MbpsDuplex: fullLink Failure Count: 0Permanent HW addr: 00:0c:29:72:33:e5Slave queue ID: 0
说明: 以上是直接停止bond0-p1接口,如果是直接在虚拟机中断开网卡的连接,那么在bond0信息中则会看到bond0-p1为down的信息
[root@xuegod63 bonding]# nmcli connection up bond0-p1 //再次启动bond0-p1接口连接已成功激活(D-Bus 活动路径:/org/freedesktop/NetworkManager/ActiveConnection/15)[root@xuegod63 bonding]# cat bond0Ethernet Channel Bonding Driver: v3.7.1 (April 27, 2011)Bonding Mode: fault-tolerance (active-backup)Primary Slave: ens33 (primary_reselect always)Currently Active Slave: ens33 //此时的ens33成为了当前使用的接口MII Status: upMII Polling Interval (ms): 100Up Delay (ms): 0Down Delay (ms): 0Slave Interface: ens37MII Status: upSpeed: 1000 MbpsDuplex: fullLink Failure Count: 0Permanent HW addr: 00:0c:29:72:33:e5Slave queue ID: 0Slave Interface: ens33MII Status: upSpeed: 1000 MbpsDuplex: fullLink Failure Count: 0Permanent HW addr: 00:0c:29:72:33:dbSlave queue ID: 0
12.4.11 添加网关:
[root@xuegod63 network-scripts]# vim ifcfg-bond0GATEWAY=192.168.0.1[root@xuegod63 network-scripts]# service network restartRestarting network (via systemctl): [ 确定 ][root@xuegod63 network-scripts]# route -nKernel IP routing tableDestination Gateway Genmask Flags Metric Ref Use Iface0.0.0.0 192.168.0.1 0.0.0.0 UG 300 0 0 bond0192.168.0.0 0.0.0.0 255.255.255.0 U 300 0 0 bond0192.168.122.0 0.0.0.0 255.255.255.0 U 0 0 0 virbr0
12.4.12 添加DNS:
[root@xuegod63 bonding]# vim /etc/resolv.confnameserver 114.114.114.114[root@xuegod63 network-scripts]# curl -I baidu.comHTTP/1.1 200 OKServer: bfe/1.0.8.18Date: Thu, 18 Jan 2018 17:00:30 GMTContent-Type: text/htmlContent-Length: 277Last-Modified: Mon, 13 Jun 2016 02:50:04 GMTConnection: Keep-AliveETag: "575e1f5c-115"Cache-Control: private, no-cache, no-store, proxy-revalidate, no-transformPragma: no-cacheAccept-Ranges: bytes
12.5 网络内核相关参数调优
12.5.1 TCP 连接三次握手相关
Client ------------------------- ServerSYNSYN+ACKACK
1.抵御SYN SYN攻击是利用TCP/IP协议3次握手的原理,发送大量的建立连接的网络包,但不实际建立连接,最终导致被攻击服务器的网络队列被占满,无法被正常用户访问。
原理图:
SYN Flood是当前最流行的DoS(拒绝服务攻击)与DDoS(分布式拒绝服务攻击)的方式之一,这是一种利用TCP协议缺陷,发送大量伪造的TCP连接请求,常用假冒的IP或IP段发来海量的请求连接的第一个握手包(SYN包),被攻击服务器回应第二个握手包(SYN+ACK包),因为对方是假冒IP,对方永远收不到包且不会回应第三个握手包。导致被攻击服务器保持大量SYN_RECV状态的“半连接”,并且会重试默认5次回应第二个握手包,塞满TCP等待连接队列,资源耗尽(CPU满负荷或内存不足),让正常的业务请求连接不进来。
解决:
[root@xuegod63 ~]# vim /etc/sysctl.conf #在文件最后添加以下内容net.ipv4.tcp_synack_retries = 0net.ipv4.tcp_syn_retries = 1net.ipv4.tcp_max_syn_backlog = 20480net.ipv4.tcp_syncookies = 1net.ipv4.tcp_tw_reuse = 1net.ipv4.tcp_tw_recycle = 1net.ipv4.tcp_fin_timeout = 10fs.file-max = 819200net.core.somaxconn = 65536net.core.rmem_max = 1024123000net.core.wmem_max = 16777126net.core.netdev_max_backlog = 165536net.ipv4.ip_local_port_range = 10000 65535注:每台服务器上线之前,都应该配置以上内核参数。
最重要参数: 注释:
[root@xuegod63 ~]# cat /proc/sys/net/ipv4/tcp_synack_retries #最关键参数,默认为5,修改为0 表示不要重发 net.ipv4.tcp_synack_retries = 0#表示回应第二个握手包(SYN+ACK包)给客户端IP后,如果收不到第三次握手包(ACK包)后,不进行重试,加快回收“半连接”,不要耗光资源。#作为服务端。回应时,如果连接失败,达到对应的失败数后,停止发送synack包
第一个参数tcp_synack_retries = 0是关键,表示回应第二个握手包(SYN+ACK包)给客户端IP后,如果收不到第三次握手包(ACK包)后,不进行重试,加快回收“半连接”,不要耗光资源。 不修改这个参数,模拟攻击,10秒后被攻击的80端口即无法服务,机器难以ssh登录; 用命令netstat -na |grep SYN_RECV检测“半连接”hold住180秒; 修改这个参数为0,再模拟攻击,持续10分钟后被攻击的80端口都可以服务,响应稍慢些而已,只是ssh有时也登录不上;检测“半连接”只hold住3秒即释放掉。 修改这个参数为0的副作用:网络状况很差时,如果对方没收到第二个握手包,可能连接服务器失败,但对于一般网站,用户刷新一次页面即可。这些可以在高峰期或网络状况不好时tcpdump抓包验证下。 根据以前的抓包经验,这种情况很少,但为了保险起见,可以只在被tcp洪水攻击时临时启用这个参数。 tcp_synack_retries默认为5,表示重发5次,每次等待30~40秒,即“半连接”默认hold住大约180秒。 我们之所以可以把tcp_synack_retries改为0,因为客户端还有tcp_syn_retries参数,默认是5,即使服务器端没有重发SYN+ACK包,客户端也会重发SYN握手包。
[root@xuegod63 ~]# cat /proc/sys/net/ipv4/tcp_syn_retries 1#tcp_syn_retries参数,默认是5,当没有收到服务器端的SYN+ACK包时,客户端重发SYN握手包的次数,注意:在rhel 7中,此项不能调为0[root@xuegod63 ~]# cat /proc/sys/net/ipv4/tcp_max_syn_backlog 20480##半连接队列长度,增加SYN队列长度到20480:加大SYN队列长度可以容纳更多等待连接的网络连接数,具体多少数值受限于内存。
接下来辅助参数:
#系统允许的文件句柄的最大数目,因为连接需要占用文件句柄fs.file-max = 819200#用来应对突发的大并发connect 请求net.core.somaxconn = 65536#最大的TCP 数据接收缓冲(字节)net.core.rmem_max = 1024123000#最大的TCP 数据发送缓冲(字节)net.core.wmem_max = 16777126#网络设备接收数据包的速率比内核处理这些包的速率快时,允许送到队列的数据包的最大数目net.core.netdev_max_backlog = 165536#本机主动连接其他机器时的端口分配范围,比如说,在vsftpd主动模式会用到net.ipv4.ip_local_port_range = 10000 65535注:如果只是开启22端口,是不会使用到ip_local_port_range这个功能[root@xuegod63 ~]# netstat -antup | grep :22tcp 0 0 0.0.0.0:22 0.0.0.0:* LISTEN 1993/sshd tcp 0 0 192.168.1.63:22 192.168.1.23:51855 ESTABLISHED 9316/sshd tcp 0 0 192.168.1.63:22 192.168.1.23:51861 ESTABLISHED 10878/sshd
为了处理大量连接,还需改到另外两个参数: 限制用户资源配置文件:/etc/security/limits.conf
[root@xuegod63 ~]#vim /etc/security/limits.conf #在最添加:* soft nofile 1024000* hard nofile 1024000
例2:nproc #用户可以打开的最大进程数
[root@xuegod63 ~]# vim /etc/security/limits.d/90-nproc.conf #RHEL6 必须这个文件中配置改:* soft nproc 10240为:* soft nproc 66666* hard nproc 66666 [root@xuegod63 ~]# reboot #最好重启一下
次要辅助参数,以上还无法解决syn洪水攻击,把以下内核参数关闭: 注意,以下参数面对外网时,不要打开。因为副作用很明显。
#当出现 半连接 队列溢出时向对方发送syncookies,调大 半连接 队列后没必要net.ipv4.tcp_syncookies = 0#TIME_WAIT状态的连接重用功能net.ipv4.tcp_tw_reuse = 0#时间戳选项,与前面net.ipv4.tcp_tw_reuse参数配合net.ipv4.tcp_timestamps = 0#TIME_WAIT状态的连接回收功能net.ipv4.tcp_tw_recycle = 0[root@xuegod63 ~]# cat /proc/sys/net/ipv4/tcp_syncookies 1#表示开启SYN Cookies。当出现SYN等待队列溢出时,启用cookies来处理,可防范少量SYN攻击,默认为0,表示关闭;[root@xuegod63 ~]# cat /proc/sys/net/ipv4/tcp_tw_reuse 1#表示开启重用。允许将TIME-WAIT sockets重新用于新的TCP连接,默认为0,表示关闭,现在开启,改为1[root@xuegod63 ~]# cat /proc/sys/net/ipv4/tcp_tw_recycle 1#表示开启TCP连接中TIME-WAIT sockets的快速回收,默认为0,表示关闭。现在改为1,表示开启[root@xuegod63 ~]# cat /proc/sys/net/ipv4/tcp_fin_timeout 10#默认值是 60,对于本端断开的socket连接,TCP保持在FIN_WAIT_2状态的时间。
调整MTU最大传输单元:
[root@xuegod63 ~]# ifconfig ens33 mtu 9000
MTU,即Maximum Transmission Unit(最大传输单元),此值设定TCP/IP协议传输数据报时的最大传输单元。 系统与ISP之间MTU的不符就会直接导致数据在网络传输过程中不断地进行分包、组包,浪费了宝贵的传输时间,也严重影响了宽带的工作效率。
总结: 12.1 有关CPU的调优 12.2 有关内存的调优 12.3 有关I/O的调优 12.4 有关网络的调优 12.5 有关内核参数的调优
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。
发表评论
暂时没有评论,来抢沙发吧~