ping 丟包或不通時(shí)如何進(jìn)行鏈路測(cè)試
當(dāng)客戶端訪問(wèn)目標(biāo)服務(wù)器出現(xiàn) ping 丟包或 ping 不通時(shí),可以通過(guò) tracert 或 mtr 等工具進(jìn)行鏈路測(cè)試來(lái)判斷問(wèn)題來(lái)源。本文先介紹了進(jìn)行鏈路測(cè)試的相關(guān)工具,然后對(duì)測(cè)試結(jié)果分析及測(cè)試步驟進(jìn)行了說(shuō)明。
鏈路測(cè)試工具介紹
根據(jù)操作系統(tǒng)類型的不同,鏈路測(cè)試所使用的工具也有所不同。分別簡(jiǎn)要介紹如下。
Linux 環(huán)境下鏈路測(cè)試工具介紹
Windows 環(huán)境下鏈路測(cè)試工具介紹
Linux 環(huán)境下鏈路測(cè)試工具介紹
traceroute 命令行工具
mtr 命令行工具(建議優(yōu)先使用)
traceroute 命令行工具
traceroute 是幾乎所有 Linux 發(fā)行版本預(yù)裝的網(wǎng)絡(luò)測(cè)試工具,用于跟蹤 Internet 協(xié)議(IP)數(shù)據(jù)包傳送到目標(biāo)地址時(shí)經(jīng)過(guò)的路徑。
traceroute 先發(fā)送具有小的最大存活時(shí)間值(Max_TTL)的 UDP 探測(cè)數(shù)據(jù)包,然后偵聽從網(wǎng)關(guān)開始的整個(gè)鏈路上的 ICMP TIME_EXCEEDED 響應(yīng)。探測(cè)從 TTL=1 開始,TTL 值逐步增加,直至接收到ICMP PORT_UNREACHABLE 消息。ICMP PORT_UNREACHABLE 消息用于標(biāo)識(shí)目標(biāo)主機(jī)已經(jīng)被定位,或命令已經(jīng)達(dá)到允許跟蹤的最大 TTL 值。
traceroute 默認(rèn)發(fā)送 UDP 數(shù)據(jù)包進(jìn)行鏈路探測(cè)??梢酝ㄟ^(guò) -I 參數(shù)來(lái)指定發(fā)送 ICMP 數(shù)據(jù)包用于探測(cè)。
用法說(shuō)明:
traceroute [-I] [ -m Max_ttl ] [ -n ] [ -p Port ] [ -q Nqueries ] [ -r ] [ -s SRC_Addr ] [ -t TypeOfService ] [ -f flow ] [ -v ] [ -w WaitTime ] Host [ PacketSize ]
示例輸出:
[root@centos ~]# traceroute -I 223.5.5.5traceroute to 223.5.5.5 (223.5.5.5), 30 hops max, 60 byte packets 1 2 192.168.17.20 (192.168.17.20) 3.965 ms 4.252 ms 4.531 ms 3 111.1.20.41 (111.1.20.41) 6.109 ms 6.574 ms 6.996 ms 4 111.1.34.197 (111.1.34.197) 2.407 ms 2.451 ms 2.533 ms 5 211.138.114.25 (211.138.114.25) 1.321 ms 1.285 ms 1.304 ms 6 211.138.114.70 (211.138.114.70) 2.417 ms 211.138.114.66 (211.138.114.66) 1.857 ms 211.138.114.70 (211.138.114.70) 2.002 ms 7 42.120.244.194 (42.120.244.194) 2.570 ms 2.536 ms 42.120.244.186 (42.120.244.186) 1.585 ms 8 42.120.244.246 (42.120.244.246) 2.706 ms 2.666 ms 2.437 ms 9 10 public1.alidns.com (223.5.5.5) 2.817 ms 2.676 ms 2.401 ms
常見(jiàn)可選參數(shù)說(shuō)明:
-d 使用Socket層級(jí)的排錯(cuò)功能。
-f 設(shè)置第一個(gè)檢測(cè)數(shù)據(jù)包的存活數(shù)值TTL的大小。
-F 設(shè)置不要分段標(biāo)識(shí)。
-g 設(shè)置來(lái)源路由網(wǎng)關(guān),最多可設(shè)置8個(gè)。
-i 使用指定的網(wǎng)卡送出數(shù)據(jù)包。用于主機(jī)有多個(gè)網(wǎng)卡時(shí)。
-I 使用ICMP數(shù)據(jù)包替代 UDP 數(shù)據(jù)包進(jìn)行探測(cè)。
-m 設(shè)置檢測(cè)數(shù)據(jù)包的最大存活數(shù)值TTL的大小。
-n 直接使用IP地址而非主機(jī)名稱(禁用 DNS 反查)。
-p 設(shè)置UDP傳輸協(xié)議的通信端口。
-r 忽略普通的Routing Table,直接將數(shù)據(jù)包送到遠(yuǎn)端主機(jī)上。
-s 設(shè)置本地主機(jī)送出數(shù)據(jù)包的IP地址。
-t 設(shè)置檢測(cè)數(shù)據(jù)包的TOS數(shù)值。
-v 詳細(xì)顯示指令的執(zhí)行過(guò)程。
-w 設(shè)置等待遠(yuǎn)端主機(jī)回包時(shí)間。
-x 開啟或關(guān)閉數(shù)據(jù)包的正確性檢驗(yàn)。
mtr 命令行工具(建議優(yōu)先使用)
mtr (My traceroute)也是幾乎所有 Linux 發(fā)行版本預(yù)裝的網(wǎng)絡(luò)測(cè)試工具。他把 ping和 traceroute 的功能并入了同一個(gè)工具中,所以功能更強(qiáng)大。
mtr 默認(rèn)發(fā)送 ICMP 數(shù)據(jù)包進(jìn)行鏈路探測(cè)??梢酝ㄟ^(guò) -u 參數(shù)來(lái)指定使用 UDP 數(shù)據(jù)包用于探測(cè)。
相對(duì)于 traceroute 只會(huì)做一次鏈路跟蹤測(cè)試,mtr 會(huì)對(duì)鏈路上的相關(guān)節(jié)點(diǎn)做持續(xù)探測(cè)并給出相應(yīng)的統(tǒng)計(jì)信息。所以,mtr能避免節(jié)點(diǎn)波動(dòng)對(duì)測(cè)試結(jié)果的影響,所以其測(cè)試結(jié)果更正確,建議優(yōu)先使用。
用法說(shuō)明:
mtr [-hvrctglspni46] [—help] [—version] [—report] [—report-cycles=COUNT] [—curses] [—gtk] [—raw] [—split] [—no-dns] [—address interface] [—psize=bytes/-s bytes] [—interval=SECONDS] HOSTNAME [PACKETSIZE]
示例輸出:
[root@centos ~]# mtr 223.5.5.5 My traceroute [v0.75]mycentos6.6 (0.0.0.0) Wed Jun 15 23:16:27 2016Keys: Help Display mode Restart statistics Order of fields quit Packets Pings Host Loss% Snt Last Avg Best Wrst StDev 1. ??? 2. 192.168.17.20 0.0% 7 13.1 5.6 2.1 14.7 5.7 3. 111.1.20.41 0.0% 7 3.0 99.2 2.7 632.1 235.4 4. 111.1.34.197 0.0% 7 1.8 2.0 1.2 2.9 0.6 5. 211.138.114.25 0.0% 6 0.9 4.7 0.9 13.9 5.8 6. 211.138.114.70 0.0% 6 1.8 22.8 1.8 50.8 23.6 211.138.128.134 211.138.114.2 211.138.114.66 7. 42.120.244.186 0.0% 6 1.4 1.6 1.3 1.8 0.2 42.120.244.198 8. 42.120.244.246 0.0% 6 2.8 2.9 2.6 3.2 0.2 42.120.244.242 9. ???10. 223.5.5.5 0.0% 6 2.7 2.7 2.5 3.2 0.3
常見(jiàn)可選參數(shù)說(shuō)明:
-r 或 —report:以報(bào)告模式顯示輸出。
-p 或 —split:將每次追蹤的結(jié)果分別列出來(lái),而非如 —report統(tǒng)計(jì)整個(gè)結(jié)果。
-s 或 —psize:指定ping數(shù)據(jù)包的大小。
-n 或 —no-dns:不對(duì)IP地址做域名反解析。
-a 或 —address:設(shè)置發(fā)送數(shù)據(jù)包的IP地址。用于主機(jī)有多個(gè)IP時(shí)。
-4:只使用 IPv4 協(xié)議。
-6:只使用 IPv6 協(xié)議。
另外,也可以在 mtr 運(yùn)行過(guò)程中,輸入相應(yīng)字母來(lái)快速切換模式,比如:
?或 h:顯示幫助菜單。
d:切換顯示模式。
n:切換啟用或禁用 DNS 域名解析。
u:切換使用 ICMP或 UDP 數(shù)據(jù)包進(jìn)行探測(cè)。
返回結(jié)果說(shuō)明:
默認(rèn)配置下,返回結(jié)果中各數(shù)據(jù)列的說(shuō)明:
第一列(Host):節(jié)點(diǎn)IP地址和域名。如前面所示,按n鍵可以切換顯示。
第二列(Loss%):節(jié)點(diǎn)丟包率。
第三列(Snt):每秒發(fā)送數(shù)據(jù)包數(shù)。默認(rèn)值是10,可以通過(guò)參數(shù) -c 指定。
第四列(Last):最近一次的探測(cè)延遲值。
第五、六、七列(Avg、Best、Wrst):分別是探測(cè)延遲的平均值、最小值和最大值。
第八列(StDev):標(biāo)準(zhǔn)偏差。越大說(shuō)明相應(yīng)節(jié)點(diǎn)越不穩(wěn)定。
Windows 環(huán)境下鏈路測(cè)試工具介紹
TRACERT 命令行工具
WinMTR 工具(建議優(yōu)先使用)
TRACERT 命令行工具
TRACERT (Trace Route) 是 Windows 自帶的網(wǎng)絡(luò)診斷命令行實(shí)用程序,用于跟蹤 Internet 協(xié)議 (IP) 數(shù)據(jù)包傳送到目標(biāo)地址時(shí)經(jīng)過(guò)的路徑。
TRACERT 通過(guò)向目標(biāo)地址發(fā)送 ICMP 數(shù)據(jù)包來(lái)確定到目標(biāo)地址的路由。在這些數(shù)據(jù)包中,TRACERT 使用了不同的 IP“生存期”(TTL) 值。由于要求沿途的路由器在轉(zhuǎn)發(fā)數(shù)據(jù)包前至少必須將 TTL 減少 1,因此 TTL 實(shí)際上相當(dāng)于一個(gè)躍點(diǎn)計(jì)數(shù)器 (hop counter)。當(dāng)某個(gè)數(shù)據(jù)包的 TTL 達(dá)到零 (0) 時(shí),相應(yīng)節(jié)點(diǎn)就會(huì)向源計(jì)算機(jī)發(fā)送一個(gè) ICMP“超時(shí)”的消息。
TRACERT 第一次發(fā)送 TTL 為 1 的數(shù)據(jù)包,并在每次后續(xù)傳輸時(shí)將 TTL 增加 1,直到目標(biāo)地址響應(yīng)或達(dá)到 TTL 的最大值。中間路由器發(fā)送回來(lái)的 ICMP“超時(shí)”消息中包含了相應(yīng)節(jié)點(diǎn)的信息。
用法說(shuō)明:
tracert [-d] [-h maximum_hops] [-j host-list] [-w timeout] [-R] [-S srcaddr] [-4] [-6] target_name
示例輸出:
C:\\> tracert -d 223.5.5.5通過(guò)最多 30 個(gè)躍點(diǎn)跟蹤到 223.5.5.5 的路由 1 請(qǐng)求超時(shí)。 2 9 ms 3 ms 12 ms 192.168.17.20 3 4 ms 9 ms 2 ms 111.1.20.41 4 9 ms 2 ms 1 ms 111.1.34.197 5 11 ms 211.140.0.57 6 3 ms 2 ms 2 ms 211.138.114.62 7 2 ms 2 ms 1 ms 42.120.244.190 8 32 ms 4 ms 3 ms 42.120.244.238 9 請(qǐng)求超時(shí)。 10 3 ms 2 ms 2 ms 223.5.5.5跟蹤完成。
常見(jiàn)可選參數(shù)說(shuō)明:
-d:指定不將地址解析為主機(jī)名(禁用 DNS 反解)。
-h:maximum_hops,指定搜索目標(biāo)地址時(shí)的最大躍點(diǎn)數(shù)。
-j: host-list,指定沿主機(jī)列表的松散源路由。
-w:timeout,由每個(gè)回復(fù)的 timeout 指定的等待毫秒數(shù)。
-R:跟蹤往返行程路徑(僅適用于 IPv6)。
-S:srcaddr,要使用的源地址(僅適用于 IPv6)。
-4:強(qiáng)制使用 IPv4。
-6:強(qiáng)制使用 IPv6。
target_host:目標(biāo)主機(jī)域名或 IP 地址。
WinMTR 工具(建議優(yōu)先使用)
WinMTR 是 mtr 工具在 Windows 環(huán)境下的圖形化實(shí)現(xiàn),但進(jìn)行了功能簡(jiǎn)化,只支持 mtr部分參數(shù)的調(diào)整設(shè)置。WinMTR 默認(rèn)發(fā)送ICMP 數(shù)據(jù)包進(jìn)行探測(cè),無(wú)法切換。
WinMTR 可以從其官方網(wǎng)站下載獲取。
和 mtr 一樣,相比 tracert,WinMTR 能避免節(jié)點(diǎn)波動(dòng)對(duì)測(cè)試結(jié)果的影響,所以測(cè)試結(jié)果更正確。所以,在 WinMTR 可用的情況下,建議優(yōu)先使用 WinMTR 進(jìn)行鏈路測(cè)試。
用法說(shuō)明:
WinMTR 無(wú)需安裝,直接解壓運(yùn)行即可。操作方法非常簡(jiǎn)單,說(shuō)明如下:
如下圖所示,運(yùn)行程序后,在 Host 字段輸入目標(biāo)服務(wù)器域名或 IP(注意前面不要包含空格)。
點(diǎn)擊 Start 開始測(cè)試(開始測(cè)試后,相應(yīng)按鈕變成了 Stop)。
運(yùn)行一段時(shí)間后,點(diǎn)擊 Stop 停止測(cè)試。
其它選項(xiàng)說(shuō)明:
Copy Text to clipboard:將測(cè)試結(jié)果以文本格式復(fù)制到粘貼板。
Copy HTML to clipboard:將測(cè)試結(jié)果以 HTML 格式復(fù)制到粘貼板。
Export TEXT:將測(cè)試結(jié)果以文本格式導(dǎo)出到指定文件。
Export HTML:將測(cè)試結(jié)果以 HTML 格式導(dǎo)出到指定文件。
Options:可選參數(shù),包括:
Interval(sec):每次探測(cè)的間隔(過(guò)期)時(shí)間。默認(rèn)為 1 秒。
Ping size(bytes): ping 探測(cè)所使用的數(shù)據(jù)包大小,默認(rèn)為 64 字節(jié)。、
Max hosts in LRU list: LRU 列表支持的最大主機(jī)數(shù),默認(rèn)值為 128。
Resolve names:通過(guò)反查 IP 以域名顯示相關(guān)節(jié)點(diǎn)。
返回結(jié)果說(shuō)明:
默認(rèn)配置下,返回結(jié)果中各數(shù)據(jù)列的說(shuō)明:
第一列(Hostname):節(jié)點(diǎn) IP 或域名。
第二列(Nr):節(jié)點(diǎn)編號(hào)。
第三列(Loss%):節(jié)點(diǎn)丟包率。
第四列(Sent):已發(fā)送的數(shù)據(jù)包數(shù)量。
第五列(Recv):已成功接收的數(shù)據(jù)包數(shù)量。
第六、七、八、九列(Best 、Avg、Worst、Last):分別是到相應(yīng)節(jié)點(diǎn)延遲的最小值、平均值、最大值和最后一次值。
第八列(StDev):標(biāo)準(zhǔn)偏差。越大說(shuō)明相應(yīng)節(jié)點(diǎn)越不穩(wěn)定。
鏈路測(cè)試結(jié)果分析簡(jiǎn)要說(shuō)明
由于 mtr(WinMTR)有更高的準(zhǔn)確性。本文以其測(cè)試結(jié)果為例,對(duì)鏈路測(cè)試結(jié)果的分析進(jìn)行簡(jiǎn)要說(shuō)明。
后續(xù)說(shuō)明,以如下鏈路測(cè)試結(jié)果示例圖為基礎(chǔ)進(jìn)行闡述:
對(duì)鏈路測(cè)試結(jié)果進(jìn)行分析時(shí),需要關(guān)注如下要點(diǎn):
網(wǎng)絡(luò)區(qū)域
鏈路負(fù)載均衡
結(jié)合Avg(平均值)和 StDev(標(biāo)準(zhǔn)偏差)綜合判斷
Loss%(丟包率)的判斷
關(guān)于延遲
網(wǎng)絡(luò)區(qū)域
正常情況下,從客戶端到目標(biāo)服務(wù)器的整個(gè)鏈路,會(huì)顯著的包含如下區(qū)域:
客戶端本地網(wǎng)絡(luò)(本地局域網(wǎng)和本地網(wǎng)絡(luò)提供商網(wǎng)絡(luò)):如前文鏈路測(cè)試結(jié)果示例圖中的區(qū)域 A。如果該區(qū)域出現(xiàn)異常,如果是客戶端本地網(wǎng)絡(luò)相關(guān)節(jié)點(diǎn)出現(xiàn)異常,則需要對(duì)本地網(wǎng)絡(luò)進(jìn)行相應(yīng)排查分析。否則,如果是本地網(wǎng)絡(luò)提供商網(wǎng)絡(luò)相關(guān)節(jié)點(diǎn)出現(xiàn)異常,則需要向當(dāng)?shù)剡\(yùn)營(yíng)商反饋問(wèn)題。
運(yùn)營(yíng)商骨干網(wǎng)絡(luò):如前文鏈路測(cè)試結(jié)果示例圖中的區(qū)域 B。如果該區(qū)域出現(xiàn)異常,可以根據(jù)異常節(jié)點(diǎn) IP 查詢歸屬運(yùn)營(yíng)商,并向當(dāng)?shù)鼐W(wǎng)絡(luò)運(yùn)營(yíng)商反饋問(wèn)題。
目標(biāo)服務(wù)器本地網(wǎng)絡(luò)(目標(biāo)主機(jī)歸屬網(wǎng)絡(luò)提供商網(wǎng)絡(luò)): 如前文鏈路測(cè)試結(jié)果示例圖中的區(qū)域 C。如果該區(qū)域出現(xiàn)異常,則需要向目標(biāo)主機(jī)歸屬網(wǎng)絡(luò)提供商反饋問(wèn)題。
鏈路負(fù)載均衡
如前文鏈路測(cè)試結(jié)果示例圖中的區(qū)域 D 所示。如果中間鏈路某些部分啟用了鏈路負(fù)載均衡,則 mtr 只會(huì)對(duì)首尾節(jié)點(diǎn)進(jìn)行編號(hào)和探測(cè)統(tǒng)計(jì)。中間節(jié)點(diǎn)只會(huì)顯示相應(yīng)的 IP 或域名信息。
結(jié)合Avg(平均值)和 StDev(標(biāo)準(zhǔn)偏差)綜合判斷
由于鏈路抖動(dòng)或其它因素的影響,節(jié)點(diǎn)的 Best 和 Worst 值可能相差很大。而 Avg(平均值) 統(tǒng)計(jì)了自鏈路測(cè)試以來(lái)所有探測(cè)的平均值,所以能更好的反應(yīng)出相應(yīng)節(jié)點(diǎn)的網(wǎng)絡(luò)質(zhì)量。
而 StDev(標(biāo)準(zhǔn)偏差值)越高,則說(shuō)明數(shù)據(jù)包在相應(yīng)節(jié)點(diǎn)的延時(shí)值越不相同(越離散)。所以,標(biāo)準(zhǔn)偏差值可用于協(xié)助判斷 Avg 是否真實(shí)反應(yīng)了相應(yīng)節(jié)點(diǎn)的網(wǎng)絡(luò)質(zhì)量。例如,如果標(biāo)準(zhǔn)偏差很大,說(shuō)明數(shù)據(jù)包的延遲是不確定的??赡苣承?shù)據(jù)包延遲很小(例如:25ms),而另一些延遲卻很大(例如:350ms),但最終得到的平均延遲反而可能是正常的。所以,此時(shí) Avg 并不能很好的反應(yīng)出實(shí)際的網(wǎng)絡(luò)質(zhì)量情況。
綜上,建議的分析標(biāo)準(zhǔn)是:
如果 StDev 很高,則同步觀察相應(yīng)節(jié)點(diǎn)的 Best 和 Wrst,來(lái)判斷相應(yīng)節(jié)點(diǎn)是否存在異常。
如果 StDev 不高,則通過(guò) Avg來(lái)判斷相應(yīng)節(jié)點(diǎn)是否存在異常。
注:上述 StDev “高”或者“不高”,并沒(méi)有具體的時(shí)間范圍標(biāo)準(zhǔn)。而需要根據(jù)同一節(jié)點(diǎn)其它列的延遲值大小來(lái)進(jìn)行相對(duì)評(píng)估。比如,如果 Avg 為 30ms,那么,當(dāng) StDev 為 25ms,則認(rèn)為是很高的偏差。而如果 Avg 為 325ms,則同樣的StDev(25ms),反而認(rèn)為是不高的偏差。
Loss%(丟包率)的判斷
任一節(jié)點(diǎn)的 Loss%(丟包率)如果不為零,則說(shuō)明這一跳網(wǎng)絡(luò)可能存在問(wèn)題。導(dǎo)致相應(yīng)節(jié)點(diǎn)丟包的原因通常有兩種:
運(yùn)營(yíng)商基于安全或性能需求,人為限制了節(jié)點(diǎn)的 ICMP 發(fā)送速率,導(dǎo)致丟包。
節(jié)點(diǎn)確實(shí)存在異常,導(dǎo)致丟包。
可以結(jié)合異常節(jié)點(diǎn)及其后續(xù)節(jié)點(diǎn)的丟包情況,來(lái)判定丟包原因:
如果隨后節(jié)點(diǎn)均沒(méi)有丟包,則通常說(shuō)明異常節(jié)點(diǎn)丟包是由于運(yùn)營(yíng)商策略限制所致。可以忽略相關(guān)丟包。如前文鏈路測(cè)試結(jié)果示例圖中的第 2 跳所示。
如果隨后節(jié)點(diǎn)也出現(xiàn)丟包,則通常說(shuō)明異常節(jié)點(diǎn)確實(shí)存在網(wǎng)絡(luò)異常,導(dǎo)致丟包。如前文鏈路測(cè)試結(jié)果示例圖中的第 5 跳所示。
另外,需要說(shuō)明的是,前述兩種情況可能同時(shí)發(fā)生。即相應(yīng)節(jié)點(diǎn)既存在策略限速,又存在網(wǎng)絡(luò)異常。對(duì)于這種情況,如果異常節(jié)點(diǎn)及其后續(xù)節(jié)點(diǎn)連續(xù)出現(xiàn)丟包,而且各節(jié)點(diǎn)的丟包率不同,則通常以最后幾跳的丟包率為準(zhǔn)。如前文鏈路測(cè)試結(jié)果示例圖所示,在第 5、6、7跳均出現(xiàn)了丟包。所以,最終丟包情況,以第 7 跳的 40% 作為參考。
關(guān)于延遲
延遲跳變
如果在某一跳之后延遲明顯陡增,則通常判斷該節(jié)點(diǎn)存在網(wǎng)絡(luò)異常。如前文鏈路測(cè)試結(jié)果示例圖所示,從第 5 跳之后的后續(xù)節(jié)點(diǎn)延遲明顯陡增,則推斷是第 5 跳節(jié)點(diǎn)出現(xiàn)了網(wǎng)絡(luò)異常。
不過(guò),高延遲并不一定完全意味著相應(yīng)節(jié)點(diǎn)存在異常。如前文鏈路測(cè)試結(jié)果示例圖所示,第 5 跳之后,雖然后續(xù)節(jié)點(diǎn)延遲明顯陡增,但測(cè)試數(shù)據(jù)最終仍然正常到達(dá)了目的主機(jī)。所以,延遲大也有可能是在數(shù)據(jù)回包鏈路中引發(fā)的。所以,最好結(jié)合反向鏈路測(cè)試一并分析。
ICMP 限速導(dǎo)致延遲增加
ICMP 策略限速也可能會(huì)導(dǎo)致相應(yīng)節(jié)點(diǎn)的延遲陡增,但后續(xù)節(jié)點(diǎn)通常會(huì)恢復(fù)正常。如前文鏈路測(cè)試結(jié)果示例圖所示,第 3 跳有 100%的丟包率,同時(shí)延遲也明顯陡增。但隨后節(jié)點(diǎn)的延遲馬上恢復(fù)了正常。所以判斷該節(jié)點(diǎn)的延遲陡增及丟包是由于策略限速所致。
常見(jiàn)鏈路異常場(chǎng)景和測(cè)試報(bào)告
常見(jiàn)的鏈路異常場(chǎng)景及測(cè)試報(bào)告實(shí)例如下所示:
目標(biāo)主機(jī)網(wǎng)絡(luò)配置不當(dāng)
ICMP 限速
環(huán)路
鏈路中斷
目標(biāo)主機(jī)網(wǎng)絡(luò)配置不當(dāng)
示例數(shù)據(jù):
t@mycentos6 ~]# mtr —no-dns www.google.comMy traceroute [v0.75]mycentos6.6 (0.0.0.0) Wed Jun 15 19:06:29 2016Keys: Help Display mode Restart statistics Order of fields quit Packets Pings Host Loss% Snt Last Avg Best Wrst StDev 1. ??? 2. ??? 3. 111.1.20.41 0.0% 10 521.3 90.1 2.7 521.3 211.3 4. 111.1.34.209 0.0% 10 2.9 4.7 1.6 10.6 3.9 5. 211.138.126.29 80.0% 10 3.0 3.0 3.0 3.0 0.0 6. 221.183.14.85 0.0% 10 1.7 7.2 1.6 34.9 13.6 7. 221.183.10.5 0.0% 10 5.2 5.2 5.1 5.2 0.0 221.183.11.5 8. 221.183.23.26 0.0% 10 5.3 5.2 5.1 5.3 0.1 9. 173.194.200.105 100.0% 10 0.0 0.0 0.0 0.0 0.0
在該示例中,數(shù)據(jù)包在目標(biāo)地址出現(xiàn)了 100% 的丟包。乍一看是數(shù)據(jù)包沒(méi)有到達(dá),其實(shí)很有可能是目標(biāo)服務(wù)器相關(guān)安全策略(比如防火墻、iptables 等)禁用了 ICMP 所致,導(dǎo)致目的主機(jī)無(wú)法發(fā)送任何應(yīng)答。
所以,該場(chǎng)景需要排查目標(biāo)服務(wù)器的安全策略配置
ICMP 限速
示例數(shù)據(jù):
[root@mycentos6 ~]# mtr —no-dns www.google.comMy traceroute [v0.75]mycentos6.6 (0.0.0.0) Wed Jun 15 19:06:29 2016Keys: Help Display mode Restart statistics Order of fields quit Packets Pings Host Loss% Snt Last Avg Best Wrst StDev1. 63.247.74.43 0.0% 10 0.3 0.6 0.3 1.2 0.32. 63.247.64.157 0.0% 10 0.4 1.0 0.4 6.1 1.83. 209.51.130.213 0.0% 10 0.8 2.7 0.8 19.0 5.74. aix.pr1.atl.google.com 0.0% 10 6.7 6.8 6.7 6.9 0.15. 72.14.233.56 60.0% 10 27.2 25.3 23.1 26.4 2.96. 209.85.254.247 0.0% 10 39.1 39.4 39.1 39.7 0.27. 64.233.174.46 0.0% 10 39.6 40.4 39.4 46.9 2.38. gw-in-f147.1e100.net 0.0% 10 39.6 40.5 39.5 46.7 2.2
在該示例中,在第 5 跳出現(xiàn)了明顯的丟包,但后續(xù)節(jié)點(diǎn)均未見(jiàn)異常。所以推斷是該節(jié)點(diǎn) ICMP 限速所致。
該場(chǎng)景對(duì)最終客戶端到目標(biāo)服務(wù)器的數(shù)據(jù)傳輸不會(huì)有影響,所以,分析的時(shí)候可以忽略。
環(huán)路
示例數(shù)據(jù):
[root@mycentos6 ~]# mtr —no-dns www.google.comMy traceroute [v0.75]mycentos6.6 (0.0.0.0) Wed Jun 15 19:06:29 2016Keys: Help Display mode Restart statistics Order of fields quit Packets Pings Host Loss% Snt Last Avg Best Wrst StDev1. 63.247.74.43 0.0% 10 0.3 0.6 0.3 1.2 0.32. 63.247.64.157 0.0% 10 0.4 1.0 0.4 6.1 1.83. 209.51.130.213 0.0% 10 0.8 2.7 0.8 19.0 5.74. aix.pr1.atl.google.com 0.0% 10 6.7 6.8 6.7 6.9 0.15. 72.14.233.56 0.0% 10 0.0 0.0 0.0 0.0 0.06. 72.14.233.57 0.0% 10 0.0 0.0 0.0 0.0 0.07. 72.14.233.56 0.0% 10 0.0 0.0 0.0 0.0 0.08. 72.14.233.57 0.0% 10 0.0 0.0 0.0 0.0 0.09 ??? 0.0% 10 0.0 0.0 0.0 0.0 0.0
在該示例中,數(shù)據(jù)包在第 5 跳之后出現(xiàn)了循環(huán)跳轉(zhuǎn),導(dǎo)致最終無(wú)法到達(dá)目標(biāo)服務(wù)器。這通常是由于運(yùn)營(yíng)商相關(guān)節(jié)點(diǎn)路由配置異常所致。
鏈路中斷
示例數(shù)據(jù):
t@mycentos6 ~]# mtr —no-dns www.google.comMy traceroute [v0.75]mycentos6.6 (0.0.0.0) Wed Jun 15 19:06:29 2016Keys: Help Display mode Restart statistics Order of fields quit Packets Pings Host Loss% Snt Last Avg Best Wrst StDev1. 63.247.74.43 0.0% 10 0.3 0.6 0.3 1.2 0.32. 63.247.64.157 0.0% 10 0.4 1.0 0.4 6.1 1.83. 209.51.130.213 0.0% 10 0.8 2.7 0.8 19.0 5.74. aix.pr1.atl.google.com 0.0% 10 6.7 6.8 6.7 6.9 0.15. ??? 0.0% 10 0.0 0.0 0.0 0.0 0.06. ??? 0.0% 10 0.0 0.0 0.0 0.0 0.07. ??? 0.0% 10 0.0 0.0 0.0 0.0 0.08. ??? 0.0% 10 0.0 0.0 0.0 0.0 0.09 ??? 0.0% 10 0.0 0.0 0.0 0.0 0.0
在該示例中,數(shù)據(jù)包在第 4 跳之后就無(wú)法收到任何反饋。這通常是由于相應(yīng)節(jié)點(diǎn)中斷所致。建議結(jié)合反向鏈路測(cè)試做進(jìn)一步確認(rèn)。
該場(chǎng)景需要聯(lián)系相應(yīng)節(jié)點(diǎn)歸屬運(yùn)營(yíng)商處理。
鏈路測(cè)試步驟
通常情況下,鏈路測(cè)試流程如下鏈路測(cè)試流程圖所示:
相關(guān)步驟詳細(xì)說(shuō)明如下:
獲取本地網(wǎng)絡(luò)對(duì)應(yīng)公網(wǎng) IP
正向鏈路測(cè)試(ping 和 mtr)
反向鏈路測(cè)試(ping 和 mtr)
測(cè)試結(jié)果分析
獲取本地網(wǎng)絡(luò)對(duì)應(yīng)公網(wǎng) IP
在客戶端本地網(wǎng)絡(luò)訪問(wèn)www.ip138.com等網(wǎng)站,獲取本地網(wǎng)絡(luò)對(duì)應(yīng)的公網(wǎng) IP。
正向鏈路測(cè)試(ping 和 mtr)
從客戶端向目標(biāo)服務(wù)器做 ping 和 mtr 鏈路測(cè)試:
從客戶端向目標(biāo)服務(wù)器域名或 IP 做持續(xù)的 ping 測(cè)試(建議至少 ping 100 個(gè)數(shù)據(jù)包),記錄測(cè)試結(jié)果。
根據(jù)客戶端操作系統(tǒng)環(huán)境的不同,使用 WinMTR 或 mtr,設(shè)置測(cè)試目的地址為目標(biāo)服務(wù)器域名或IP,然后進(jìn)行鏈路測(cè)試,記錄測(cè)試結(jié)果。
反向鏈路測(cè)試(ping 和 mtr)
進(jìn)入目標(biāo)服務(wù)器系統(tǒng)內(nèi)部,做反向 ping 和 mtr 鏈路測(cè)試
從目標(biāo)服務(wù)器向前述步驟 1 獲取的客戶端 IP做持續(xù)的 ping 測(cè)試(建議至少 ping 100 個(gè)數(shù)據(jù)包),記錄測(cè)試結(jié)果。
根據(jù)目標(biāo)服務(wù)器操作系統(tǒng)環(huán)境的不同,使用 WinMTR 或 mtr,設(shè)置測(cè)試目的地址為前述步驟 1 獲取的客戶端 IP,然后進(jìn)行鏈路測(cè)試,記錄測(cè)試結(jié)果。