問題現(xiàn)象 一個(gè)標(biāo)準(zhǔn)交換機(jī)上的物理網(wǎng)卡進(jìn)行切換,即假如vmnic0網(wǎng)卡為活動(dòng)網(wǎng)卡,vmnic1網(wǎng)卡為備用網(wǎng)卡,虛擬機(jī)的網(wǎng)絡(luò)通信正常,然后把vmnic1網(wǎng)卡改為活動(dòng)網(wǎng)卡,vmnic0網(wǎng)卡改為備用多卡,虛擬機(jī)就會(huì)出現(xiàn)丟包,斷網(wǎng)的現(xiàn)象,重啟虛擬機(jī)后,網(wǎng)絡(luò)恢復(fù),如果再次做物理網(wǎng)卡的切換,又會(huì)出現(xiàn)斷網(wǎng)現(xiàn)象。整個(gè)集群的esxi主機(jī)重復(fù)同樣的操作,都會(huì)出現(xiàn)該現(xiàn)象。 問題分析 從問題現(xiàn)象來看,如果不做網(wǎng)卡的切換,虛擬機(jī)網(wǎng)絡(luò)通信正常,物理網(wǎng)卡切換后,然后重啟虛擬機(jī),網(wǎng)絡(luò)又恢復(fù)正常,由此可見不是物理交換機(jī)配置的問題,如果物理交換機(jī)對(duì)應(yīng)的端口配置不一致,重啟虛擬機(jī)后,斷網(wǎng)現(xiàn)象依舊的。排除掉物理交換機(jī)后,且所有集成的esxi主機(jī)都存在這個(gè)問題,因此也不是線纜的問題。所以肯定還是ESXi主機(jī)的本身的問題。 首先查看esxi主機(jī)的物理網(wǎng)卡的型號(hào),如下圖所示,該客戶使用兩塊10Gb網(wǎng)卡,型號(hào)分別為X722和X710 然后查看VMware官網(wǎng)的硬件兼容性例表,發(fā)現(xiàn)對(duì)應(yīng)的驅(qū)動(dòng)版本和網(wǎng)卡的固件有對(duì)應(yīng)的關(guān)系,即什么樣的固件版本對(duì)應(yīng)的驅(qū)動(dòng)版本是不一樣的,不能隨意安裝驅(qū)動(dòng)版本。 X722的硬件兼容性例表 X710的硬件兼容性例表 然后使用ssh登錄到esxi主機(jī),查看目前esxi主機(jī)對(duì)應(yīng)的驅(qū)動(dòng)版本和固件版本,使用 esxcli network nic get -n vmnic4 (vmnic4為物理網(wǎng)卡) 通過命令輸出,X710網(wǎng)卡固件版本為6.80,但對(duì)應(yīng)的驅(qū)動(dòng)版本為1.3.1,X722網(wǎng)卡固件版本為4.00,但對(duì)應(yīng)的驅(qū)動(dòng)版本為1.3.1,因此兩塊10Gb的網(wǎng)卡的驅(qū)動(dòng)版本和固件版本不符合官方兼容例表。 斷網(wǎng)問題的根源可能就是這個(gè)問題,如果驅(qū)動(dòng)版本和固件版本可以隨意搭配,那官方的硬件兼容例表為何會(huì)有明確的對(duì)應(yīng)關(guān)系呢?如果實(shí)施過VMware vSAN的項(xiàng)目,就會(huì)經(jīng)常碰到Raid卡的固件及驅(qū)動(dòng)的問題,也是需要嚴(yán)格依照官方的兼容例表安裝固件版本所對(duì)應(yīng)的驅(qū)動(dòng)程序版本。 問題解決 從官方的兼容例表VMware vSphere版本對(duì)應(yīng)的驅(qū)動(dòng),該環(huán)境的ESXi版本為6.7u1,固件版本為4.0,那就下載版本號(hào)為1.7.17的網(wǎng)卡驅(qū)動(dòng),把相應(yīng)的vib包上傳至esxi的tmp目錄,然后通過如下命令安裝相應(yīng)的網(wǎng)卡驅(qū)動(dòng) esxcli software vib install -v /tmp/xxxxx.vib 安裝驅(qū)動(dòng)之前,建議把esxi進(jìn)入維護(hù)模式,然后再安裝驅(qū)動(dòng)程序,安裝完成后,需要重啟esxi主機(jī)。 完成esxi主機(jī)重啟,再進(jìn)行物理網(wǎng)卡的主備切換,問題消失,虛擬機(jī)網(wǎng)絡(luò)都一切正常。 |
|