在上文中我們分析了很多性能監(jiān)控工具,介紹這些工具的目的只有一個,那就是找出對應(yīng)的性能瓶頸。盲目的性能調(diào)優(yōu)是沒有效果的,只有充分知道了哪里出了問題,針對性的結(jié)果才是立竿見影的。解決了主要的性能問題,那些次要的性能問題也就不足為慮了! 我們知道,性能問題無非就這么幾種:CPU、內(nèi)存、磁盤IO、網(wǎng)絡(luò)。那我們來逐一介紹以下相關(guān)的現(xiàn)象和一些可能出現(xiàn)的問題。 一、CPU過高。 查看CPU最簡單的我們使用任務(wù)管理器查看,如下圖所示,windows下使用任務(wù)管理器查看,Linux下使用top查看。
一般我們的服務(wù)器都采用Linux,因此我們重點(diǎn)關(guān)注一下Linux(注:windows模式下相信大家已經(jīng)很熟悉了,并且前面我們已經(jīng)提到,使用資源監(jiān)視器可以很清楚的看到系統(tǒng)的各項(xiàng)參數(shù),在這里我就不多做介紹了) 在top視圖下,對于多核的CPU,顯示的CPU資源有可能超過100%,因?yàn)檫@里顯示的是所有CPU占用百分百的總和,如果你需要看單個CPU的占用情況,直接按鍵1就可以看到。如下圖所示,我的一臺測試機(jī)為8核16GB內(nèi)存。 在 我們也可以通過 注:sysstat下載地址:http://sebastien.godard./download.html 安裝方法: 1、chmod +x configure 2、./configure 3、make 4、make install 如輸入pidstat 1 2就會隔一秒在控制臺輸出一次當(dāng)然CPU的情況,共輸出2次 除了 相關(guān) 下面我們主要來介紹以下當(dāng)出現(xiàn)CPU過高的時候,或者CPU不正常的時候,我們該如何去處理? CPU消耗過高主要分為用戶進(jìn)程占用CPU過高和內(nèi)核進(jìn)程占用CPU過高(在Linux下top視圖下us指的是用戶進(jìn)程,而sy是指內(nèi)核進(jìn)程),我們來看一個案例: 程序運(yùn)行前,系統(tǒng)運(yùn)行平穩(wěn),其中藍(lán)色的線表示總的 對于一個 很明顯是我們的 首先我們排除了是 ![]() 前面一些線程都是容器使用的,而下面一個線程也一直在執(zhí)行,那是什么地方調(diào)用的呢?查找代碼中使用 ThredPoolExecutor 的地方。終于發(fā)現(xiàn)以下代碼。 private BlockingQueue private Executor executor; //…… public void run() { while(true){ try { SendMsg sendMsg = queue.poll();//從隊(duì)列中取出 if(null != sendMsg) { sendForQueue(sendMsg); } } catch (Exception e) { e.printStackTrace(); } } } 問題很顯然了,我們看一下對應(yīng)BlockingQueue的poll方法的API文檔。 ![]() 不難理解了,雖然使用了阻塞的隊(duì)列,但是使用了非阻塞的取法,當(dāng)數(shù)據(jù)為空時直接返回 null ,那這個語句就等價于下面的語句。 @Override public void run() { while(true){
} } 相當(dāng)于死循環(huán)么,很顯然是非常耗費(fèi)CPU資源的,并且我們還可以發(fā)現(xiàn)這樣的死循環(huán)是耗費(fèi)的單顆CPU資源,因此可以解釋上圖為啥有一顆CPU占用特別高。我們來看一下部署在Linux下的top視圖。 猛一看,不是很高么?我們按鍵 這下看的很清楚了吧!明顯一顆 問題找到,馬上修復(fù)代碼為阻塞時存取,如下所示: @Override public void run() { while(true){ try { SendMsg sendMsg = queue.take();//從隊(duì)列中取出 sendForQueue(sendMsg); } catch (Exception e) { e.printStackTrace(); } } } 再來監(jiān)控 再來看 再來看VisualVM的監(jiān)控,我們就可以看到基本上都是容器的一些線程了 以上示例展示了 CPU過高還有一種情況是內(nèi)核占用CPU很高。我們來看另外一個示例。 package com.yhj.jvm.monitor.cpu.sy;
import java.util.Random; import java.util.concurrent.ExecutorService; import java.util.concurrent.Executors;
/** * @Described:系統(tǒng)內(nèi)核占用CPU過高測試用例 * @author YHJ create at 2012-3-28 下午05:27:33 * @FileNmae com.yhj.jvm.monitor.cpu.sy.SY_Hign_TestCase.java */ public class SY_Hign_TestCase {
private final static int LOCK_COUNT = 1000;
//默認(rèn)初始化LOCK_COUNT個鎖對象 private Object [] locks = new Object[LOCK_COUNT];
private Random random = new Random();
//構(gòu)造時初始化對應(yīng)的鎖對象 public SY_Hign_TestCase() { for(int i=0;i<LOCK_COUNT;++i) locks[i]=new Object(); }
abstract class Task implements Runnable{
protected Object lock;
public Task(int index) { this.lock= locks[index]; } @Override public void run() { while(true){ //循環(huán)執(zhí)行自己要做的事情 doSth(); } } //做類自己要做的事情 public abstract void doSth(); }
//任務(wù)A 休眠自己的鎖 class TaskA extends Task{
public TaskA(int index) { super(index); }
@Override public void doSth() { synchronized (lock) { try { lock.wait(random.nextInt(10)); } catch (InterruptedException e) { e.printStackTrace(); } } }
}
//任務(wù)B 喚醒所有鎖 class TaskB extends Task{
public TaskB(int index) { super(index); }
@Override public void doSth() { try { synchronized (lock) { lock.notifyAll(); Thread.sleep(random.nextInt(10)); } } catch (InterruptedException e) { e.printStackTrace(); } }
} //啟動函數(shù) public void start(){ ExecutorService service = Executors.newCachedThreadPool(); for(int i=0;i<LOCK_COUNT;++i){ service.execute(new TaskA(i)); service.execute(new TaskB(i)); } } //主函數(shù)入口 public static void main(String[] args) { new SY_Hign_TestCase().start(); }
} 代碼很簡單,就是創(chuàng)建了2000個線程,讓一定的線程去等待,另外一個線程去釋放這些資源,這樣就會有大量的線程切換,我們來看下效果。 很明顯, 很明顯可以看出有很多線程切換占用了大量的 同樣的程序部署在Linux下,top視圖如下圖所示: 展開對應(yīng)的 大家可以看到有大量的 我們也可以使用vmstat來查看,如下圖所示: 二、文件 在windows環(huán)境下,我們可以使用資源監(jiān)視器查看對應(yīng)的IO消耗,如下圖所示: 這里不但可以看到當(dāng)前磁盤的負(fù)載信息,隊(duì)列詳情,還能看到每個單獨(dú)的進(jìn)程的資源消耗情況。 Linux下主要使用pidstat、iostat等進(jìn)行分析。如下圖所示 Pidstat –d –t –p [pid] {time} {count} 如:pidstat -d -t -p 18720 1 1
Iostat ![]() Iostat –x xvda 1 10做定時采樣 ![]() 廢話不多說,直接來示例,上干貨! package com.yhj.jvm.monitor.io;
import java.io.BufferedWriter; import java.io.FileWriter; import java.io.IOException; import java.util.concurrent.ExecutorService; import java.util.concurrent.Executors;
/** * @Described:IO測試用例 * @author YHJ create at 2012-3-29 上午09:56:06 * @FileNmae com.yhj.jvm.monitor.io.IO_TestCase.java */ public class IO_TestCase {
private String fileNmae = "monitor.log";
private String context ;
// 和CPU處理器個數(shù)相同,既充分利用CPU資源,又導(dǎo)致線程頻繁切換 private final static int THRED_COUNT = Runtime.getRuntime().availableProcessors();
public IO_TestCase() {//加長寫文件的內(nèi)容,拉長每次寫入的時間 StringBuilder sb = new StringBuilder(); for(int i=0;i<1000;++i){ sb.append("context index :") .append(i) .append("\n"); this.context= new String(sb); } } //寫文件任務(wù) class Task implements Runnable{
@Override public void run() { while(true){ BufferedWriter writer = null; try { writer = new BufferedWriter(new FileWriter(fileNmae,true));//追加模式 writer.write(context); } catch (Exception e) { e.printStackTrace(); }finally{ try { writer.close(); } catch (IOException e) { e.printStackTrace(); } } }
} } //啟動函數(shù) public void start(){ ExecutorService service = Executors.newCachedThreadPool(); for(int i=0;i<THRED_COUNT;++i) service.execute(new Task()); } //主函數(shù)入口 public static void main(String[] args) { new IO_TestCase().start(); }
} 這段示例很簡單,通過創(chuàng)建一個和CPU個數(shù)相同的線程池,然后開啟這么多線程一起讀寫同一個文件,這樣就會因IO資源的競爭而導(dǎo)致IO的隊(duì)列很高,如下圖所示: 關(guān)掉之后馬上就下來了 我們把這個部署到 這里的 占用了大量的內(nèi)存資源。 三、內(nèi)存消耗 對于JVM的內(nèi)存模型大家已經(jīng)很清楚了,前面我們講了JVM的性能監(jiān)控工具。對于Java應(yīng)用來說,出現(xiàn)問題主要消耗在于JVM的內(nèi)存上,而JVM的內(nèi)存,JDK已經(jīng)給我們提供了很多的工具。在實(shí)際的生成環(huán)境,大部分應(yīng)用會將-Xms和-Xmx設(shè)置為相同的,避免運(yùn)行期間不斷開辟內(nèi)存。 對于內(nèi)存消耗,還有一部分是直接物理內(nèi)存的,不在堆空間,前面我們也寫過對應(yīng)的示例。之前一個系統(tǒng)就是因?yàn)橛写罅康?/span>NIO操作,而NIO是使用物理內(nèi)存的,并且開辟的物理內(nèi)存是在觸發(fā)FULL GC的時候才進(jìn)行回收的,但是當(dāng)時的機(jī)器總內(nèi)存為16GB 給堆的內(nèi)存是14GB Edon為1.5GB,也就是實(shí)際剩下給物理呢哦村的只有0.5GB,最終導(dǎo)致總是發(fā)生內(nèi)存溢出,但監(jiān)控堆、棧的內(nèi)存消耗都不大。在這里我就不多寫了! 四、網(wǎng)絡(luò)消耗過大 Windows下使用本地網(wǎng)絡(luò)視圖可以監(jiān)控當(dāng)前的網(wǎng)絡(luò)流量大小 更詳細(xì)的資料可以打開資源監(jiān)視器,如下圖所示 Linux sar -n DEV 1 2 字段說明: rxpck/s:每秒鐘接收的數(shù)據(jù)包 txpck/s:每秒鐘發(fā)送的數(shù)據(jù)包 rxbyt/s:每秒鐘接收的字節(jié)數(shù) txbyt/s:每秒鐘發(fā)送的字節(jié)數(shù) rxcmp/s:每秒鐘接收的壓縮數(shù)據(jù)包 txcmp/s:每秒鐘發(fā)送的壓縮數(shù)據(jù)包 rxmcst/s:每秒鐘接收的多播數(shù)據(jù)包 Java程序一般不會出現(xiàn)網(wǎng)絡(luò)IO導(dǎo)致問題,因此在這里也不過的的闡述。 五、程序執(zhí)行緩慢 當(dāng)CPU、內(nèi)存、磁盤、網(wǎng)絡(luò)都不高,程序還是執(zhí)行緩慢的話,可能引發(fā)的原因大致有以下幾種: 1程序鎖競爭過于激烈,比如你只有2顆CPU,但是你啟用了200個線程,就會導(dǎo)致大量的線程等待和切換,而這不會導(dǎo)致CPU很高,但是很多線程等待意味著你的程序運(yùn)行很慢。 2未充分利用硬件資源。比如你的機(jī)器是16個核心的,但是你的程序是單線程運(yùn)行的,即使你的程序優(yōu)化的很好,當(dāng)需要處理的資源比較多的時候,程序還會很慢,因此現(xiàn)在都在提倡分布式,通過大量廉價的PC機(jī)來提升程序的執(zhí)行速度! 3其他服務(wù)器反應(yīng)緩慢,如數(shù)據(jù)庫、緩存等。當(dāng)大量做了分布式,程序CPU負(fù)載都很低,但是提交給數(shù)據(jù)庫的sql無法很快執(zhí)行,也會特別慢。 總結(jié)一下,當(dāng)出現(xiàn)性能問題的時候我們該怎么做? 一、CPU過高 1、 us過高 使用監(jiān)控工具快讀定位哪里有死循環(huán),大計(jì)算,對于死循環(huán)通過阻塞式隊(duì)列解決,對于大計(jì)算,建議分配單獨(dú)的機(jī)器做后臺計(jì)算,盡量不要影響用戶交互,如果一定要的話(如框計(jì)算、云計(jì)算),只能通過大量分布式來實(shí)現(xiàn) 2、 sy過高 最有效的方法就是減少進(jìn)程,不是進(jìn)程越多效率越高,一般來說線程數(shù)和CPU的核心數(shù)相同,這樣既不會造成線程切換,又不會浪費(fèi)CPU資源 二、內(nèi)存消耗過高 1、 及時釋放不必要的對象 2、 使用對象緩存池緩沖 3、 采用合理的緩存失效算法(還記得我們之前提到的弱引用、幽靈引用么?) 三、磁盤IO過高 1、 異步讀寫文件 2、 批量讀寫文件 3、 使用緩存技術(shù) 4、 采用合理的文件讀寫規(guī)則 四、網(wǎng)絡(luò) 1、增加寬帶流量 五、資源消耗不多但程序運(yùn)行緩慢 1、使用并發(fā)包,減少鎖競爭 2、對于必須單線程執(zhí)行的使用隊(duì)列處理 3、大量分布式處理 六、未充分利用硬件資源 1、 修改程序代碼,使用多線程處理 2、 修正外部資源瓶頸,做業(yè)務(wù)拆分 3、 使用緩存 轉(zhuǎn)自:http://yhjhappy234.blog.163.com/blog/static/3163283220122298232721/?suggestedreading&wumii |
|