一、jmap找出占用內存較大的實例
先給個示例代碼:
import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; /** * Created by 菩提樹下的楊過 on 05/09/2017. */ public class OOMTest { public static void main(String[] args) throws InterruptedException { CountDownLatch latch = new CountDownLatch(1); int max = 10000; List<Person> list = new ArrayList<>(max); for (int j = 0; j < max; j++) { Person p = new Person(); p.setAge(100); p.setName("菩提樹下的楊過"); list.add(p); } System.out.println("ready!"); latch.await(); } public static class Person { private String name; private int age; public String getName() { return name; } public void setName(String name) { this.name = name; } public int getAge() { return age; } public void setAge(int age) { this.age = age; } } }
List中放了1w個Person對象的實例,先把這段程序跑起來
javac OOMTest.java
java OOMTest
然后再開一個窗口,jps -l 找出該程序的pid
然后執行 jmap -histo:live 7320 (注:如果輸出內容太多,只想看排名前10的,可以加 | head -10)
輸出結果,會按內存使用量,從大到小依次把對象的實際個數,占用內存數量(字節數)打印出來,最后還會輸出匯總信息
以上面的示例來說,OOMTest$Person這個類的實例數為10000個,總共占用240000字節(注:即每個實例24字節),這個程序總占用內存數為725464字節,約:0.69M。
另外還有一些[C,[B這類class name,大概意思為:
[C is a char[]
[S is a short[]
[I is a int[]
[B is a byte[]
[[I is a int[][]
[C對象往往跟String有關,String其內部使用final char[]數組來保存數據的
constMethodKlass/ methodKlass/ constantPoolKlass/ constantPoolCacheKlass/ instanceKlassKlass/ methodDataKlass
與Classloader相關,常駐與Perm區。
二、找出某個java應用打開的句柄數及線程數
ll /proc/{pid}/fd | wc -l 查看打開的句柄數
ll /proc/{pid}/task | wc -l 查看線程數
三、jmap 查看堆內存的各項配置
jmap -heap pid 可以看到類似下面的輸出:
using thread-local object allocation. Parallel GC with 4 thread(s) //當前使用的GC方式(并行GC) Heap Configuration: //堆內存配置 MinHeapFreeRatio = 0 //對應jvm啟動參數-XX:MinHeapFreeRatio設置JVM堆最小空閑比率(java8默認0) MaxHeapFreeRatio = 100 //對應jvm啟動參數-XX:MaxHeapFreeRatio設置JVM堆最大空閑比率 MaxHeapSize = 8388608 (8.0MB) //對應jvm啟動參數-XX:MaxHeapSize=設置JVM堆的最大大小(或-Xmx參數) NewSize = 5242880 (5.0MB) //對應jvm啟動參數-XX:NewSize=設置JVM堆的‘新生代’的默認 MaxNewSize = 5242880 (5.0MB) //對應jvm啟動參數-XX:MaxNewSize=設置JVM堆的‘新生代’的最大大小 OldSize = 3145728 (3.0MB) //對應jvm啟動參數-XX:OldSize=設置JVM堆的‘老生代’的大小 NewRatio = 2 //對應jvm啟動參數-XX:NewRatio=:‘新生代’和‘老生代’的大小比率 SurvivorRatio = 8 //對應jvm啟動參數-XX:SurvivorRatio=設置年輕代中Eden區與Survivor區的大小比值 MetaspaceSize = 21807104 (20.796875MB) CompressedClassSpaceSize = 1073741824 (1024.0MB) MaxMetaspaceSize = 17592186044415 MB G1HeapRegionSize = 0 (0.0MB) Heap Usage: //堆內存使用情況 PS Young Generation Eden Space: //Eden區分布 capacity = 2621440 (2.5MB) //Eden區總容量 used = 2328088 (2.2202377319335938MB) //Eden區已使用 free = 293352 (0.27976226806640625MB) //Eden區剩余容量 88.80950927734375% used From Space: //其中一個Survivor區的內存分布 capacity = 1572864 (1.5MB) used = 360448 (0.34375MB) free = 1212416 (1.15625MB) 22.916666666666668% used To Space: //另一個Survivor區的內存分布 capacity = 1048576 (1.0MB) used = 0 (0.0MB) free = 1048576 (1.0MB) 0.0% used PS Old Generation //當前的Old區內存分布 capacity = 3145728 (3.0MB) used = 1458968 (1.3913803100585938MB) free = 1686760 (1.6086196899414062MB) 46.37934366861979% used 3759 interned Strings occupying 298824 bytes.
注:5-16行是堆內存的主要配置,這些參數都可以通過 java -XX:參數名=參數值 來調整其大小,比如:
java -XX:MinHeapFreeRatio=20 -XX:MaxHeapFreeRatio=80 -Xmx100m -XX:MetaspaceSize=50M -XX:NewRatio=3 將影響MinHeapFreeRatio、MaxHeapFreeRatio、MaxHeapSize、MetaspaceSize、NewRatio的值
注意下NewRatio,這個值指的 老年代(Old Generation): 新生代(Young Generation)的比值,上面設置成3,所以OldSize為75m,而NewSize為25m,參考下圖:
注:這是jdk7的示意圖,jdk8中Permanent Generation被去掉了,新加入了Metaspace區,但這個區別不影響對 新生代、老生代的理解。
新生代(Young Generation)又可以細分為eden、s0、s1 三大塊。
java7與java8的內存變化,大致如上圖。
SurvirorRatio這個要難算一點,按Oracle官網的解釋:https://docs.oracle.com/cd/E19159-01/819-3681/abeil/index.html ,默認值是8,即:每塊survivor: eden區的大小為1:8,換句話說 s0 = s1 = 1 / (1+1+8) = 1/10
注:雖然官網這么解釋,但是我實際算了下,好象并不是嚴格按這個比例來算的,只能大概說是這個分配比例。(結論就是:SurvirorRatio設置越大,eden區就越大)
四、找出占用CPU最高的線程
先來一段演示代碼:
import java.util.concurrent.CountDownLatch; /** * Created by 菩提樹下的楊過 on 05/09/2017. */ public class OOMTest { public static void main(String[] args) throws InterruptedException { CountDownLatch latch = new CountDownLatch(1); int max = 100; for (int i = 0; i < max; i++) { Thread t = new Thread() { public void run() { try { Thread.sleep(50); } catch (InterruptedException e) { Thread.currentThread().interrupt(); } } }; t.setName("thread-" + i); t.start(); } Thread t = new Thread() { public void run() { int i = 0; while (true) { i = (i++) / 10; } } }; t.setName("BUSY THREAD"); t.start(); System.out.println("ready"); latch.await(); } }
這里面有100個線程是空轉的,另外還有一個線程BUSY THREAD在狂跑CPU。
javac OOMTest.java
java OOMTest
把程序跑起來,jps -l 找出pid,然后 top -Hp pid
可以看到pid 16813這個對應的線程,把CPU快跑滿了,達到了98.5%
接下來,將16813轉換成16進制 ,即41ad ,然后
jstack pid | grep '41ad'
我們就把最忙的這個線程BUSY THREAD給找出來了(注:這個技巧再次說明了,給線程取個好名字相當重要!)
tips:如果使用spring-boot的話,直接在瀏覽器里查看/dump端點,也可以達到類似jstack的效果。
五、jvisualvm 查看運行情況
JDK_HOME/bin下有一個自帶的jvisualvm工具,可以圖形化的查看GC情況(注:要安裝插件)
java.net這個網站已經被oracle關了,所以安裝插件這里,有點小麻煩,先到https://visualvm.github.io/pluginscenters.html 這里找到jvisualvm對應的jdk版本號,以jdk8為例,地址就是 https://visualvm.github.io/uc/8u131/updates.xml.gz
然后,把這個地址在Plugins里的Settings里改一下,然后Available Plugin這里,就能看到可用插件了,選擇GC插件并安裝。
可以來一段代碼,然后用jvisualvm來看下GC情況
import java.util.ArrayList; import java.util.List; /** * Created by 菩提樹下的楊過 on 05/09/2017. */ public class OOMTest { public static void main(String[] args) throws InterruptedException { List<String> list = new ArrayList<>(); while (true) { Thread.sleep(10); list.add("菩提樹下的楊過" + System.currentTimeMillis()); } } }
可以直觀的看到Old區,Eden區,S0,S1以及Metaspace區的內存變化情況,以上圖為例:Old Gen區占用內存一直在增加,表示可能有內存一直未被釋放,值得關注。
此外,還可以看到占用內存最多的類(即:本文最開始提到的)
也可以查看哪些線程最忙
六、使用jstat 查看GC
雖然jvisualvm很好用,但是通常服務器是用終端連上的,無法運行圖形化界面,而且也并非所有應用都開啟了jmx,所以掌握jstat以命令行方式查看GC情況也是蠻重要的
用法:jstat -gc pid 采樣間隔毫秒數,比如: jstat -gc 8544 5000,將每隔5s采樣一次pid為8544的gc情況
以上圖為例:紅剪頭的地方,S0區的已用量降到0,而S1區的已用量上漲,即說明發生了Young GC,對象從S0區被遷移到了S1區。
title欄的含義如下:
S0C - 新生代中第1塊survivor 的容量(Survivor 0 Capacity),KB單位
S1C - 新生代中第2塊survivor 的容量(Survivor 1 Capacity),KB單位
S0U - 新生代中第1塊survivor 已使用空間數(Survivor 0 Used),KB單位
S1U - 新生代中第2塊survivor 已使用空間數(Survivor 0 Used),KB單位
EC - Eden區的容量(KB)
EU - Eden區已使用(KB數)
OC - Old區的容量(KB)
OU - Old區已使用(KB數)
MC - Metaspace容量(KB)
MU - Metaspace已使用KB
CCSC - 壓縮類的內存容量(KB)
CCSU - 壓縮類的已用容量(KB)
YGC - (從應用啟動算起,到采樣時的) Young GC次數
YGCT - (從應用啟動算起,到采樣時的) Young GC所用時間(秒)
FGC - (從應用啟動算起,到采樣時的) Full GC次數
FGCT - (從應用啟動算起,到采樣時的) Full GC所用時間(秒)
GCT - (從應用啟動算起,到采樣時的) Yong GC + Full GC的總時間
值得一提的是G1垃圾回收器,在大堆(>4G)時,用G1可能效果會更好,G1的開啟方法:
-XX:+UseG1GC -XX:MaxGCPauseMillis=200
開啟后,再使用jmap -heap pid
可以看到從默認的并發GC變成了G1.
jstat -gc pid 5000
看到S0全是0,這也是G1的一個特點,將新生代與老年代的劃分取消掉了,而是用region的新概念,把整個堆內存劃分成一個個region,每個region里再分代,詳情見本文最后的參考文章。
七、導出整個jvm的dump
jmap -dump:format=b,file=文件名 [pid]
最后這個算是放大招了,把整個jvm都導出來分析,通常是其它手段都搞不定的時候,才找運維去搞這個,導出的文件體積大,而且導出時會使應用停頓。把這個文件弄到本地后,可以用eclipse的一個插件MAT來分析,下載地址:http://www.eclipse.org/mat/downloads.php
參考文章:
Java GC系列 http://www.importnew.com/13504.html
深入理解 Java G1 垃圾收集器 http://blog.jobbole.com/109170/
jstat Oracle官方介紹 http://docs.oracle.com/javase/8/docs/technotes/tools/unix/jstat.html
文章列表