在前面談到了一些關(guān)于內(nèi)存模型以及并發(fā)編程中可能會出現(xiàn)的一些問題。下面我們來看一下Java內(nèi)存模型,研究一下Java內(nèi)存模型為我們提供了哪些保證以及在java中提供了哪些方法和機(jī)制來讓我們在進(jìn)行多線程編程時能夠保證程序執(zhí)行的正確性。
在Java虛擬機(jī)規(guī)范中試圖定義一種Java內(nèi)存模型(Java Memory Model,JMM)來屏蔽各個硬件平臺和操作系統(tǒng)的內(nèi)存訪問差異,以實(shí)現(xiàn)讓Java程序在各種平臺下都能達(dá)到一致的內(nèi)存訪問效果。那么Java內(nèi)存模型規(guī)定了哪些東西呢,它定義了程序中變量的訪問規(guī)則,往大一點(diǎn)說是定義了程序執(zhí)行的次序。注意,為了獲得較好的執(zhí)行性能,Java內(nèi)存模型并沒有限制執(zhí)行引擎使用處理器的寄存器或者高速緩存來提升指令執(zhí)行速度,也沒有限制編譯器對指令進(jìn)行重排序。也就是說,在java內(nèi)存模型中,也會存在緩存一致性問題和指令重排序的問題。
Java內(nèi)存模型規(guī)定所有的變量都是存在主存當(dāng)中(類似于前面說的物理內(nèi)存),每個線程都有自己的工作內(nèi)存(類似于前面的高速緩存)。線程對變量的所有操作都必須在工作內(nèi)存中進(jìn)行,而不能直接對主存進(jìn)行操作。并且每個線程不能訪問其他線程的工作內(nèi)存。
舉個簡單的例子:在java中,執(zhí)行下面這個語句:
i = 10;
執(zhí)行線程必須先在自己的工作線程中對變量i所在的緩存行進(jìn)行賦值操作,然后再寫入主存當(dāng)中。而不是直接將數(shù)值10寫入主存當(dāng)中。
那么Java語言 本身對 原子性、可見性以及有序性提供了哪些保證呢?
在Java中,對基本數(shù)據(jù)類型的變量的讀取和賦值操作是原子性操作,即這些操作是不可被中斷的,要么執(zhí)行,要么不執(zhí)行。
上面一句話雖然看起來簡單,但是理解起來并不是那么容易。看下面一個例子i:
請分析以下哪些操作是原子性操作:
x = 10; //語句1
y = x; //語句2
x++; //語句3
x = x + 1; //語句4
咋一看,有些朋友可能會說上面的4個語句中的操作都是原子性操作。其實(shí)只有語句1是原子性操作,其他三個語句都不是原子性操作。
語句1是直接將數(shù)值10賦值給x,也就是說線程執(zhí)行這個語句的會直接將數(shù)值10寫入到工作內(nèi)存中。
語句2實(shí)際上包含2個操作,它先要去讀取x的值,再將x的值寫入工作內(nèi)存,雖然讀取x的值以及 將x的值寫入工作內(nèi)存 這2個操作都是原子性操作,但是合起來就不是原子性操作了。
同樣的,x++和 x = x+1包括3個操作:讀取x的值,進(jìn)行加1操作,寫入新的值。
所以上面4個語句只有語句1的操作具備原子性。
也就是說,只有簡單的讀取、賦值(而且必須是將數(shù)字賦值給某個變量,變量之間的相互賦值不是原子操作)才是原子操作。
不過這里有一點(diǎn)需要注意:在32位平臺下,對64位數(shù)據(jù)的讀取和賦值是需要通過兩個操作來完成的,不能保證其原子性。但是好像在最新的JDK中,JVM已經(jīng)保證對64位數(shù)據(jù)的讀取和賦值也是原子性操作了。
從上面可以看出,Java內(nèi)存模型只保證了基本讀取和賦值是原子性操作,如果要實(shí)現(xiàn)更大范圍操作的原子性,可以通過synchronized和Lock來實(shí)現(xiàn)。由于synchronized和Lock能夠保證任一時刻只有一個線程執(zhí)行該代碼塊,那么自然就不存在原子性問題了,從而保證了原子性。
對于可見性,Java提供了volatile關(guān)鍵字來保證可見性。
當(dāng)一個共享變量被volatile修飾時,它會保證修改的值會立即被更新到主存,當(dāng)有其他線程需要讀取時,它會去內(nèi)存中讀取新值。
而普通的共享變量不能保證可見性,因?yàn)槠胀ü蚕碜兞勘恍薷闹螅裁磿r候被寫入主存是不確定的,當(dāng)其他線程去讀取時,此時內(nèi)存中可能還是原來的舊值,因此無法保證可見性。
另外,通過synchronized和Lock也能夠保證可見性,synchronized和Lock能保證同一時刻只有一個線程獲取鎖然后執(zhí)行同步代碼,并且在釋放鎖之前會將對變量的修改刷新到主存當(dāng)中。因此可以保證可見性。
在Java內(nèi)存模型中,允許編譯器和處理器對指令進(jìn)行重排序,但是重排序過程不會影響到單線程程序的執(zhí)行,卻會影響到多線程并發(fā)執(zhí)行的正確性。
在Java里面,可以通過volatile關(guān)鍵字來保證一定的“有序性”(具體原理在下一節(jié)講述)。另外可以通過synchronized和Lock來保證有序性,很顯然,synchronized和Lock保證每個時刻是有一個線程執(zhí)行同步代碼,相當(dāng)于是讓線程順序執(zhí)行同步代碼,自然就保證了有序性。
另外,Java內(nèi)存模型具備一些先天的“有序性”,即不需要通過任何手段就能夠得到保證的有序性,這個通常也稱為 happens-before 原則。如果兩個操作的執(zhí)行次序無法從happens-before原則推導(dǎo)出來,那么它們就不能保證它們的有序性,虛擬機(jī)可以隨意地對它們進(jìn)行重排序。
下面就來具體介紹下happens-before原則(先行發(fā)生原則):
程序次序規(guī)則:一個線程內(nèi),按照代碼順序,書寫在前面的操作先行發(fā)生于書寫在后面的操作
鎖定規(guī)則:一個unLock操作先行發(fā)生于后面對同一個鎖額lock操作
volatile變量規(guī)則:對一個變量的寫操作先行發(fā)生于后面對這個變量的讀操作
傳遞規(guī)則:如果操作A先行發(fā)生于操作B,而操作B又先行發(fā)生于操作C,則可以得出操作A先行發(fā)生于操作C
線程啟動規(guī)則:Thread對象的start()方法先行發(fā)生于此線程的每個一個動作
線程中斷規(guī)則:對線程interrupt()方法的調(diào)用先行發(fā)生于被中斷線程的代碼檢測到中斷事件的發(fā)生
線程終結(jié)規(guī)則:線程中所有的操作都先行發(fā)生于線程的終止檢測,我們可以通過Thread.join()方法結(jié)束、Thread.isAlive()的返回值手段檢測到線程已經(jīng)終止執(zhí)行
對象終結(jié)規(guī)則:一個對象的初始化完成先行發(fā)生于他的finalize()方法的開始
這8條原則摘自《深入理解Java虛擬機(jī)》。
這8條規(guī)則中,前4條規(guī)則是比較重要的,后4條規(guī)則都是顯而易見的。
下面我們來解釋一下前4條規(guī)則:
對于程序次序規(guī)則來說,我的理解就是一段程序代碼的執(zhí)行在單個線程中看起來是有序的。注意,雖然這條規(guī)則中提到“書寫在前面的操作先行發(fā)生于書寫在后面的操作”,這個應(yīng)該是程序看起來執(zhí)行的順序是按照代碼順序執(zhí)行的,因?yàn)樘摂M機(jī)可能會對程序代碼進(jìn)行指令重排序。雖然進(jìn)行重排序,但是最終執(zhí)行的結(jié)果是與程序順序執(zhí)行的結(jié)果一致的,它只會對不存在數(shù)據(jù)依賴性的指令進(jìn)行重排序。因此,在單個線程中,程序執(zhí)行看起來是有序執(zhí)行的,這一點(diǎn)要注意理解。事實(shí)上,這個規(guī)則是用來保證程序在單線程中執(zhí)行結(jié)果的正確性,但無法保證程序在多線程中執(zhí)行的正確性。
第二條規(guī)則也比較容易理解,也就是說無論在單線程中還是多線程中,同一個鎖如果出于被鎖定的狀態(tài),那么必須先對鎖進(jìn)行了釋放操作,后面才能繼續(xù)進(jìn)行l(wèi)ock操作。
第三條規(guī)則是一條比較重要的規(guī)則,也是后文將要重點(diǎn)講述的內(nèi)容。直觀地解釋就是,如果一個線程先去寫一個變量,然后一個線程去進(jìn)行讀取,那么寫入操作肯定會先行發(fā)生于讀操作。
第四條規(guī)則實(shí)際上就是體現(xiàn)happens-before原則具備傳遞性。