注:這里僅僅是Mysql方面,有人會說高并發(fā)下你這是直接讀寫Mysql啦,項目的瓶頸本來就在數(shù)據(jù)庫啦。。。其實。。。這里只是說Mysql的表怎么去設(shè)計而已。你完全可以在這個地方用隊列去寫表,你也可以把計數(shù)器在內(nèi)存中保存,一直來累加,1個小時持久化一次。你也可以去用號稱每秒讀寫十萬次的Redis。比如我買的500塊一年的虛擬主機,比如萬網(wǎng)的,新網(wǎng)的機器,我只有LAMP架構(gòu),我沒有Memcache,我沒有Redis。對于Mysql我就只能這么去設(shè)計。下面的評論,真不想說什么了。
MySql計數(shù)器,如網(wǎng)站點擊數(shù),如何實現(xiàn)高性能高并發(fā)的計數(shù)器功能。
現(xiàn)在有很多的項目,對計數(shù)器的實現(xiàn)甚是隨意,比如在實現(xiàn)網(wǎng)站文章點擊數(shù)的時候,是這么設(shè)計數(shù)據(jù)表的,如:”article_id, menu_id, article_name, article_content, article_author, article_view......在article_view中記錄該文章的瀏覽量。詐一看似乎沒有問題。對于小站,比如本博客,就是這么做的,因為小菜的博客難道會涉及并發(fā)問題嗎?答案顯而易見,一天沒多少IP,而且以后不會很大。
言歸正傳,對文章資訊類為主的項目,在瀏覽一個頁面的時候不但要進(jìn)行大量的查(查詢上文的記錄,已經(jīng)所屬分類的名字、熱門文章資訊評論、TAG等),還要進(jìn)行寫操作(更新瀏覽數(shù)點擊數(shù))。把文章的詳細(xì)內(nèi)容和計數(shù)器放在一張表盡管對開發(fā)很方便,但是會造成數(shù)據(jù)庫的壓力過大(不然為什么大項目都要分庫分表呢)。
那么,分兩張表存放就好了么?一張表存文章詳細(xì)信息,另一張表單獨存計數(shù)器。
這種方式,雖然分擔(dān)了文章表的壓力,但是每當(dāng)有一個進(jìn)程請求更新的時候,都會產(chǎn)生全局的互斥鎖,只能串行,不能并行。在高并發(fā)下會有較長的等待時間。
另一種比較好的辦法是對每一個文章的計數(shù)器不是一行,而是多行,比如吧,一百行。每次隨機更新其中一行,該文章的瀏覽數(shù)就是所有行的和。
小訪問量的隨機池子100個肯定多了,三五個足矣。每次訪問的時候,隨機一個數(shù)字(1-100)作為pond,如何該pond存在則更新view+1,否則插入,view=1。借助DUPLICATE KEY,不然在程序里是實現(xiàn)得先SELECT,判斷一下再INSERT或者UPDATE。
INSERT INTO `article_view` (`article_id`, `pond`, `view`) VALUES (`123`, RAND()*100, 1) ON DUPLICATE KEY UPDATE `view`=`view`+1
獲取指定文章的總訪問量的時候:
SELECT SUM(`view`) FROM `article_view` WHERE `article_id`='123'
凡事都是雙刃劍。為了更快的讀我們通常要犧牲一些東西。在讀比較多的表要加快讀的速度,在寫較多的表要加快寫的速度。各自權(quán)衡。在加快讀的速度的時候,我們犧牲的并不僅僅是寫的性能,還有開發(fā)成本,開發(fā)變的更復(fù)雜,維護(hù)成本等。所以并不是讀的速度越快越好,需要找一個平衡點。