ehcache基本原理详解

5,287 阅读12分钟

ehcache是​​一个用Java实现的使用简单,高速,实现线程安全的缓存管理类库,ehcache提供了用内存,磁盘文件存储,以及分布式存储方式等多种灵活的cache管理方案。
同时ehcache作为开放源代码项目,采用限制比较宽松的Apache License V2.0作为授权方式,被广泛地用于Hibernate, Spring,Cocoon等其他开源系统。


ehcache缓存配置与参数说明-ehcache配置详解 

www.cnblogs.com/jingmoxukon… ehcache入门必备

www.jianshu.com/p/5a0669d63…

www.ehcache.org/

www.ehcache.org/documentati… 官方文档

www.ehcache.org/documentati… pdf文档

skyhigh233.com/blog/2016/1… LRU letcode实现

www.bbsmax.com/A/MAzAWNPp5… cache原理,自动get机制

Ehcache的类层次模型主要为三层,最上层的是
CacheManager
,他是操作Ehcache的入口。
我们可以通过
CacheManager.getInstance()
获得一个单个的
CacheManager,或者通过
CacheManager的构造函数创建一个新的CacheManager
每个CacheManager都管理着多个Cache。
而每个Cache都以一种类Hash的方式,关联着多个Elemenat。
而Element则是我们用于存放要缓存内容的地方。

ehcache的刷新策略

ehcache的刷新策略是当缓存在放入的时候记录一个放入时间,它是用Lazy Evict的方式,在取的时候同设置的TTL比较。

ehcache缓存的3种清空策略:

1 .FIFO,先进先出

2.LFU,最少被使用,缓存的元素有一个hit属性,hit值最小的将会被清出缓存。

3.LRU,最近最少使用的,缓存的元素有一个时间戳,当缓存容量满了,而又需要腾出地方来缓存新的元素的时候,那么现有缓存元素中时间戳离当前时间最远的元素将被清出缓存。

事件处理

可以为CacheManager添加事件监听,当对CacheManager增删Cache时,事件处理器将会得到通知。
要配置事件处理,需要通过ehcache的配置文件来完成。

可以为Cache添加事件监听,当对Cache增删Element时,事件处理器将会得到通知。
要配置事件处理,需要通过ehcache的配置文件来完成。

ehcache参数配置:

maxInMemory -设定内存中创建对象的最大值。

eternal -设置元素(译注:内存中对象)是否永久驻留。
如果是,将忽略超时限制且元素永不消亡。

timeToIdleSeconds -设置某个元素消亡前的停顿时间。
也就是在一个元素消亡之前,两次访问时间的最大时间间隔值。
这只能在元素不是永久驻留时有效(译注:如果对象永恒不灭,则设置该属性也无用)。

如果该值是0就意味着元素可以停顿无穷长的时间。

timeToLiveSeconds -为元素设置消亡前的生存时间。
也就是一个元素从构建到消亡的最大时间间隔值。
这只能在元素不是永久驻留时有效。

overflowToDisk -设置当内存中缓存达到maxInMemory限制时元素是否可写到磁盘上。

1. ehcache使用了LinkedHashMap来存放Element。

jdk要1.5以上。Ehcache1.5可以使用jdk1.4

2、如果在添加Elemtent时,缓存中的Element个数达到了最大缓存数并且overflowToDisk配置的属性为true,Ehcache会更具配置项MemoryStoreEvictionPolicy的失效策略将Element输出到磁盘。
3、如果overflowToDisk为fasle,Ehcache将删除内存中Element。

值得注意的是缓存中失效的Element并不会别马上清理掉,所以想得到内存的真实大小应该调用方法calculateInMemorySize()方法。

4、一个ehcache.xml对应一个CacheManager。

不同的缓存应该对应不同的硬盘上的路径,否则会报错。

注意:要想使用磁盘缓存,缓存的Element必须实现序列化接口。
否则会抛出NotSerializableException异常。

5、Ehcache会将每个缓存配置的文件路径下创建一个cache_name.data文件,如果使用的磁盘持久化技术,还会生成一个cache name.index文件。
6、Ehcache有一个后台线程专门做Ellment失效监测以及清除工作。

设置线程运行间隔时间,可通过设置
diskExpiryThreadIntervalSeconds
属性来完成,此值不宜设置过低,否则会导致清理线程占用大量CPU资源。
默认值是120秒。

7、持久化可在Element的diskPersistent配置项中配置。

如果配置为“false”或是“omitted”在CacheManager shutdown或是startup后,用来缓存Element的文件将被清除掉。
如果设置为“true”,data和index文件会被保存下来,对于新创建的CacheManager Element也是可用的。

使用时必须显示调用cache. Flush()才会将数据缓存到磁盘中。

磁盘缓存步骤:​​从MemoryStore中把没有失效的Element刷新到DiskStore,Element被写入到data文件,Element将被序列化到index文件。

8、磁盘缓存大小默认是没有限制的,不过可通过maxElementsOnDisk来指定。

当磁盘缓存达到maxElementsOnDisk指定的值时,Ehcache会清理磁盘中的缓存使用默认策略是LFU(使用频率最低)。

9、 在使用完Ehcache后,必须要shutdown缓存。

Ehcache中有自己的关闭机制,不过最好在你的代码中显示调用CacheManager.getInstance().shutdown();

10、 Cache API:

对于
getValue()
能取到可序列化的值;

getObjectValue()
取得非序列化的值;

cache.getSize();
得到缓存中元素的个数;

获得当前MemoryStore中的element数量:
cache.getMemoryStoreSize();
获得当前DiskStore中element数量:
cache.getDiskStoreSize();

11、ehcache-core-1.6—1.7没有任何依赖;ehcache1.7.1依赖SLF4J,以及相应的log的jar包。
12、CacheManager可以通过单例(factory的静态方法)或者构造函数(constructors)创建。

分别叫做single model和instance model。

当两种情况都有的时候,系统会采用单例模式,构造器每次都生成单例模式

对于想存储数据到硬盘,或者集群时复制到其他缓存区域的数据,必须可序列化。
如果不可序列化,该数据在进行上述操作时会被丢弃,且没有报错,只是在debug级别有日志信息。

13、读取cache的数据,有以下几种方式:
Cache-aside: 直接操作數據

Cache-as-sor:read-through、write-through和write-behind的結合

Read-through:

Write-through:

Write-behind:
14、从ehcache2.0开始,以下属性可以在运行时改变:
• timeToLive

• timeToIdle

• maxElementsInMemory

• maxElementsOnDisk

• memory store eviciton policy

• CacheEventListeners can be added and removed dynamically []

   當eternal屬性爲“true”時,timeToLive和timeToIdle會失效
15、以下代码演示怎么运行时修改缓存属性
This example shows how to dynamically modify the cache configuration of an already running cache:

Cache cache = manager.getCache("sampleCache");

CacheConfiguration config = cache.getCacheConfiguration();

config.setTimeToIdleSeconds(60);

config.setTimeToLiveSeconds(120);

config.setMaxElementsInMemory(10000);

config.setMaxElementsOnDisk(1000000);


Dynamic cache configurations can also be frozen to prevent future changes:

Cache cache = manager.getCache("sampleCache");

cache.disableDynamicFeatures();
16、磁盘大小

2.5之前是通过元素的个数来表示内存或者硬盘的大小;2.5之后,通过字节数来表示。2.5暂时还没有出来。新属性将会是:

The new cache attributes are:

• maxBytesOnHeap

• maxBytesOffHeap (formerly maxMemoryOffHeap)

• maxBytesOnDisk

甚至,还可以指定比例,如:maxBytesOnHeap=“20%”.

17、 Ehcache可以将一些数据一直放到缓存或者堆栈或者硬盘或者terracotta的L2中。主要是为了满足Hibernate等一些情况下的需求。但是,这样很容易造成内存溢出的错误。
18、 当缓存刚启动时,ehcache提供一个机制可以先加载数据:
BootstrapCacheLoader
 
class="net.sf.ehcache.distribution.jgroups.JGroupsBootstrapCacheLoaderFactory"

properties="bootstrapAsynchronously=true"/>

DiskStoreBootstrapCacheLoaderFactory:從硬盤加載數據到堆棧
 
class="net.sf.ehcache.store.DiskStoreBootstrapCacheLoaderFactory"

properties="bootstrapAsynchronously=true"/>


TerracottaBootstrapCacheLoaderFactory:從terracotta的L2中加載數據


class="net.sf.ehcache.store.TerracottaStoreBootstrapCacheLoaderFactory"

properties="bootstrapAsynchronously=true"/>
19、 可以配置ehcache在读或者写的时候,做些事情。
CacheConfiguration config = new CacheConfiguration("copyCache", 1000).copyOnRead(true)

Cache copyCache = new Cache(config);

\\ 默認此屬性是false。

maxElementsInMemory="10"
eternal="false"

timeToIdleSeconds="5"

timeToLiveSeconds="10"

overflowToDisk="false"
copyOnRead="true"

copyOnWrite="true">

com.company.ehcache.MyCopyStrategy"/>
20、每一个cache都有一个copyStrategy,所以,该实现是要求线程安全的。

在ehcache启动的时候,可以设置缓存失效。
命令行启动的时候如下:

java -Dnet.sf.ehcache.disabled=true

其他特殊的系统属性:

java -Dnet.sf.ehcache.use.classic.lru=true

当LRU被选中的时候,更老的LruMemoryStore实现策略将会被真正采用。

21、ehcache.xml必须遵守ehcache.xsd文件中的要求。
22、当无参的构造函数,或者静态构造方法被调用的时候,系统会在最顶层的classpath路径下找名叫ehcache.xml的配置文件,如果查找失败,会以jar包中的ehcache-failsafe .xml文件(里边的缓存配置极其简单)替代。同时,一个警告会提醒用户建立自己的配置文件。
23、 Update checker可以检查是否有最新的ehcache版本。有两个办法可以去掉该功能:

1)通过系统参数:
-Dnet.sf.ehcache.skipUpdateCheck=true

2)通过配置文件:

xsi:noNamespaceSchemaLocation="ehcache.xsd"

updateCheck="false" monitoring="autodetect"

dynamicConfig="true">
24、 Ehcache1.6之前只支持ASCII编码,之后,UTF-8也被支持。但UTF-8比ASCII更多落后,所以没必要做专门的转换。
25、 每一个Cachemanager应该有自己的独有的ehcache.xml配置文件。

因为,当共用时,硬盘缓存路径或者监听端口将会冲突。
系统也会发出警告,提醒用户配置专门的配置文件为每一个cachemanager.在分布式系统中,ehcache.xml应该配置成一样的。

26、 Ehcache有3个存储:

1) 内存存储

2) 非堆存储(大内存,企业ehcache才拥有)

3) 硬盘存储(两个版本:开源的和企业级ehcache)

1、内存存储

其本质是使用java的LinkedHashMap来实现的。
多线程安全、内存管理安全、速度快。
calculateInMemorySize()
可以用来计算当前ehcache内存占用大小。
但生产线上不应该使用,因为这个功能效率非常低。

同时,ehcache内部有一个低等级的进程,它会判断元素的是否过期。
diskExpiryThreadIntervalSeconds
属性可以设置该线程执行的间隔时间(默认是120秒,不能太小,以免影响效率)。

2、非堆存储

Terracotta BigMemory
是一个新增的功能,它允许系统占用堆以外的内存,速度是硬盘存储的100倍,允许很大的存储空间被创建(350G被测试过)。

因为非堆数据是以字节流的形式存储,所以要求Element的key和value都要是可以序列化的。

因为序列化和反序列化的过程,这种存储形式比内存存储慢10倍。

3、硬盘存储

线程安全的。

27、当maxElementsOnDisk被设置的时候,硬盘上的存储达到限制时,LFU算法会被执行用于清除数据,只能是该算法,不可配置。
28、Persistence被设置成false或者omitted,当系统重启时,不会硬盘的数据存储在硬盘上,.data文件将会被删除.相反,.data文件不会被删除,下次重启后Cachemanager还可以使用.data文件。
29、虚拟机被停止的时候,强烈建议调用Cachemanager.shutdown()方法。
30、在关闭java虚拟机时,系统执行以下步骤:
Considerations for guidance on how to safely shut the Virtual Machine down.

When a DiskStore is persisted, the following steps take place:

• Any non-expired Elements of the MemoryStore are flushed to the DiskStore
• Elements awaiting spooling are spooled to the data file
• The free list and element list are serialized to the index file
On startup the following steps take place:

• An attempt is made to read the index file. If it does not exist or cannot be read successfully, due to disk corruption, upgrade of ehcache, change in JDK version etc, then the data file is deleted and the DiskStore starts with no Elements in it.
• If the index file is read successfully, the free list and element list are loaded into memory. Once this is done, the index file contents are removed. This way, if there is a dirty shutdown, when restarted, Ehcache will delete the dirt index and data files.
• The DiskStore starts. All data is available.
• The expiry thread starts. It will delete Elements which have expired.
31、一个示范性地配置:

把一个拥有8G机器内存的存储分配成各种存储。
设想有一个7G的数据集,共7M个元素,每个元素1k大小。

我们设置1G的堆存储和7G的非堆存储:

java -Xms1G -Xmx1G -XX:maxDirectMemorySize=7G

对应的配置文件为:

maxElementsInMemory=100

overflowToOffHeap="true"(企業)

maxMemoryOffHeap="7G"

最大的Ehcache单实例在内存中可以缓存20GB,最大的磁盘可以缓存100GB

缓存属性:

缓存配置。  

以下属性是必须的:

name - cache的標識符,在一個CacheManager中必須唯一

maxElementsInMemory - 在內存中緩存的element的最大數目

maxElementsOnDisk - 在磁盤上緩存的element的最大數目

eternal - 設定緩存的elements是否有有效期。如果爲true,timeouts屬性被忽略

overflowToDisk - 設定當內存緩存溢出的時候是否將過期的element緩存到磁盤上

以下属性是可选的:

ehcache.xml配置参数说明: name:缓存名称。

·maxElementsInMemory:缓存最大个数。·eternal:缓存中对象是否为永久的,如果是,超时设置将被忽略,对象从不过期。 當eternal屬性爲“true”時,timeToLive和timeToIdle會失效·timeToIdleSeconds:置对象在失效前的允许闲置时间(单位:秒)。仅当eternal=false对象不是永久有效时使用,可选属性,默认值是0,也就是可闲置时间无穷大。· timeToLiveSeconds:缓存数据的生存时间(TTL),也就是一个元素从构建到消亡的最大时间间隔值,这只能在元素不是永久驻留时有效,如果该值是0就意味着元素可以停顿无穷长的时间。·maxEntriesLocalDisk:当内存中对象数量达到maxElementsInMemory时,Ehcache将会对象写到磁盘中。· overflowToDisk:内存不足时,是否启用磁盘缓存。diskSpoolBufferSizeMB:这个参数设置DiskStore(磁盘缓存)的缓存区大小。默认是30MB。每个Cache都应该有自己的一个缓冲区。maxElementsOnDisk: 在磁盘上缓存的element的最大数目,默认值为0,表示不限制。diskPersistent:是否在VM重启时存储硬盘的缓存数据。默认值是false。=true则正常启动加载硬盘数据到内存中 (Server重启时将缓存序列化到本地后再加载,保证缓存在重启后依然有效)。       diskExpiryThreadIntervalSeconds:磁盘失效线程运行时间间隔,默认是120秒。memoryStoreEvictionPolicy:如果内存中数据超过内存限制,向磁盘缓存时的策略。默认值LRU。 当达到maxElementsInMemory限制时,Ehcache将会根据指定的策略去清理内存。默认策略是LRU(最近最少使用)。你可以设置为FIFO(先进先出)或是LFU(较少使用)。clearOnFlush:内存数量最大时是否清除。*cacheEventListenerFactory - 監聽緩存中element的put, remove, update和expire事件

*bootstrapCacheLoaderFactory - 啓動時加載緩存的element每個用來做分佈式緩存都必須設定element的事件監聽器,用來在各個CacheManager節點複製消息。

Ehcache內建了基於RMI的實現 - RMICacheReplicatorFactory