【深入浅出Spring原理及实战】「缓存Cache开发系列」带你深入分析Spring所提供的缓存Cache抽象详解的核心原理探索

3,957 阅读8分钟

缓存的理解

缓存的工作机制是先从缓存中读取数据,如果没有再从慢速设备上读取实际数据,并将数据存入缓存中。通常情况下,我们会将那些经常读取且不经常修改的数据或昂贵(CPU/IO)的且对于相同请求有相同计算结果的数据存储到缓存中。

它能够让数据更加接近于使用者,下图所示。

                +---------------------+
                |      应用程序       |
                +---------------------+
                           |
                           v
                +---------------------+
                |       缓存层        |
                +---------------------+
                           |
                           v
          +-----------------------------+
          |         数据源              |
          +-----------------------------+  

这个图表示在应用程序和数据源之间添加了一个缓存层。在访问数据时,应用程序首先会尝试从缓存层中获取数据。如果数据已经存在于缓存中,则直接返回。否则,需要从数据源获取数据,并将其存储到缓存中,以便以后能够更快地获取相同的数据。这样做可以显著提高应用程序的性能和响应速度,并减轻数据源的负载。

缓存使用的案例

一个典型的例子是CPU--L1/L2--内存--磁盘的存储结构。当CPU需要数据时,它会先从L1/L2缓存中读取数据,如果没有则到内存中查找,最后再到磁盘上找。此外,在使用Maven时,我们的依赖通常会先从本地仓库中查找,然后再到本地服务器仓库查找,最后才去远程仓库服务器查找。京东的物流为什么如此快?这是因为他们在各个地方都建立了分仓库,如果货物在该仓库内,则配送速度非常快。

             +---------------------+ 
             |         CPU         |
             +---------------------+
                       |
                       v
	       +------------------------+
	       |       L1/L2 Cache      |
	       +------------------------+
                       |
                       v
            +-----------------+
            |       内存        |
            +-----------------+
                       |
                       v
            +----------------------------+
            |           磁盘             |
            +----------------------------+

缓存命中率

即从缓存中读取数据的次数 与 总读取次数的比率,命中率越高越好:

命中率 = 从缓存中读取次数 / (总读取次数[从缓存中读取次数 + 从慢速设备上读取的次数]) Miss率 = 没有从缓存中读取的次数 / (总读取次数[从缓存中读取次数 + 从慢速设备上读取的次数]) 这是一个非常重要的监控指标,如果做缓存一定要健康这个指标来看缓存是否工作良好;

基本概念

在合理应用缓存前,需要了解缓存领域里相关的几个常用术语:

  • 【缓存命中】: 表示数据已经存在于缓存中,可以直接从缓存获取数据,无需重新访问原始数据源。

  • 【缓存未命中】:表示数据不在缓存中,如果缓存空间有剩余,则会将数据添加到缓存中。

  • 【存储成本】:当出现缓存未命中时,需要从原始数据源拉取数据并将其放置到缓存中。这个操作的时间和空间成本称为“存储成本”。

  • 【缓存失效】:当数据源发生更改时,缓存中的数据将变得过时,需要更新或清除缓存以确保下次请求时能够访问最新数据。

  • 【缓存污染】:将不常访问的数据存储到缓存中,可能会占用缓存空间,导致高频访问的数据无法存储到缓存中。

  • 【移除策略】(Eviction policy):即如果缓存满了,从缓存中移除数据的策略;常见的有LFU、LRU、FIFO等,需要通过替换策略删除缓存中的一些数据来腾出空间。常见的替换策略包括以下几种:

    • 先进先出(FIFO,First In First Out):先进先出算法,即删除缓存中最早添加的数据。
    • 最近最少使用(LRU,Least Recently Used):最久未使用算法,删除最长时间未被访问的数据,使用时间距离现在最久的那个被移除;
    • 最少使用(LFU,Least Frequently Used):最近最少使用算法,删除最少访问次数的数据,一定时间段内使用次数(频率)最少的那个被移除;
    • 随机替换(RR):随机选择一个数据进行删除。
  • 【存活期】TTL(Time To Live ),即从缓存中创建时间点开始直到它到期的一个时间段(不管在这个时间段内有没有访问都将过期)

  • 【空闲期】TTI(Time To Idle),即一个数据多久没被访问将从缓存中移除的时间。

到此,我们已经基本了解了缓存的概念。在Java中,我们通常会对方法调用进行缓存控制,例如对于方法 "getValueByKey(String key)",我们应该首先从缓存中查找是否有对应的数据,如果没有再调用该方法从数据库中加载用户数据,并将其添加到缓存中。这样,在下一次调用相同的方法时,就可以直接从缓存中获取数据,而无需再次访问数据库。


Spring Cache API及默认提供的实现

自Spring 3.1起,提供了Cache支持,且提供了Cache抽象,在此之前一般通过AOP实现,使用Spring Cache的好处:提供基本的Cache抽象,方便切换各种底层Cache;通过注解Cache可以实现类似于事务一样,缓存逻辑透明的应用到我们的业务代码上,且只需要更少的代码就可以完成;

对于Spring Cache抽象,主要从以下几个方面学习:


+------------------------+           +-------------------------+
|       Cache API        |           |   默认提供的Cache实现   |
+------------------------+           +-------------------------+
         |                                     |
         v                                     v
+------------------------+           +-------------------------+
|      Cache注解         |           | 实现复杂的Cache逻辑      |
+------------------------+           +-------------------------+

Spring提供的核心Cache接口

开发者首先可以通过Cache API与默认提供的Cache实现进行交互,获取并存储数据。而在一些情况下,可以通过使用Cache注解来简化对缓存的使用。此外,如果需要实现更复杂的缓存逻辑,也可以自己实现相应的缓存逻辑。

Java代码

package org.springframework.cache;  

public interface Cache {  
    String getName();  //缓存的名字  
    Object getNativeCache(); //得到底层使用的缓存,如Ehcache  
    ValueWrapper get(Object key); //根据key得到一个ValueWrapper,然后调用其get方法获取值  
    <T> T get(Object key, Class<T> type);//根据key,和value的类型直接获取value  
    void put(Object key, Object value);//往缓存放数据  
    void evict(Object key);//从缓存中移除key对应的缓存  
    void clear(); //清空缓存  
    interface ValueWrapper { //缓存值的Wrapper  
        Object get(); //得到真实的value  
    }  
}  

通过上面的源码可以看出来,Spring-Cache是提供了缓存操作的读取/写入/移除方法。

默认提供了如下实现:

  • ConcurrentMapCache:使用java.util.concurrent.ConcurrentHashMap实现的Cache;
  • GuavaCache:对Guava com.google.common.cache.Cache进行的Wrapper,需要Google Guava 12.0或更高版本,@since spring 4;
  • EhCacheCache:使用Ehcache实现
  • JCacheCache:对javax.cache.Cache进行的wrapper,@since spring 3.2;spring4将此类更新到JCache 0.11版本;

另外,因为我们在应用中并不是使用一个Cache,而是多个,因此Spring还提供了CacheManager抽象,用于缓存的管理:

Java代码

package org.springframework.cache;  
import java.util.Collection;  
public interface CacheManager {  
    Cache getCache(String name); //根据Cache名字获取Cache   
    Collection<String> getCacheNames(); //得到所有Cache的名字  
}  

默认提供的实现:

  • ConcurrentMapCacheManager/ConcurrentMapCacheFactoryBean:管理ConcurrentMapCache; GuavaCacheManager;
  • EhCacheCacheManager/EhCacheManagerFactoryBean;
  • JCacheCacheManager/JCacheManagerFactoryBean;

另外还提供了CompositeCacheManager用于组合CacheManager,即可以从多个CacheManager中轮询得到相应的Cache,如

Java代码
<bean id="cacheManager" class="org.springframework.cache.support.CompositeCacheManager">  
    <property name="cacheManagers">  
        <list>  
            <ref bean="ehcacheManager"/>  
            <ref bean="jcacheManager"/>  
        </list>  
    </property>  
    <property name="fallbackToNoOpCache" value="true"/>  
</bean>  

当我们调用cacheManager.getCache(cacheName) 时,会先从第一个cacheManager中查找有没有cacheName的cache,如果没有接着查找第二个,如果最后找不到,因为fallbackToNoOpCache=true,那么将返回一个NOP的Cache否则返回null。

除了GuavaCacheManager之外,其他Cache都支持Spring事务的,即如果事务回滚了,Cache的数据也会移除掉。

Spring不进行Cache的缓存策略的维护,这些都是由底层Cache自己实现,Spring只是提供了一个Wrapper,提供一套对外一致的API。

Spring缓存的问题

Spring缓存模糊匹配Evict的问题

缓存都是key-value风格的,模糊匹配本来就不应该是Cache要做的;而是通过自己的缓存代码实现;

Spring cache的缺陷

假设有一个缓存,其中存储了list类型的数据。现在我执行了一个update(user)方法,但并不想清除整个缓存,而只是希望替换掉更新过的元素。

在现有的缓存抽象中,并没有很好的解决方案,可以考虑通过在之前的Helper方法中使用condition来解决这个问题,但这并不是一种十分优雅的方式。

因此,我认为Spring Cache注解还存在一些不完美之处。针对这种情况,我们可以通过对Cacheable注解进行增强来实现更加灵活的缓存控制。具体地说,我们可以在Cacheable注解中添加SpEL表达式,用于定制要缓存的数据、方法执行前后的条件以及缓存成功后的其他逻辑。例如:

@Cacheable(cacheName = "缓存名称", key="缓存key/SpEL", value="缓存值/SpEL/不填默认返回值", beforeCondition="方法执行之前的条件/SpEL", afterCondition="方法执行后的条件/SpEL", afterCache="缓存之后执行的逻辑/SpEL")

当然,对于大多数场景,Spring Cache注解已经足够使用。如果需要处理更加复杂的场景,则可以考虑使用AOP。如果需要自定义实现缓存逻辑,则应该使用Spring Cache API进行缓存抽象。