说说Android的UI刷新机制

7,667 阅读8分钟

本文主要解决以下几个问题:

  • 我们都知道Android的刷新频率是60帧/秒,这是不是意味着每隔16ms就会调用一次onDraw方法?
  • 如果界面不需要重绘,那么16ms到后还会刷新屏幕吗?
  • 我们调用invalidate()之后会马上进行屏幕刷新吗?
  • 我们说丢帧是因为主线程做了耗时操作,为什么主线程做了耗时操作就会引起丢帧?
  • 如果在屏幕快要刷新的时候才去OnDraw()绘制,会丢帧吗?

好了,带着以上问题,我们进入源码来找寻答案。

一、屏幕绘制流程

屏幕绘制机制的基本原理可以概括如下:

整个屏幕绘制的基本流程是:

  • 应用向系统服务申请buffer
  • 系统服务返回buffer
  • 应用绘制后提交buffer给系统服务

如果放到Android中来,那么就是:

在Android中,一块Surface对应一块内存,当内存申请成功后,App端才有绘图的地方。由于Android的view绘制不是今天的重点,所以这里点到为止~

二、屏幕刷新分析

屏幕刷新的时机是当Vsync信号到来的时候,具体如图:

在Android端,是谁在控制Vsync的产生?又是谁来通知我们应用进行刷新的呢? 在Android中,Vysnc信号的产生是由底层HWComposer负责的,而通知应用进行刷新,是Java层的Choreographer,Android整个屏幕刷新的核心就在于这个Choreographer

下面我们结合代码一起来看一下。

每次当我们要进行ui重绘的时候,都会调用requestLayout(),所以,我们从这个方法入手:

2.1 requestLayout()

----》类名:ViewRootImpl

    @Override
    public void requestLayout() {
        if (!mHandlingLayoutInLayoutRequest) {
            checkThread();
            mLayoutRequested = true;
            //重点
            scheduleTraversals();
        }
    }

2.2 scheduleTraversals()

----》类名:ViewRootImpl

    void scheduleTraversals() {
        if (!mTraversalScheduled) {
            mTraversalScheduled = true;
            mTraversalBarrier = mHandler.getLooper().getQueue().postSyncBarrier();
            mChoreographer.postCallback(
                    Choreographer.CALLBACK_TRAVERSAL, mTraversalRunnable, null);
           ......
        }
    }

可以看到,在这里并没有立即进行重绘,而是做了两件事情:

  • 往消息队列里面插入一条SyncBarrier(同步屏障)
  • 通过Cherographer post了一个callback

接下来,我们简单说一下这个SyncBarrier(同步屏障)。

同步屏障的作用在于:

  • 阻止同步消息的执行
  • 优先执行异步消息

为什么要设计这个SyncBarrier呢?主要原因在于,在Android中,有些消息是十分紧急的,需要马上执行,如果说消息队列里面普通消息太多的话,那等到执行它的时候可能早就过了时机了。

到这里,可能有人会跟我一样,觉得为什么不干脆在Message里搞个优先级,按照优先级来进行排序呢?弄个PriorityQueue不就完了吗?

我自己的理解是,在Android中,消息队列的设计是一个单链表,整个链表的排序是根据时间进行排序的,如果此时再加入一个优先级的排序规则,一方面会复杂会排序规则,另一方面,也会使得消息不可控。因为优先级是可以用户自己在外面填的,那样不就乱套了吗?如果用户每次总填最高的优先级,这样就会导致系统消息很久才会消费,整个系统运作就会出问题,最后影响用户体验,所以,我自己觉得Android的同步屏障这个设计还是挺巧妙的~

好了,总结一下,执行scheduleTraversals() 后,会插入一个屏障,保证异步消息的优先执行。

插入一个小小的思考题: 如果说我们在一个方法里连续调用了requestLayout()多次,那么请问:系统会插入多条屏障或者post多个Callback吗? 答案是不会,为什么呢?看到mTraversalScheduled这个变量了吗?它就是答案~

2.3 Choreographer.postCallback()

先来简单说一下ChoreographerChoreographer中文翻译叫编舞者,它的主要作用是进行系统协调的。(大家可以上网google下实际工作中的编舞者,这个类名真的起的很贴切了~)

Choreographer这个类是应用怎么初始化的呢?是通过getInstance()方法:

    public static Choreographer getInstance() {
        return sThreadInstance.get();
    }
    
        // Thread local storage for the choreographer.
    private static final ThreadLocal<Choreographer> sThreadInstance =
            new ThreadLocal<Choreographer>() {
        @Override
        protected Choreographer initialValue() {
            Looper looper = Looper.myLooper();
            if (looper == null) {
                throw new IllegalStateException("The current thread must have a looper!");
            }
            Choreographer choreographer = new Choreographer(looper, VSYNC_SOURCE_APP);
            if (looper == Looper.getMainLooper()) {
                mMainInstance = choreographer;
            }
            return choreographer;
        }
    };

这里贴出来是为了提醒大家,Choreographer不是单例,而是每个线程都有单独的一份。

好了,回到我们的代码:

 ----》类名:Choreographer
 //1
    public void postCallback(int callbackType, Runnable action, Object token) {
        postCallbackDelayed(callbackType, action, token, 0);
    }
  //2  
     public void postCallbackDelayed(int callbackType,
            Runnable action, Object token, long delayMillis) {
       ....
        postCallbackDelayedInternal(callbackType, action, token, delayMillis);
    }
    //3
      private void postCallbackDelayedInternal(int callbackType,
            Object action, Object token, long delayMillis) {
                ...
                mCallbackQueues[callbackType].addCallbackLocked(dueTime, action, token);
                if (dueTime <= now) {
                scheduleFrameLocked(now);
            } else {
                ...
              }
            }

Choreographerpost的callback会放入CallbackQueue里面,这个CallbackQueue是一个单链表。

首先会根据callbackType得到一条CallbackQueue单链表,之后会根据时间顺序,将这个callback插入到单链表中;

2.4 scheduleFrameLocked()

 ----》类名:Choreographer
  private void scheduleFrameLocked(long now) {
       ...
       // If running on the Looper thread, then schedule the vsync immediately,
                // otherwise post a message to schedule the vsync from the UI thread
                // as soon as possible.
                if (isRunningOnLooperThreadLocked()) {
                    scheduleVsyncLocked();
                } else {
                    Message msg = mHandler.obtainMessage(MSG_DO_SCHEDULE_VSYNC);
                    msg.setAsynchronous(true);
                    mHandler.sendMessageAtFrontOfQueue(msg);
                }
            } else {
               ...
            }
        }
    }

scheduleFrameLocked的作用是:

  • 如果当前线程就是Cherographer的工作线程的话,那么就直接执行scheduleVysnLocked
  • 否则,就发送一个异步消息到消息队列里面去 ,这个异步消息是不受同步屏障影响的,而且这个消息还要插入到消息队列的头部,可见这个消息是非常紧急的

跟踪源代码,我们发现,其实MSG_DO_SCHEDULE_VSYNC这条消息,最终执行的也是scheduleFrameLocked这个方法,所以我们直接跟踪scheduleVsyncLocked()这个方法。

2.5 scheduleVsyncLocked()

 ----》类名:Choreographer
 
    private void scheduleVsyncLocked() {
        mDisplayEventReceiver.scheduleVsync();
    }
    
 ----》类名:DisplayEventReceiver
 
        public void scheduleVsync() {
        if (mReceiverPtr == 0) {
            Log.w(TAG, "Attempted to schedule a vertical sync pulse but the display event "
                    + "receiver has already been disposed.");
        } else {
        //mReceiverPtr是Native层一个类的指针地址
        //这里这个类指的是底层NativeDisplayEventReceiver这个类
        //nativeScheduleVsync底层会调用到requestNextVsync()去请求下一个Vsync,
        //具体不跟踪了,native层代码更长,还涉及到各种描述符监听以及跨进程数据传输
            nativeScheduleVsync(mReceiverPtr);
        }
    }

这里我们可以看到一个新的类:DisplayEventReceiver,这个类的作用是注册Vsync信号的监听,当下个Vsync信号到来的时候就会通知到这个DisplayEventReceiver了。

在哪里通知呢?源码里注释写的非常清楚了:

 ----》类名:DisplayEventReceiver
 
    // Called from native code.  <---注释还是很良心的
    private void dispatchVsync(long timestampNanos, int builtInDisplayId, int frame) {
        onVsync(timestampNanos, builtInDisplayId, frame);
    }

当下一个Vysnc信号到来的时候,会最终调用onVsync方法:

    public void onVsync(long timestampNanos, int builtInDisplayId, int frame) {
    }

点进去一看,是个空实现,回到类定义,原来是个抽象类,它的实现类是: FrameDisplayEventReceiver,定义在Cherographer里面:

 ----》类名:Choreographer
 
private final class FrameDisplayEventReceiver extends DisplayEventReceiver
            implements Runnable {
            ....
            }

2.6 FrameDisplayEventReceiver.onVysnc()

 ----》类名:Choreographer
 
 private final class FrameDisplayEventReceiver extends DisplayEventReceiver
            implements Runnable {

        @Override
        public void onVsync(long timestampNanos, int builtInDisplayId, int frame) {
             ....
            mTimestampNanos = timestampNanos;
            mFrame = frame;
            Message msg = Message.obtain(mHandler, this);
            msg.setAsynchronous(true);
            mHandler.sendMessageAtTime(msg, timestampNanos / TimeUtils.NANOS_PER_MS);
        }

        @Override
        public void run() {
            ....
            doFrame(mTimestampNanos, mFrame);
        }
    }

onVsync方法往Cherographer所在线程的消息队列中发送的一个消息,这个消息是就是它自己(它实现了Runnable),所以最终会调用到doFrame()方法。

2.7 doFrame(mTimestampNanos, mFrame)

doFrame()的处理分为两个阶段:

   void doFrame(long frameTimeNanos, int frame) {
        final long startNanos;
        synchronized (mLock) {
           //1、阶段一
            long intendedFrameTimeNanos = frameTimeNanos;
            startNanos = System.nanoTime();
            final long jitterNanos = startNanos - frameTimeNanos;
            if (jitterNanos >= mFrameIntervalNanos) {
                final long skippedFrames = jitterNanos / mFrameIntervalNanos;
                if (skippedFrames >= SKIPPED_FRAME_WARNING_LIMIT) {
                    Log.i(TAG, "Skipped " + skippedFrames + " frames!  "
                            + "The application may be doing too much work on its main thread.");
                }
                ...
            }
            ...
        }

frameTimeNanos是当前的时间戳,将当前的时间和开始时间相减,得到这一帧处理花费了多长,如果大于mFrameIntervalNano,说明处理耗时了,之后就打印出我们日常见到的The application may be doing too much work on its main thread

阶段二:

 void doFrame(long frameTimeNanos, int frame) {
 ...
try {
//阶段2
            Trace.traceBegin(Trace.TRACE_TAG_VIEW, "Choreographer#doFrame");
            AnimationUtils.lockAnimationClock(frameTimeNanos / TimeUtils.NANOS_PER_MS);

            mFrameInfo.markInputHandlingStart();
            doCallbacks(Choreographer.CALLBACK_INPUT, frameTimeNanos);

            mFrameInfo.markAnimationsStart();
            doCallbacks(Choreographer.CALLBACK_ANIMATION, frameTimeNanos);

            mFrameInfo.markPerformTraversalsStart();
            doCallbacks(Choreographer.CALLBACK_TRAVERSAL, frameTimeNanos);

            doCallbacks(Choreographer.CALLBACK_COMMIT, frameTimeNanos);
        } 
        ...
        }

doFrame()的第二个阶段做的是处理各种callback,从CallbackQueue里面取出到执行时间的callback进行处理,那这个callback是怎么样呢?

这里要回忆一下之前的postCallback()操作:

这个Callback其实就一个mTraversalRunnable,它是一个Runnable,最终会调用到run()方法,实现界面的真正刷新:

 ----》类名:ViewRootImpl

    final class TraversalRunnable implements Runnable {
        @Override
        public void run() {
            doTraversal();
        }
    }
    
    void doTraversal() {
        if (mTraversalScheduled) {
          ...
            performTraversals();
         ...
        }
    }
    
    private void performTraversals() {
      ...
      //开始真正的界面绘制
       performDraw();
      ...
    }

三、总结

经过漫长的代码跟踪,整个界面刷新流程算是跟踪完了,下面我们来总结一下:

四、问题解答

  • 我们都知道Android的刷新频率是60帧/秒,这是不是意味着每隔16ms就会调用一次onDraw方法?

这里60帧/秒是屏幕刷新频率,但是是否会调用onDraw()方法要看应用是否调用requestLayout()进行注册监听。

  • 如果界面不需要重绘,那么还16ms到后还会刷新屏幕吗?

如果不需要重绘,那么应用就不会受到Vsync信号,但是还是会进行刷新,只不过绘制的数据不变而已;

  • 我们调用invalidate()之后会马上进行屏幕刷新吗?

不会,到等到下一个Vsync信号到来

  • 我们说丢帧是因为主线程做了耗时操作,为什么主线程做了耗时操作就会引起丢帧

原因是,如果在主线程做了耗时操作,就会影响下一帧的绘制,导致界面无法在这个Vsync时间进行刷新,导致丢帧了。

  • 如果在屏幕快要刷新的时候才去OnDraw()绘制,会丢帧吗?

这个没有太大关系,因为Vsync信号是周期的,我们什么时候发起onDraw()不会影响界面刷新;

五、参考文档