经验分享:TimeoutException问题分析与解决

5,645 阅读3分钟


问题概述

在我们项目开发中,在Crash收集平台可能会经常遇到TimeoutException相关的Crash,通常在OPPO的Android 5.0 - 6.0的手机会复现,输出的堆栈日志大概有下面几种:

  java.util.regex.Pattern.finalize() timed out after 120 seconds
  com.android.internal.os.BinderInternal$GcWatcher.finalize() timed 
  out after 120 seconds
  android.database.CursorWindow.finalize() timed out after 10 
  seconds
  java.util.regex.Matcher.finalize() timed out after 10 seconds
  android.graphics.Bitmap$BitmapFinalizer.finalize() timed out after 
  10 seconds
  org.apache.http.impl.conn.SingleClientConnManager.finalize() 
  timed out after 10 seconds
  java.util.concurrent.ThreadPoolExecutor.finalize() timed out after 
  10 seconds
  android.os.BinderProxy.finalize() timed out after 10 seconds
  android.graphics.Path.finalize() timed out after 10 seconds

往往产生这种Crash的数量还挺多,那么该如何解决呢?下面来分析一下问题的产生原因和解决的方式。

原因分析

这个问题的根源在于设备会“Goes to Sleep”一会儿,也就是说操作系统会通过熄屏、降低CPU频率等方式来降低电量消耗,进入休眠状态。它是通过在Linux内核层暂停进程的方式来实现的。它可能发生在应用正常的运行过程中的任何时候, 但是会在一次内核调用中停止,因为上下文切换是在内核层完成的。所以,这就是Dalvik GC参与上述的TimeoutExceptions问题的方式。

Dalvik GC的基本工作方式是,在GC循环中,收集器有一个要销毁的对象的列表,基本的循环处理的流程可以简述为:

  1. 记录开始的时间戳starting_timestamp;
  2. 从要释放的对象列表中把对象移除掉;
  3. 释放对象 - 有必要的话会调用finalize()和本地的destroy()方法;
  4. 记录结束的时间戳end_timestamp;
  5. 计算 (end_timestamp - starting_timestamp),并将其与硬编码的超时时间10秒进行比较;
  6. 如果超时了,抛出java.util.concurrent.TimeoutException异常,并杀死进程。

那么现在考虑下面的场景:

有一个后台运行的进程,在运行过程中,对象被创建、使用并且需要被收集以释放内存。一般的,应用不会使用Wakelock,因为会很耗电并且看起来也没必要。这意味着应用会不时地执行GC动作。通常情况下,GC动作会正常的执行完而不会被挂起。但是,有些时候(非常少见)操作系统会在GC运行的过程中进入休眠。如果你的应用运行时间足够长,它就有可能发生。

现在,再来看一下上述的基本GC循环中的有关时间戳的逻辑。有这样的可能情况,设备开始进行GC,记录开始时间戳,然后在系统对象调用destroy()的过程中进入了休眠。当被唤醒的时候,GC恢复运行,这时候destroy()方法将要结束,记录结束时间戳,也就是说这次GC动作花费的时间=destroy()方法执行时长+休眠时长。如果休眠时间超过10秒, 就会抛出TimeoutException异常。

另外,在Android 5.0+系统上,因为使用了ART GC,使得这个崩溃的发生机率大大降低了。不过OPPO可能是个例外。。。

解决方案

我们可以通过反射来停止FinalizerWatchdogDaemon的方式来解决问题,可以只针对OPPO Android 7.0以下版本的系统进行特殊处理。可以在Application的生命周期内,如attachBaseContext()方法,调用如下的方法:

  private void fixTimeoutException() {
      if (Build.BRAND.equalsIgnoreCase("oppo") && 
  Build.VERSION.SDK_INT < Build.VERSION_CODES.N) {
          try {
              Class clazz = 
  Class.forName("java.lang.Daemons$FinalizerWatchdogDaemon");
 
              Method method = 
  clazz.getSuperclass().getDeclaredMethod("stop");
              method.setAccessible(true);
 
              Field field = clazz.getDeclaredField("INSTANCE");
              field.setAccessible(true);
 
              method.invoke(field.get(null));
          } catch (Exception e) {
              e.printStackTrace();
          }
      }
  }

参考链接

  1. stackoverflow.com/questions/2…
  2. www.jianshu.com/p/0119c682d…