阅读 825

Android录音并输出为Mp4文件

录音采用的是AudioRecord,通过MediaCodec进行编码,用MediaMuxer合成输出MP4文件。

1.

这里用AudioRecord来得到从麦克风录制的声音,AudiorRecord的用法还是比较简单的,首先初始化AudioRecord

fun prepare(file: File?, outputFormat: Int = MediaMuxer.OutputFormat.MUXER_OUTPUT_MPEG_4, audioSource: Int = MediaRecorder.AudioSource.MIC, sampleRateInHz: Int = 44100, channelConfig: Int = AudioFormat.CHANNEL_IN_STEREO, audioFormat: Int = AudioFormat.ENCODING_PCM_16BIT, bufferSizeInBytes: Int = AudioRecord.getMinBufferSize(sampleRateInHz, channelConfig, audioFormat))
{
    //初始化AudioRecord
    prepareAudioRecord(audioSource, sampleRateInHz, channelConfig, audioFormat, bufferSizeInBytes)
    //初始化输出文件
    prepareOutputFile(file)
   //初始化AudioEncoder
    prepareAudioEncoder(sampleRateInHz, outputFormat)
}


private fun prepareAudioRecord(audioSource: Int, sampleRateInHz: Int, channelConfig: Int, audioFormat: Int, bufferSizeInBytes: Int)
{
    minSize = AudioRecord.getMinBufferSize(sampleRateInHz, channelConfig, audioFormat)

    audioRecord = AudioRecord(audioSource, sampleRateInHz, channelConfig, audioFormat, bufferSizeInBytes)
}
复制代码

AudioRecord的构造函数需要出入几个参数。

(1).

audioSource代表音频来源,这里传入MediaRecorder.AudioSource.MIC,代表音频来源于麦克风。

(2).

sampleRateInHz代表以赫兹表示的采样率,传入44100,这个数值可以保证所有设备都正常工作。

(3).

channelConfig代表声道配置,AudioFormat.CHANNEL_IN_STEREO代表传入立体声。

(4).

audioFormat代表音频数据将被返回的格式。传入AudioFormat.ENCODING_PCM_16BIT。

(5).

bufferSizeInBytes写入音频数据的缓冲区的总大小(以字节为单位)这里默认传入getMinBufferSize,这个方法返回成功创建AudioRecord实例所需的缓冲区大小的最小值。

开始录音时,启动一个线程

private val recordRunnable = Runnable {


    val data = ByteArray(minSize)
    //AudioRecord开始录音
    audioRecord?.startRecording()
    while (isRecording)
    {
        //将音频数据写入ByteArray
        audioRecord?.read(data, 0, data.size)
        audioEncoder.start()
        audioEncoder.drainEncoder(data)
    }
    audioEncoder.release()
    audioRecord?.stop()
    audioRecord?.release()
    audioRecord = null
}
复制代码

这样就把音频数据写入一个bytearray,然后将数据传入AudioEncoder进行编码输出。

2.

AudioRecord得到的音频数据格式是pcm的,一般情况下无法bofang(可以通过AudioTrack播放),所以我们需要一次编码转换,这里用到的就是MediaCodec,MediaCodec这里我封装在AudioEncoder里。 我们首先要初始化MediaCodec:

private fun prepareAudioCodec(bitrate: Int, sampleRate: Int)
{
    bufferInfo = MediaCodec.BufferInfo()
    val mediaFormat = MediaFormat()
    mediaFormat.setInteger(MediaFormat.KEY_AAC_PROFILE, MediaCodecInfo.CodecProfileLevel.AACObjectLC)
    mediaFormat.setString(MediaFormat.KEY_MIME, MediaFormat.MIMETYPE_AUDIO_AAC)
    mediaFormat.setInteger(MediaFormat.KEY_BIT_RATE, bitrate)
    mediaFormat.setInteger(MediaFormat.KEY_CHANNEL_COUNT, 2)
    mediaFormat.setInteger(MediaFormat.KEY_SAMPLE_RATE, sampleRate)
    audioCodec = MediaCodec.createEncoderByType(MediaFormat.MIMETYPE_AUDIO_AAC)
    audioCodec.configure(mediaFormat, null, null, MediaCodec.CONFIGURE_FLAG_ENCODE)
}
复制代码

这里需要创建一个MediaFormat,具体需要传入的参数大家可以参考开发者文档,需要注意的是音频和视频的MediaFormat设置的参数是不一样的,接着调用MediaCodec的configure,此时MediaCodec已经进入了configured的状态,可以开始进行编码了。 这里说到MediaCodec的状态,大家可以看来自开发者文档的MediaCodec的状态机图片。

看一下MediaCodec的工作过程:

可以将MediaCodec理解为传送带,将空的buffers传给audiorecord,audiorecord将得到的bytearray放入空的buffers,然后传入MediaCodec,mediaCodec编码后,传入MediaMuxer,MediaMuxer写入编码后的数据再讲buffers传给MediaCodec,MediaCodec清空使用过的Buffers,再传给AudioRecord。buffer是java nio库里的类,这里就不详述了,不清楚的请自行google。 调用configure后,我们就进入了configred状态,之后当audiorecord得到数据后,当MediaCodec调用start方法后,将ByteArray传入MediaCodec,进行编码:

 fun drainEncoder(data: ByteArray)
{

    val inIndex = audioCodec.dequeueInputBuffer(0)
    if (inIndex > 0)
    {
        val inBuffer = getInBuffer(inIndex)
        inBuffer.clear()
        inBuffer.put(data)
        if (!isEncoding)
        {
            audioCodec.queueInputBuffer(inIndex, 0, 0, System.nanoTime() / 1000, BUFFER_FLAG_END_OF_STREAM)

        } else
        {
            audioCodec.queueInputBuffer(inIndex, 0, data.size, System.nanoTime() / 1000, 0)
        }

    }

    do
    {
        val outIndex = audioCodec.dequeueOutputBuffer(bufferInfo, 0)
        when
        {
            outIndex > 0 ->
            {

                if (bufferInfo.size != 0)
                {
                    val outBuffer = getOutBuffer(outIndex)
                    outBuffer.position(bufferInfo.offset)
                    outBuffer.limit(bufferInfo.offset + bufferInfo.size)
                    mediaMuxer.writeSampleData(trackIndex, outBuffer, bufferInfo)
                }
                audioCodec.releaseOutputBuffer(outIndex, false)
            }
            outIndex == MediaCodec.INFO_OUTPUT_FORMAT_CHANGED ->
            {
                trackIndex = mediaMuxer.addTrack(audioCodec.outputFormat)
                mediaMuxer.start()
            }

        }
    } while (outIndex > 0)

    if (bufferInfo.flags and MediaCodec.BUFFER_FLAG_END_OF_STREAM != 0)
    {

        isEncoding = false
    }

}
复制代码

这个方法就对应了MediaCodec对应的工作过程。

3.

MediaMuxer用来合成并输出音频,MediaMuxer用法还是比较简单的,这里就不详述了,需要注意的是,MediaMuxer只能合并一个音频轨道和一个视频轨道,还要注意的是要在addTrack调用之后再调用star方法。

最后附上项目地址 gitlab

关注下面的标签,发现更多相似文章
评论