Draw directly to the surface buffer. Improve amount of decoding and rendering that can be done in parallel. Add performance levels and choose them by cpuinfo. Improves Tegra 3 performance significantly.

2026-04-14 11:56:04 +00:00 · 2013-11-21 08:38:49 -05:00
parent 54839e672d
commit 45664dac2a
9 changed files with 218 additions and 120 deletions
--- a/jni/nv_avc_dec/Android.mk
+++ b/jni/nv_avc_dec/Android.mk
@@ -9,7 +9,7 @@ include $(CLEAR_VARS)
 LOCAL_MODULE    := nv_avc_dec
 LOCAL_SRC_FILES := nv_avc_dec.c nv_avc_dec_jni.c
 LOCAL_C_INCLUDES := $(LOCAL_PATH)/ffmpeg/$(TARGET_ARCH_ABI)/include
-LOCAL_LDLIBS := -L$(SYSROOT)/usr/lib -llog
+LOCAL_LDLIBS := -L$(SYSROOT)/usr/lib -llog -landroid

 # Link to ffmpeg libraries
 LOCAL_SHARED_LIBRARIES := libavcodec libavformat libswscale libavutil libavfilter libwsresample
--- a/jni/nv_avc_dec/nv_avc_dec.c
+++ b/jni/nv_avc_dec/nv_avc_dec.c
@@ -5,20 +5,31 @@
 #include <android/log.h>
 #include "nv_avc_dec.h"

+#include <jni.h>
+#include <android/native_window_jni.h>
+
 AVCodec* decoder;
 AVCodecContext* decoder_ctx;
 AVFrame* yuv_frame;
-AVFrame* tmp_frame;
 AVFrame* rgb_frame;
+AVFrame* rnd_frame;
+AVFrame* dec_frame;
 pthread_mutex_t mutex;
 char* rgb_frame_buf;
-int picture_valid;
-int rgb_dirty;
 struct SwsContext* scaler_ctx;
+int picture_new;
+
+#define RENDER_PIX_FMT AV_PIX_FMT_RGBA
+#define BYTES_PER_PIXEL 4
+
+#define VERY_LOW_PERF 0
+#define LOW_PERF 1
+#define MED_PERF 2
+#define HIGH_PERF 3

 // This function must be called before
 // any other decoding functions
-int nv_avc_init(int width, int height) {
+int nv_avc_init(int width, int height, int perf_lvl) {
 	int err;

 	pthread_mutex_init(&mutex, NULL);
@@ -44,12 +55,23 @@ int nv_avc_init(int width, int height) {
 	// Show frames even before a reference frame
 	decoder_ctx->flags2 |= CODEC_FLAG2_SHOW_ALL;

-	// Skip the loop filter for performance reasons
-	decoder_ctx->skip_loop_filter = AVDISCARD_ALL;
+	if (perf_lvl <= LOW_PERF) {
+		// Skip the loop filter for performance reasons
+		decoder_ctx->skip_loop_filter = AVDISCARD_ALL;
+	}

-	// Run 2 threads for decoding
-	decoder_ctx->thread_count = 2;
-	decoder_ctx->thread_type = FF_THREAD_FRAME;
+	if (perf_lvl <= MED_PERF) {
+		// Run 2 threads for decoding
+		decoder_ctx->thread_count = 2;
+		decoder_ctx->thread_type = FF_THREAD_FRAME;
+
+		// Use some tricks to make things faster
+		decoder_ctx->flags2 |= CODEC_FLAG2_FAST;
+	}
+	else {
+		// Use low delay single threaded encoding
+		decoder_ctx->flags |= CODEC_FLAG_LOW_DELAY;
+	}

 	decoder_ctx->width = width;
 	decoder_ctx->height = height;
@@ -62,13 +84,13 @@ int nv_avc_init(int width, int height) {
 		return err;
 	}

-	tmp_frame = av_frame_alloc();
-	if (tmp_frame == NULL) {
+	dec_frame = av_frame_alloc();
+	if (dec_frame == NULL) {
 		__android_log_write(ANDROID_LOG_ERROR, "NVAVCDEC",
 			"Couldn't allocate frame");
 		return -1;
 	}
-	
+
 	rgb_frame = av_frame_alloc();
 	if (rgb_frame == NULL) {
 		__android_log_write(ANDROID_LOG_ERROR, "NVAVCDEC",
@@ -76,16 +98,16 @@ int nv_avc_init(int width, int height) {
 		return -1;
 	}

-	rgb_frame_buf = (char*)av_malloc(nv_avc_get_rgb_frame_size());
+	rgb_frame_buf = (char*)av_malloc(width * height * BYTES_PER_PIXEL);
 	if (rgb_frame_buf == NULL) {
 		__android_log_write(ANDROID_LOG_ERROR, "NVAVCDEC",
 			"Couldn't allocate picture");
 		return -1;
 	}
-	
+
 	err = avpicture_fill((AVPicture*)rgb_frame,
 		rgb_frame_buf,
-		AV_PIX_FMT_RGB32,
+		RENDER_PIX_FMT,
 		decoder_ctx->width,
 		decoder_ctx->height);
 	if (err < 0) {
@@ -93,13 +115,13 @@ int nv_avc_init(int width, int height) {
 			"Couldn't fill picture");
 		return err;
 	}
-	
+
 	scaler_ctx = sws_getContext(decoder_ctx->width,
 		decoder_ctx->height,
 		decoder_ctx->pix_fmt,
 		decoder_ctx->width,
 		decoder_ctx->height,
-		AV_PIX_FMT_RGB32,
+		RENDER_PIX_FMT,
 		SWS_BICUBIC,
 		NULL, NULL, NULL);
 	if (scaler_ctx == NULL) {
@@ -123,9 +145,13 @@ void nv_avc_destroy(void) {
 		sws_freeContext(scaler_ctx);
 		scaler_ctx = NULL;
 	}
-	if (tmp_frame) {
+	if (dec_frame) {
+		av_frame_free(&dec_frame);
+		dec_frame = NULL;
+	}
+	if (yuv_frame) {
 		av_frame_free(&yuv_frame);
-		tmp_frame = NULL;
+		yuv_frame = NULL;
 	}
 	if (rgb_frame) {
 		av_frame_free(&rgb_frame);
@@ -135,32 +161,43 @@ void nv_avc_destroy(void) {
 		av_free(rgb_frame_buf);
 		rgb_frame_buf = NULL;
 	}
+	if (rnd_frame) {
+		av_frame_free(&rnd_frame);
+		rnd_frame = NULL;
+	}
 	pthread_mutex_destroy(&mutex);
 }

-// The decoded frame is ARGB
-// Returns 1 on success, 0 on failure
-int nv_avc_get_current_frame(char* rgbframe, int size) {
+void nv_avc_redraw(JNIEnv *env, jobject surface) {
+	ANativeWindow* window;
+	ANativeWindow_Buffer buffer;
 	int err;

-	if (size != nv_avc_get_rgb_frame_size()) {
-		return 0;
+	// Free the old decoded frame
+	if (rnd_frame) {
+		av_frame_free(&rnd_frame);
 	}

 	pthread_mutex_lock(&mutex);

-	// Check if the RGB frame needs updating
-	if (rgb_dirty) {
-		// If the decoder doesn't have a new picture, we fail
-		if (!picture_valid) {
-			pthread_mutex_unlock(&mutex);
-			return 0;
+	// Check if there's a new frame
+	if (picture_new) {
+		// Clone the decoder's last frame
+		rnd_frame = av_frame_clone(yuv_frame);
+
+		// The remaining processing can be done without the mutex
+		pthread_mutex_unlock(&mutex);
+
+		if (rnd_frame == NULL) {
+			__android_log_write(ANDROID_LOG_ERROR, "NVAVCDEC",
+					"Cloning failed");
+			return;
 		}

 		// Convert the YUV image to RGB
 		err = sws_scale(scaler_ctx,
-			yuv_frame->data,
-			yuv_frame->linesize,
+			rnd_frame->data,
+			rnd_frame->linesize,
 			0,
 			decoder_ctx->height,
 			rgb_frame->data,
@@ -168,36 +205,42 @@ int nv_avc_get_current_frame(char* rgbframe, int size) {
 		if (err != decoder_ctx->height) {
 			__android_log_write(ANDROID_LOG_ERROR, "NVAVCDEC",
 					"Scaling failed");
-			pthread_mutex_unlock(&mutex);
-			return 0;
+			return;
 		}

-		// RGB frame is now clean
-		rgb_dirty = 0;
+		window = ANativeWindow_fromSurface(env, surface);
+		if (window == NULL) {
+			__android_log_write(ANDROID_LOG_ERROR, "NVAVCDEC",
+					"Failed to get window from surface");
+			return;
+		}
+
+		// Lock down a render buffer
+		if (ANativeWindow_lock(window, &buffer, NULL) >= 0) {
+			// Draw the frame to the buffer
+			err = avpicture_layout((AVPicture*)rgb_frame,
+				RENDER_PIX_FMT,
+				decoder_ctx->width,
+				decoder_ctx->height,
+				buffer.bits,
+				decoder_ctx->width *
+				decoder_ctx->height *
+				BYTES_PER_PIXEL);
+			if (err < 0) {
+				__android_log_write(ANDROID_LOG_ERROR, "NVAVCDEC",
+					"Picture fill failed");
+			}
+
+			// Draw the frame to the surface
+			ANativeWindow_unlockAndPost(window);
+		}
+
+		ANativeWindow_release(window);
 	}
-
-	// The remaining processing can be done without the mutex
-	pthread_mutex_unlock(&mutex);
-
-	err = avpicture_layout((AVPicture*)rgb_frame,
-		AV_PIX_FMT_RGB32,
-		decoder_ctx->width,
-		decoder_ctx->height,
-		rgbframe,
-		size);
-	if (err < 0) {
-		__android_log_write(ANDROID_LOG_ERROR, "NVAVCDEC",
-				"Picture fill failed");
-		return 0;
+	else {
+		pthread_mutex_unlock(&mutex);
+		rnd_frame = NULL;
 	}
-
-	return 1;
-}
-
-int nv_avc_get_rgb_frame_size(void) {
-	return avpicture_get_size(AV_PIX_FMT_RGB32,
-		decoder_ctx->width,
-		decoder_ctx->height);
 }

 // packets must be decoded in order
@@ -218,7 +261,7 @@ int nv_avc_decode(unsigned char* indata, int inlen) {
 	while (pkt.size > 0) {
 		err = avcodec_decode_video2(
 			decoder_ctx,
-			tmp_frame,
+			dec_frame,
 			&got_pic,
 			&pkt);
 		if (err < 0) {
@@ -237,14 +280,12 @@ int nv_avc_decode(unsigned char* indata, int inlen) {
 				}

 				// Clone a new frame
-				yuv_frame = av_frame_clone(tmp_frame);
+				yuv_frame = av_frame_clone(dec_frame);
 				if (yuv_frame) {
-					// If we got a new picture, the RGB frame needs refreshing
-					picture_valid = 1;
-					rgb_dirty = 1;
+					picture_new = 1;
 				}
 				else {
-					picture_valid = 0;
+					picture_new = 0;
 				}

 				pthread_mutex_unlock(&mutex);
--- a/jni/nv_avc_dec/nv_avc_dec.h
+++ b/jni/nv_avc_dec/nv_avc_dec.h
@@ -1,5 +1,6 @@
-int nv_avc_init(int width, int height);
+#include <jni.h>
+
+int nv_avc_init(int width, int height, int perf_lvl);
 void nv_avc_destroy(void);
-int nv_avc_get_current_frame(char* yuvframe, int size);
-int nv_avc_get_frame_size(void);
+void nv_avc_redraw(JNIEnv *env, jobject surface);
 int nv_avc_decode(unsigned char* indata, int inlen);
--- a/jni/nv_avc_dec/nv_avc_dec_jni.c
+++ b/jni/nv_avc_dec/nv_avc_dec_jni.c
@@ -6,8 +6,10 @@
 // This function must be called before
 // any other decoding functions
 JNIEXPORT jint JNICALL
-Java_com_limelight_nvstream_av_video_AvcDecoder_init(JNIEnv *env, jobject this, jint width, jint height) {
-	return nv_avc_init(width, height);
+Java_com_limelight_nvstream_av_video_AvcDecoder_init(JNIEnv *env, jobject this, jint width,
+	jint height, jint perflvl)
+{
+	return nv_avc_init(width, height, perflvl);
 }

 // This function must be called after
@@ -17,27 +19,10 @@ Java_com_limelight_nvstream_av_video_AvcDecoder_destroy(JNIEnv *env, jobject thi
 	nv_avc_destroy();
 }

-// The decoded frame is ARGB
-// Returns 1 on success, 0 on failure
-JNIEXPORT jboolean JNICALL
-Java_com_limelight_nvstream_av_video_AvcDecoder_getCurrentFrame(JNIEnv *env, jobject this,
-	jintArray rgbframe, jint sizeints)
-{
-	jint* jni_rgbframe;
-	jboolean ret;
-
-	jni_rgbframe = (*env)->GetIntArrayElements(env, rgbframe, 0);
-
-	ret = (nv_avc_get_current_frame((char*)jni_rgbframe, sizeints*4) != 0) ? JNI_TRUE : JNI_FALSE;
-
-	(*env)->ReleaseIntArrayElements(env, rgbframe, jni_rgbframe, 0);
-
-	return ret;
-}
-
-JNIEXPORT jint JNICALL
-Java_com_limelight_nvstream_av_video_AvcDecoder_getFrameSize(JNIEnv *env, jobject this) {
-	return nv_avc_get_rgb_frame_size() / 4;
+// This function redraws the surface
+JNIEXPORT void JNICALL
+Java_com_limelight_nvstream_av_video_AvcDecoder_redraw(JNIEnv *env, jobject this, jobject surface) {
+	nv_avc_redraw(env, surface);
 }

 // packets must be decoded in order