bdevperf: Eliminate reactors

Now, each bdevperf_job gets it's own bdevperf_thread. Scheduling the jobs onto cores is left to the underlying event framework in the normal case. In the multi-thread case, cpumasks are set on the jobs' threads to ensure they're distributed appropriately. Change-Id: I55f1a44b4262d715954b3a63bf00b8d2321fafca Signed-off-by: Ben Walker <benjamin.walker@intel.com> Reviewed-on: https://review.spdk.io/gerrit/c/spdk/spdk/+/1512 Community-CI: Mellanox Build Bot Tested-by: SPDK CI Jenkins <sys_sgci@intel.com> Reviewed-by: Jim Harris <james.r.harris@intel.com> Reviewed-by: Shuhei Matsumoto <shuhei.matsumoto.xt@hitachi.com>
2020-03-19 14:27:32 -07:00 · 2020-03-19 14:27:32 -07:00 · 3788d6967a
commit 3788d6967a
parent 4b4b3cca9f
1 changed files with 148 additions and 257 deletions
--- a/test/bdev/bdevperf/bdevperf.c
+++ b/test/bdev/bdevperf/bdevperf.c
@ -85,8 +85,6 @@ static const char *g_job_bdev_name;
 static bool g_wait_for_tests = false;
 static struct spdk_jsonrpc_request *g_request = NULL;
 static bool g_multithread_mode = false;
 static uint32_t g_core_ordinal = 0;
 pthread_mutex_t g_ordinal_lock = PTHREAD_MUTEX_INITIALIZER;
 static struct spdk_poller *g_perf_timer = NULL;
@ -99,7 +97,8 @@ struct bdevperf_job {
 	struct spdk_bdev_desc		*bdev_desc;
 	struct spdk_io_channel		*ch;
 	TAILQ_ENTRY(bdevperf_job)	link;
-	struct bdevperf_reactor		*reactor;
+	struct spdk_thread		*thread;
 	uint64_t			io_completed;
 	uint64_t			prev_io_completed;
 	double				ema_io_per_second;
@ -117,31 +116,20 @@ struct bdevperf_job {
 	TAILQ_HEAD(, bdevperf_task)	task_list;
 };
 struct bdevperf_reactor {
 	struct spdk_thread		*thread;
 	TAILQ_HEAD(, bdevperf_job)	jobs;
 	uint32_t			lcore;
 	uint32_t			multiplier;
 	TAILQ_ENTRY(bdevperf_reactor)	link;
 };
 struct spdk_bdevperf {
-	TAILQ_HEAD(, bdevperf_reactor)	reactors;
+	TAILQ_HEAD(, bdevperf_job)	jobs;
 	uint32_t			num_reactors;
 	uint32_t			running_jobs;
 };
 static struct spdk_bdevperf g_bdevperf = {
-	.reactors = TAILQ_HEAD_INITIALIZER(g_bdevperf.reactors),
+	.jobs = TAILQ_HEAD_INITIALIZER(g_bdevperf.jobs),
 	.num_reactors = 0,
 	.running_jobs = 0,
 };
 struct bdevperf_reactor *g_next_reactor;
 static bool g_performance_dump_active = false;
 struct bdevperf_aggregate_stats {
 	struct bdevperf_job		*current_job;
 	uint64_t			io_time_in_usec;
 	uint64_t			ema_period;
 	double				total_io_per_second;
@ -183,8 +171,8 @@ performance_dump_job(struct bdevperf_aggregate_stats *stats, struct bdevperf_job
 {
 	double io_per_second, mb_per_second;
-	printf("\r Thread name: %s\n", spdk_thread_get_name(job->reactor->thread));
+	printf("\r Thread name: %s\n", spdk_thread_get_name(job->thread));
-	printf("\r Core Mask: 0x%s\n", spdk_cpuset_fmt(spdk_thread_get_cpumask(job->reactor->thread)));
+	printf("\r Core Mask: 0x%s\n", spdk_cpuset_fmt(spdk_thread_get_cpumask(job->thread)));
 	if (stats->ema_period == 0) {
 		io_per_second = get_cma_io_per_second(job, stats->io_time_in_usec);
@ -290,41 +278,9 @@ verify_data(void *wr_buf, int wr_buf_len, void *rd_buf, int rd_buf_len, int bloc
 	return true;
 }
 static void
 _bdevperf_fini_thread_done(struct spdk_io_channel_iter *i, int status)
 {
 	spdk_io_device_unregister(&g_bdevperf, NULL);
 	spdk_app_stop(g_run_rc);
 }
 static void
 _bdevperf_fini_thread(struct spdk_io_channel_iter *i)
 {
 	struct spdk_io_channel *ch;
 	struct bdevperf_reactor *reactor;
 	ch = spdk_io_channel_iter_get_channel(i);
 	reactor = spdk_io_channel_get_ctx(ch);
 	TAILQ_REMOVE(&g_bdevperf.reactors, reactor, link);
 	spdk_put_io_channel(ch);
 	spdk_for_each_channel_continue(i, 0);
 }
 static void
 bdevperf_fini(void)
 {
 	spdk_for_each_channel(&g_bdevperf, _bdevperf_fini_thread, NULL,
 			      _bdevperf_fini_thread_done);
 }
 static void
 bdevperf_test_done(void *ctx)
 {
 	struct bdevperf_reactor *reactor;
 	struct bdevperf_job *job, *jtmp;
 	struct bdevperf_task *task, *ttmp;
@ -349,26 +305,24 @@ bdevperf_test_done(void *ctx)
 		       (double)g_time_in_usec / 1000000);
 	}
-	TAILQ_FOREACH(reactor, &g_bdevperf.reactors, link) {
+	TAILQ_FOREACH_SAFE(job, &g_bdevperf.jobs, link, jtmp) {
-		TAILQ_FOREACH_SAFE(job, &reactor->jobs, link, jtmp) {
+		TAILQ_REMOVE(&g_bdevperf.jobs, job, link);
 			TAILQ_REMOVE(&reactor->jobs, job, link);
-			performance_dump_job(&g_stats, job);
+		performance_dump_job(&g_stats, job);
-			TAILQ_FOREACH_SAFE(task, &job->task_list, link, ttmp) {
+		TAILQ_FOREACH_SAFE(task, &job->task_list, link, ttmp) {
-				TAILQ_REMOVE(&job->task_list, task, link);
+			TAILQ_REMOVE(&job->task_list, task, link);
-				spdk_free(task->buf);
+			spdk_free(task->buf);
-				spdk_free(task->md_buf);
+			spdk_free(task->md_buf);
-				free(task);
+			free(task);
 			}
 			if (g_verify) {
 				spdk_bit_array_free(&job->outstanding);
 			}
 			free(job->name);
 			free(job);
 		}
 		if (g_verify) {
 			spdk_bit_array_free(&job->outstanding);
 		}
 		free(job->name);
 		free(job);
 	}
 	printf("\r =====================================================\n");
@ -379,7 +333,7 @@ bdevperf_test_done(void *ctx)
 	if (g_request && !g_shutdown) {
 		rpc_perform_tests_cb();
 	} else {
-		bdevperf_fini();
+		spdk_app_stop(g_run_rc);
 	}
 }
@ -864,8 +818,9 @@ reset_job(void *arg)
 }
 static void
-bdevperf_job_run(struct bdevperf_job *job)
+bdevperf_job_run(void *ctx)
 {
 	struct bdevperf_job *job = ctx;
 	struct bdevperf_task *task;
 	int i;
@ -886,30 +841,9 @@ bdevperf_job_run(struct bdevperf_job *job)
 }
 static void
-bdevperf_submit_on_reactor(struct spdk_io_channel_iter *i)
+_performance_dump_done(void *ctx)
 {
-	struct spdk_io_channel *ch;
+	struct bdevperf_aggregate_stats *stats = ctx;
 	struct bdevperf_reactor *reactor;
 	struct bdevperf_job *job;
 	ch = spdk_io_channel_iter_get_channel(i);
 	reactor = spdk_io_channel_get_ctx(ch);
 	/* Submit initial I/O for each block device. Each time one
 	 * completes, another will be submitted. */
 	TAILQ_FOREACH(job, &reactor->jobs, link) {
 		bdevperf_job_run(job);
 	}
 	spdk_for_each_channel_continue(i, 0);
 }
 static void
 _performance_dump_done(struct spdk_io_channel_iter *i, int status)
 {
 	struct bdevperf_aggregate_stats *stats;
 	stats = spdk_io_channel_iter_get_ctx(i);
 	printf("\r =====================================================\n");
 	printf("\r %-20s: %10.2f IOPS %10.2f MiB/s\n",
@ -922,29 +856,20 @@ _performance_dump_done(struct spdk_io_channel_iter *i, int status)
 }
 static void
-_performance_dump(struct spdk_io_channel_iter *i)
+_performance_dump(void *ctx)
 {
-	struct bdevperf_aggregate_stats *stats;
+	struct bdevperf_aggregate_stats *stats = ctx;
 	struct spdk_io_channel *ch;
 	struct bdevperf_reactor *reactor;
 	struct bdevperf_job *job;
-	stats = spdk_io_channel_iter_get_ctx(i);
+	performance_dump_job(stats, stats->current_job);
 	ch = spdk_io_channel_iter_get_channel(i);
 	reactor = spdk_io_channel_get_ctx(ch);
-	if (TAILQ_EMPTY(&reactor->jobs)) {
+	/* This assumes the jobs list is static after start up time.
-		goto exit;
+	 * That's true right now, but if that ever changed this would need a lock. */
 	stats->current_job = TAILQ_NEXT(stats->current_job, link);
 	if (stats->current_job == NULL) {
 		spdk_thread_send_msg(g_master_thread, _performance_dump_done, stats);
 	} else {
 		spdk_thread_send_msg(stats->current_job->thread, _performance_dump, stats);
 	}
 	TAILQ_FOREACH(job, &reactor->jobs, link) {
 		performance_dump_job(stats, job);
 	}
 	fflush(stdout);
 exit:
 	spdk_for_each_channel_continue(i, 0);
 }
 static int
@ -968,14 +893,25 @@ performance_statistics_thread(void *arg)
 	stats->io_time_in_usec = g_show_performance_period_num * g_show_performance_period_in_usec;
 	stats->ema_period = g_show_performance_ema_period;
-	spdk_for_each_channel(&g_bdevperf, _performance_dump, stats,
+	/* Iterate all of the jobs to gather stats
-			      _performance_dump_done);
+	 * These jobs will not get removed here until a final performance dump is run,
 	 * so this should be safe without locking.
 	 */
 	stats->current_job = TAILQ_FIRST(&g_bdevperf.jobs);
 	if (stats->current_job == NULL) {
 		spdk_thread_send_msg(g_master_thread, _performance_dump_done, stats);
 	} else {
 		spdk_thread_send_msg(stats->current_job->thread, _performance_dump, stats);
 	}
 	return -1;
 }
 static void
 bdevperf_test(void)
 {
 	struct bdevperf_job *job;
 	printf("Running I/O for %" PRIu64 " seconds...\n", g_time_in_usec / 1000000);
 	fflush(stdout);
@ -986,8 +922,11 @@ bdevperf_test(void)
 						    g_show_performance_period_in_usec);
 	}
-	/* Iterate reactors to start all I/O */
+	/* Iterate jobs to start all I/O */
-	spdk_for_each_channel(&g_bdevperf, bdevperf_submit_on_reactor, NULL, NULL);
+	TAILQ_FOREACH(job, &g_bdevperf.jobs, link) {
 		g_bdevperf.running_jobs++;
 		spdk_thread_send_msg(job->thread, bdevperf_job_run, job);
 	}
 }
 static void
@ -995,9 +934,6 @@ bdevperf_bdev_removed(void *arg)
 {
 	struct bdevperf_job *job = arg;
 	assert(spdk_io_channel_get_thread(spdk_io_channel_from_ctx(job->reactor)) ==
 	       spdk_get_thread());
 	bdevperf_job_drain(job);
 }
@ -1006,10 +942,8 @@ static uint32_t g_construct_job_count = 0;
 static void
 _bdevperf_construct_job_done(void *ctx)
 {
 	/* Update g_bdevperf.running_jobs on the master thread. */
 	g_bdevperf.running_jobs++;
 	if (--g_construct_job_count == 0) {
 		if (g_run_rc != 0) {
 			/* Something failed. */
 			bdevperf_test_done(NULL);
@ -1047,17 +981,27 @@ end:
 }
 static int
-bdevperf_construct_job(struct spdk_bdev *bdev, struct bdevperf_reactor *reactor)
+bdevperf_construct_job(struct spdk_bdev *bdev, struct spdk_cpuset *cpumask,
 		       uint32_t offset, uint32_t length)
 {
 	struct bdevperf_job *job;
 	struct bdevperf_task *task;
 	int block_size, data_block_size;
 	int rc;
 	int task_num, n;
 	char thread_name[32];
 	struct spdk_thread *thread;
 	/* This function runs on the master thread. */
 	assert(g_master_thread == spdk_get_thread());
 	snprintf(thread_name, sizeof(thread_name), "%s_%s", spdk_bdev_get_name(bdev),
 		 spdk_cpuset_fmt(cpumask));
 	/* Create a new thread for the job */
 	thread = spdk_thread_create(thread_name, cpumask);
 	assert(thread != NULL);
 	block_size = spdk_bdev_get_block_size(bdev);
 	data_block_size = spdk_bdev_get_data_block_size(bdev);
@ -1096,13 +1040,15 @@ bdevperf_construct_job(struct spdk_bdev *bdev, struct bdevperf_reactor *reactor)
 		job->dif_check_flags |= SPDK_DIF_FLAGS_GUARD_CHECK;
 	}
 	job->size_in_ios = spdk_bdev_get_num_blocks(bdev) / job->io_size_blocks;
 	job->offset_in_ios = 0;
-	if (g_multithread_mode) {
+	if (length != 0) {
-		job->size_in_ios = job->size_in_ios / g_bdevperf.num_reactors;
+		/* Use subset of disk */
-		job->ios_base = reactor->multiplier * job->size_in_ios;
+		job->size_in_ios = length / job->io_size_blocks;
 		job->ios_base = offset / job->io_size_blocks;
 	} else {
 		/* Use whole disk */
 		job->size_in_ios = spdk_bdev_get_num_blocks(bdev) / job->io_size_blocks;
 		job->ios_base = 0;
 	}
@ -1124,7 +1070,7 @@ bdevperf_construct_job(struct spdk_bdev *bdev, struct bdevperf_reactor *reactor)
 		task_num += 1;
 	}
-	TAILQ_INSERT_TAIL(&reactor->jobs, job, link);
+	TAILQ_INSERT_TAIL(&g_bdevperf.jobs, job, link);
 	for (n = 0; n < task_num; n++) {
 		task = calloc(1, sizeof(struct bdevperf_task));
@ -1157,11 +1103,11 @@ bdevperf_construct_job(struct spdk_bdev *bdev, struct bdevperf_reactor *reactor)
 		TAILQ_INSERT_TAIL(&job->task_list, task, link);
 	}
-	job->reactor = reactor;
+	job->thread = thread;
 	g_construct_job_count++;
-	rc = spdk_thread_send_msg(reactor->thread, _bdevperf_construct_job, job);
+	rc = spdk_thread_send_msg(thread, _bdevperf_construct_job, job);
 	assert(rc == 0);
 	return rc;
@ -1171,9 +1117,23 @@ static void
 bdevperf_construct_multithread_jobs(void)
 {
 	struct spdk_bdev *bdev;
-	struct bdevperf_reactor *reactor;
+	uint32_t i;
 	struct spdk_cpuset cpumask;
 	uint32_t num_cores;
 	uint32_t blocks_per_job;
 	uint32_t offset;
 	int rc;
 	num_cores = 0;
 	SPDK_ENV_FOREACH_CORE(i) {
 		num_cores++;
 	}
 	if (num_cores == 0) {
 		g_run_rc = -EINVAL;
 		return;
 	}
 	if (g_job_bdev_name != NULL) {
 		bdev = spdk_bdev_get_by_name(g_job_bdev_name);
 		if (!bdev) {
@ -1181,24 +1141,40 @@ bdevperf_construct_multithread_jobs(void)
 			return;
 		}
-		/* Build a job for each reactor */
+		blocks_per_job = spdk_bdev_get_num_blocks(bdev) / num_cores;
-		TAILQ_FOREACH(reactor, &g_bdevperf.reactors, link) {
+		offset = 0;
-			rc = bdevperf_construct_job(bdev, reactor);
+
 		SPDK_ENV_FOREACH_CORE(i) {
 			spdk_cpuset_zero(&cpumask);
 			spdk_cpuset_set_cpu(&cpumask, i, true);
 			/* Construct the job */
 			rc = bdevperf_construct_job(bdev, &cpumask, offset, blocks_per_job);
 			if (rc < 0) {
 				g_run_rc = rc;
 				break;
 			}
 			offset += blocks_per_job;
 		}
 	} else {
 		bdev = spdk_bdev_first_leaf();
 		while (bdev != NULL) {
-			/* Build a job for each reactor */
+			blocks_per_job = spdk_bdev_get_num_blocks(bdev) / num_cores;
-			TAILQ_FOREACH(reactor, &g_bdevperf.reactors, link) {
+			offset = 0;
-				rc = bdevperf_construct_job(bdev, reactor);
+
 			SPDK_ENV_FOREACH_CORE(i) {
 				spdk_cpuset_zero(&cpumask);
 				spdk_cpuset_set_cpu(&cpumask, i, true);
 				/* Construct the job */
 				rc = bdevperf_construct_job(bdev, &cpumask, offset, blocks_per_job);
 				if (rc < 0) {
 					g_run_rc = rc;
 					break;
 				}
 				offset += blocks_per_job;
 			}
 			if (g_run_rc != 0) {
@ -1210,35 +1186,37 @@ bdevperf_construct_multithread_jobs(void)
 	}
 }
-
+static uint32_t
-static struct bdevperf_reactor *
+_get_next_core(void)
 get_next_bdevperf_reactor(void)
 {
-	struct bdevperf_reactor *reactor;
+	static uint32_t current_core = SPDK_ENV_LCORE_ID_ANY;
-	if (g_next_reactor == NULL) {
+	if (current_core == SPDK_ENV_LCORE_ID_ANY) {
-		g_next_reactor = TAILQ_FIRST(&g_bdevperf.reactors);
+		current_core = spdk_env_get_first_core();
-		assert(g_next_reactor != NULL);
+		return current_core;
 	}
-	reactor = g_next_reactor;
+	current_core = spdk_env_get_next_core(current_core);
-	g_next_reactor = TAILQ_NEXT(g_next_reactor, link);
+	if (current_core == SPDK_ENV_LCORE_ID_ANY) {
 		current_core = spdk_env_get_first_core();
 	}
-	return reactor;
+	return current_core;
 }
 static void
 bdevperf_construct_jobs(void)
 {
 	struct spdk_bdev *bdev;
-	struct bdevperf_reactor *reactor;
+	uint32_t lcore;
 	struct spdk_cpuset cpumask;
 	int rc;
 	/* There are two entirely separate modes for allocating jobs. Standard mode
-	 * (the default) creates one job per bdev and assigns them to reactors round-robin.
+	 * (the default) creates one spdk_thread per bdev and runs the I/O job there.
 	 *
 	 * The -C flag places bdevperf into "multithread" mode, meaning it creates
-	 * one job per bdev per REACTOR.
+	 * one spdk_thread per bdev PER CORE, and runs a copy of the job on each.
 	 * This runs multiple threads per bdev, effectively.
 	 */
@ -1255,11 +1233,13 @@ bdevperf_construct_jobs(void)
 	if (g_job_bdev_name != NULL) {
 		bdev = spdk_bdev_get_by_name(g_job_bdev_name);
 		if (bdev) {
-			/* Select the reactor for this job */
+			lcore = _get_next_core();
-			reactor = get_next_bdevperf_reactor();
+
 			spdk_cpuset_zero(&cpumask);
 			spdk_cpuset_set_cpu(&cpumask, lcore, true);
 			/* Construct the job */
-			rc = bdevperf_construct_job(bdev, reactor);
+			rc = bdevperf_construct_job(bdev, &cpumask, 0, 0);
 			if (rc < 0) {
 				g_run_rc = rc;
 			}
@ -1268,12 +1248,15 @@ bdevperf_construct_jobs(void)
 		}
 	} else {
 		bdev = spdk_bdev_first_leaf();
 		while (bdev != NULL) {
-			/* Select the reactor for this job */
+			lcore = _get_next_core();
-			reactor = get_next_bdevperf_reactor();
+
 			spdk_cpuset_zero(&cpumask);
 			spdk_cpuset_set_cpu(&cpumask, lcore, true);
 			/* Construct the job */
-			rc = bdevperf_construct_job(bdev, reactor);
+			rc = bdevperf_construct_job(bdev, &cpumask, 0, 0);
 			if (rc < 0) {
 				g_run_rc = rc;
 				break;
@ -1295,48 +1278,10 @@ end:
 	}
 }
 static int
 bdevperf_reactor_create(void *io_device, void *ctx_buf)
 {
 	struct bdevperf_reactor *reactor = ctx_buf;
 	TAILQ_INIT(&reactor->jobs);
 	reactor->lcore = spdk_env_get_current_core();
 	pthread_mutex_lock(&g_ordinal_lock);
 	reactor->multiplier = g_core_ordinal++;
 	pthread_mutex_unlock(&g_ordinal_lock);
 	reactor->thread = spdk_get_thread();
 	return 0;
 }
 static void
-bdevperf_reactor_destroy(void *io_device, void *ctx_buf)
+bdevperf_run(void *arg1)
 {
-	struct bdevperf_reactor *reactor = ctx_buf;
+	g_master_thread = spdk_get_thread();
 	struct spdk_io_channel *ch;
 	struct spdk_thread *thread;
 	ch = spdk_io_channel_from_ctx(reactor);
 	thread = spdk_io_channel_get_thread(ch);
 	assert(thread == spdk_get_thread());
 	spdk_thread_exit(thread);
 }
 static void
 _bdevperf_init_thread_done(void *ctx)
 {
 	struct bdevperf_reactor *reactor = ctx;
 	TAILQ_INSERT_TAIL(&g_bdevperf.reactors, reactor, link);
 	assert(g_bdevperf.num_reactors < spdk_env_get_core_count());
 	if (++g_bdevperf.num_reactors < spdk_env_get_core_count()) {
 		return;
 	}
 	if (g_wait_for_tests) {
 		/* Do not perform any tests until RPC is received */
@ -1346,46 +1291,6 @@ _bdevperf_init_thread_done(void *ctx)
 	bdevperf_construct_jobs();
 }
 static void
 _bdevperf_init_thread(void *ctx)
 {
 	struct spdk_io_channel *ch;
 	struct bdevperf_reactor *reactor;
 	ch = spdk_get_io_channel(&g_bdevperf);
 	reactor = spdk_io_channel_get_ctx(ch);
 	spdk_thread_send_msg(g_master_thread, _bdevperf_init_thread_done, reactor);
 }
 static void
 bdevperf_run(void *arg1)
 {
 	struct spdk_cpuset tmp_cpumask = {};
 	uint32_t i;
 	char thread_name[32];
 	struct spdk_thread *thread;
 	g_master_thread = spdk_get_thread();
 	spdk_io_device_register(&g_bdevperf, bdevperf_reactor_create, bdevperf_reactor_destroy,
 				sizeof(struct bdevperf_reactor), "bdevperf");
 	/* Create threads for CPU cores active for this application, and send a
 	 * message to each thread to create a reactor on it.
 	 */
 	SPDK_ENV_FOREACH_CORE(i) {
 		spdk_cpuset_zero(&tmp_cpumask);
 		spdk_cpuset_set_cpu(&tmp_cpumask, i, true);
 		snprintf(thread_name, sizeof(thread_name), "bdevperf_reactor_%u", i);
 		thread = spdk_thread_create(thread_name, &tmp_cpumask);
 		assert(thread != NULL);
 		spdk_thread_send_msg(thread, _bdevperf_init_thread, NULL);
 	}
 }
 static void
 rpc_perform_tests_cb(void)
 {
@ -1428,32 +1333,16 @@ rpc_perform_tests(struct spdk_jsonrpc_request *request, const struct spdk_json_v
 SPDK_RPC_REGISTER("perform_tests", rpc_perform_tests, SPDK_RPC_RUNTIME)
 static void
-bdevperf_stop_io_on_reactor(struct spdk_io_channel_iter *i)
+_bdevperf_job_drain(void *ctx)
 {
-	struct spdk_io_channel *ch;
+	bdevperf_job_drain(ctx);
 	struct bdevperf_reactor *reactor;
 	struct bdevperf_job *job;
 	ch = spdk_io_channel_iter_get_channel(i);
 	reactor = spdk_io_channel_get_ctx(ch);
 	/* Stop I/O for each block device. */
 	TAILQ_FOREACH(job, &reactor->jobs, link) {
 		bdevperf_job_drain(job);
 	}
 	spdk_for_each_channel_continue(i, 0);
 }
 static void
 spdk_bdevperf_shutdown_cb(void)
 {
 	g_shutdown = true;
-
+	struct bdevperf_job *job, *tmp;
 	if (TAILQ_EMPTY(&g_bdevperf.reactors)) {
 		spdk_app_stop(0);
 		return;
 	}
 	if (g_bdevperf.running_jobs == 0) {
 		bdevperf_test_done(NULL);
@ -1462,8 +1351,10 @@ spdk_bdevperf_shutdown_cb(void)
 	g_shutdown_tsc = spdk_get_ticks() - g_shutdown_tsc;
-	/* Send events to stop all I/O on each reactor */
+	/* Iterate jobs to stop all I/O */
-	spdk_for_each_channel(&g_bdevperf, bdevperf_stop_io_on_reactor, NULL, NULL);
+	TAILQ_FOREACH_SAFE(job, &g_bdevperf.jobs, link, tmp) {
 		spdk_thread_send_msg(job->thread, _bdevperf_job_drain, job);
 	}
 }
 static int