Blame - src/kernel/linux/v4.19/drivers/md/raid0.c - T800

blob: efa9df2336dac43135c6cf5b4c79311d29249460 [file] [log] [blame]

xj	b04a402	2021-11-25 15:01:52 +0800	[diff] [blame]	1	/*
				2	raid0.c : Multiple Devices driver for Linux
				3	Copyright (C) 1994-96 Marc ZYNGIER
				4	<zyngier@ufr-info-p7.ibp.fr> or
				5	<maz@gloups.fdn.fr>
				6	Copyright (C) 1999, 2000 Ingo Molnar, Red Hat
				7
				8	RAID-0 management functions.
				9
				10	This program is free software; you can redistribute it and/or modify
				11	it under the terms of the GNU General Public License as published by
				12	the Free Software Foundation; either version 2, or (at your option)
				13	any later version.
				14
				15	You should have received a copy of the GNU General Public License
				16	(for example /usr/src/linux/COPYING); if not, write to the Free
				17	Software Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
				18	*/
				19
				20	#include <linux/blkdev.h>
				21	#include <linux/seq_file.h>
				22	#include <linux/module.h>
				23	#include <linux/slab.h>
				24	#include <trace/events/block.h>
				25	#include "md.h"
				26	#include "raid0.h"
				27	#include "raid5.h"
				28
				29	static int default_layout = 0;
				30	module_param(default_layout, int, 0644);
				31
				32	#define UNSUPPORTED_MDDEV_FLAGS \
				33	((1L << MD_HAS_JOURNAL) \| \
				34	(1L << MD_JOURNAL_CLEAN) \| \
				35	(1L << MD_FAILFAST_SUPPORTED) \|\
				36	(1L << MD_HAS_PPL) \| \
				37	(1L << MD_HAS_MULTIPLE_PPLS))
				38
				39	static int raid0_congested(struct mddev *mddev, int bits)
				40	{
				41	struct r0conf *conf = mddev->private;
				42	struct md_rdev **devlist = conf->devlist;
				43	int raid_disks = conf->strip_zone[0].nb_dev;
				44	int i, ret = 0;
				45
				46	for (i = 0; i < raid_disks && !ret ; i++) {
				47	struct request_queue *q = bdev_get_queue(devlist[i]->bdev);
				48
				49	ret \|= bdi_congested(q->backing_dev_info, bits);
				50	}
				51	return ret;
				52	}
				53
				54	/*
				55	* inform the user of the raid configuration
				56	*/
				57	static void dump_zones(struct mddev *mddev)
				58	{
				59	int j, k;
				60	sector_t zone_size = 0;
				61	sector_t zone_start = 0;
				62	char b[BDEVNAME_SIZE];
				63	struct r0conf *conf = mddev->private;
				64	int raid_disks = conf->strip_zone[0].nb_dev;
				65	pr_debug("md: RAID0 configuration for %s - %d zone%s\n",
				66	mdname(mddev),
				67	conf->nr_strip_zones, conf->nr_strip_zones==1?"":"s");
				68	for (j = 0; j < conf->nr_strip_zones; j++) {
				69	char line[200];
				70	int len = 0;
				71
				72	for (k = 0; k < conf->strip_zone[j].nb_dev; k++)
				73	len += snprintf(line+len, 200-len, "%s%s", k?"/":"",
				74	bdevname(conf->devlist[j*raid_disks
				75	+ k]->bdev, b));
				76	pr_debug("md: zone%d=[%s]\n", j, line);
				77
				78	zone_size = conf->strip_zone[j].zone_end - zone_start;
				79	pr_debug(" zone-offset=%10lluKB, device-offset=%10lluKB, size=%10lluKB\n",
				80	(unsigned long long)zone_start>>1,
				81	(unsigned long long)conf->strip_zone[j].dev_start>>1,
				82	(unsigned long long)zone_size>>1);
				83	zone_start = conf->strip_zone[j].zone_end;
				84	}
				85	}
				86
				87	static int create_strip_zones(struct mddev mddev, struct r0conf *private_conf)
				88	{
				89	int i, c, err;
				90	sector_t curr_zone_end, sectors;
				91	struct md_rdev smallest, rdev1, rdev2, rdev, **dev;
				92	struct strip_zone *zone;
				93	int cnt;
				94	char b[BDEVNAME_SIZE];
				95	char b2[BDEVNAME_SIZE];
				96	struct r0conf conf = kzalloc(sizeof(conf), GFP_KERNEL);
				97	unsigned blksize = 512;
				98
				99	*private_conf = ERR_PTR(-ENOMEM);
				100	if (!conf)
				101	return -ENOMEM;
				102	rdev_for_each(rdev1, mddev) {
				103	pr_debug("md/raid0:%s: looking at %s\n",
				104	mdname(mddev),
				105	bdevname(rdev1->bdev, b));
				106	c = 0;
				107
				108	/* round size to chunk_size */
				109	sectors = rdev1->sectors;
				110	sector_div(sectors, mddev->chunk_sectors);
				111	rdev1->sectors = sectors * mddev->chunk_sectors;
				112
				113	blksize = max(blksize, queue_logical_block_size(
				114	rdev1->bdev->bd_disk->queue));
				115
				116	rdev_for_each(rdev2, mddev) {
				117	pr_debug("md/raid0:%s: comparing %s(%llu)"
				118	" with %s(%llu)\n",
				119	mdname(mddev),
				120	bdevname(rdev1->bdev,b),
				121	(unsigned long long)rdev1->sectors,
				122	bdevname(rdev2->bdev,b2),
				123	(unsigned long long)rdev2->sectors);
				124	if (rdev2 == rdev1) {
				125	pr_debug("md/raid0:%s: END\n",
				126	mdname(mddev));
				127	break;
				128	}
				129	if (rdev2->sectors == rdev1->sectors) {
				130	/*
				131	* Not unique, don't count it as a new
				132	* group
				133	*/
				134	pr_debug("md/raid0:%s: EQUAL\n",
				135	mdname(mddev));
				136	c = 1;
				137	break;
				138	}
				139	pr_debug("md/raid0:%s: NOT EQUAL\n",
				140	mdname(mddev));
				141	}
				142	if (!c) {
				143	pr_debug("md/raid0:%s: ==> UNIQUE\n",
				144	mdname(mddev));
				145	conf->nr_strip_zones++;
				146	pr_debug("md/raid0:%s: %d zones\n",
				147	mdname(mddev), conf->nr_strip_zones);
				148	}
				149	}
				150	pr_debug("md/raid0:%s: FINAL %d zones\n",
				151	mdname(mddev), conf->nr_strip_zones);
				152
				153	if (conf->nr_strip_zones == 1) {
				154	conf->layout = RAID0_ORIG_LAYOUT;
				155	} else if (default_layout == RAID0_ORIG_LAYOUT \|\|
				156	default_layout == RAID0_ALT_MULTIZONE_LAYOUT) {
				157	conf->layout = default_layout;
				158	} else {
				159	pr_err("md/raid0:%s: cannot assemble multi-zone RAID0 with default_layout setting\n",
				160	mdname(mddev));
				161	pr_err("md/raid0: please set raid0.default_layout to 1 or 2\n");
				162	err = -ENOTSUPP;
				163	goto abort;
				164	}
				165	/*
				166	* now since we have the hard sector sizes, we can make sure
				167	* chunk size is a multiple of that sector size
				168	*/
				169	if ((mddev->chunk_sectors << 9) % blksize) {
				170	pr_warn("md/raid0:%s: chunk_size of %d not multiple of block size %d\n",
				171	mdname(mddev),
				172	mddev->chunk_sectors << 9, blksize);
				173	err = -EINVAL;
				174	goto abort;
				175	}
				176
				177	err = -ENOMEM;
				178	conf->strip_zone = kcalloc(conf->nr_strip_zones,
				179	sizeof(struct strip_zone),
				180	GFP_KERNEL);
				181	if (!conf->strip_zone)
				182	goto abort;
				183	conf->devlist = kzalloc(array3_size(sizeof(struct md_rdev *),
				184	conf->nr_strip_zones,
				185	mddev->raid_disks),
				186	GFP_KERNEL);
				187	if (!conf->devlist)
				188	goto abort;
				189
				190	/* The first zone must contain all devices, so here we check that
				191	* there is a proper alignment of slots to devices and find them all
				192	*/
				193	zone = &conf->strip_zone[0];
				194	cnt = 0;
				195	smallest = NULL;
				196	dev = conf->devlist;
				197	err = -EINVAL;
				198	rdev_for_each(rdev1, mddev) {
				199	int j = rdev1->raid_disk;
				200
				201	if (mddev->level == 10) {
				202	/* taking over a raid10-n2 array */
				203	j /= 2;
				204	rdev1->new_raid_disk = j;
				205	}
				206
				207	if (mddev->level == 1) {
				208	/* taiking over a raid1 array-
				209	* we have only one active disk
				210	*/
				211	j = 0;
				212	rdev1->new_raid_disk = j;
				213	}
				214
				215	if (j < 0) {
				216	pr_warn("md/raid0:%s: remove inactive devices before converting to RAID0\n",
				217	mdname(mddev));
				218	goto abort;
				219	}
				220	if (j >= mddev->raid_disks) {
				221	pr_warn("md/raid0:%s: bad disk number %d - aborting!\n",
				222	mdname(mddev), j);
				223	goto abort;
				224	}
				225	if (dev[j]) {
				226	pr_warn("md/raid0:%s: multiple devices for %d - aborting!\n",
				227	mdname(mddev), j);
				228	goto abort;
				229	}
				230	dev[j] = rdev1;
				231
				232	if (!smallest \|\| (rdev1->sectors < smallest->sectors))
				233	smallest = rdev1;
				234	cnt++;
				235	}
				236	if (cnt != mddev->raid_disks) {
				237	pr_warn("md/raid0:%s: too few disks (%d of %d) - aborting!\n",
				238	mdname(mddev), cnt, mddev->raid_disks);
				239	goto abort;
				240	}
				241	zone->nb_dev = cnt;
				242	zone->zone_end = smallest->sectors * cnt;
				243
				244	curr_zone_end = zone->zone_end;
				245
				246	/* now do the other zones */
				247	for (i = 1; i < conf->nr_strip_zones; i++)
				248	{
				249	int j;
				250
				251	zone = conf->strip_zone + i;
				252	dev = conf->devlist + i * mddev->raid_disks;
				253
				254	pr_debug("md/raid0:%s: zone %d\n", mdname(mddev), i);
				255	zone->dev_start = smallest->sectors;
				256	smallest = NULL;
				257	c = 0;
				258
				259	for (j=0; j<cnt; j++) {
				260	rdev = conf->devlist[j];
				261	if (rdev->sectors <= zone->dev_start) {
				262	pr_debug("md/raid0:%s: checking %s ... nope\n",
				263	mdname(mddev),
				264	bdevname(rdev->bdev, b));
				265	continue;
				266	}
				267	pr_debug("md/raid0:%s: checking %s ..."
				268	" contained as device %d\n",
				269	mdname(mddev),
				270	bdevname(rdev->bdev, b), c);
				271	dev[c] = rdev;
				272	c++;
				273	if (!smallest \|\| rdev->sectors < smallest->sectors) {
				274	smallest = rdev;
				275	pr_debug("md/raid0:%s: (%llu) is smallest!.\n",
				276	mdname(mddev),
				277	(unsigned long long)rdev->sectors);
				278	}
				279	}
				280
				281	zone->nb_dev = c;
				282	sectors = (smallest->sectors - zone->dev_start) * c;
				283	pr_debug("md/raid0:%s: zone->nb_dev: %d, sectors: %llu\n",
				284	mdname(mddev),
				285	zone->nb_dev, (unsigned long long)sectors);
				286
				287	curr_zone_end += sectors;
				288	zone->zone_end = curr_zone_end;
				289
				290	pr_debug("md/raid0:%s: current zone start: %llu\n",
				291	mdname(mddev),
				292	(unsigned long long)smallest->sectors);
				293	}
				294
				295	pr_debug("md/raid0:%s: done.\n", mdname(mddev));
				296	*private_conf = conf;
				297
				298	return 0;
				299	abort:
				300	kfree(conf->strip_zone);
				301	kfree(conf->devlist);
				302	kfree(conf);
				303	*private_conf = ERR_PTR(err);
				304	return err;
				305	}
				306
				307	/* Find the zone which holds a particular offset
				308	* Update *sectorp to be an offset in that zone
				309	*/
				310	static struct strip_zone find_zone(struct r0conf conf,
				311	sector_t *sectorp)
				312	{
				313	int i;
				314	struct strip_zone *z = conf->strip_zone;
				315	sector_t sector = *sectorp;
				316
				317	for (i = 0; i < conf->nr_strip_zones; i++)
				318	if (sector < z[i].zone_end) {
				319	if (i)
				320	*sectorp = sector - z[i-1].zone_end;
				321	return z + i;
				322	}
				323	BUG();
				324	}
				325
				326	/*
				327	* remaps the bio to the target device. we separate two flows.
				328	* power 2 flow and a general flow for the sake of performance
				329	*/
				330	static struct md_rdev map_sector(struct mddev mddev, struct strip_zone *zone,
				331	sector_t sector, sector_t *sector_offset)
				332	{
				333	unsigned int sect_in_chunk;
				334	sector_t chunk;
				335	struct r0conf *conf = mddev->private;
				336	int raid_disks = conf->strip_zone[0].nb_dev;
				337	unsigned int chunk_sects = mddev->chunk_sectors;
				338
				339	if (is_power_of_2(chunk_sects)) {
				340	int chunksect_bits = ffz(~chunk_sects);
				341	/* find the sector offset inside the chunk */
				342	sect_in_chunk = sector & (chunk_sects - 1);
				343	sector >>= chunksect_bits;
				344	/* chunk in zone */
				345	chunk = *sector_offset;
				346	/* quotient is the chunk in real device*/
				347	sector_div(chunk, zone->nb_dev << chunksect_bits);
				348	} else{
				349	sect_in_chunk = sector_div(sector, chunk_sects);
				350	chunk = *sector_offset;
				351	sector_div(chunk, chunk_sects * zone->nb_dev);
				352	}
				353	/*
				354	* position the bio over the real device
				355	* real sector = chunk in device + starting of zone
				356	* + the position in the chunk
				357	*/
				358	sector_offset = (chunk chunk_sects) + sect_in_chunk;
				359	return conf->devlist[(zone - conf->strip_zone)*raid_disks
				360	+ sector_div(sector, zone->nb_dev)];
				361	}
				362
				363	static sector_t raid0_size(struct mddev *mddev, sector_t sectors, int raid_disks)
				364	{
				365	sector_t array_sectors = 0;
				366	struct md_rdev *rdev;
				367
				368	WARN_ONCE(sectors \|\| raid_disks,
				369	"%s does not support generic reshape\n", __func__);
				370
				371	rdev_for_each(rdev, mddev)
				372	array_sectors += (rdev->sectors &
				373	~(sector_t)(mddev->chunk_sectors-1));
				374
				375	return array_sectors;
				376	}
				377
				378	static void raid0_free(struct mddev mddev, void priv);
				379
				380	static int raid0_run(struct mddev *mddev)
				381	{
				382	struct r0conf *conf;
				383	int ret;
				384
				385	if (mddev->chunk_sectors == 0) {
				386	pr_warn("md/raid0:%s: chunk size must be set.\n", mdname(mddev));
				387	return -EINVAL;
				388	}
				389	if (md_check_no_bitmap(mddev))
				390	return -EINVAL;
				391
				392	/* if private is not null, we are here after takeover */
				393	if (mddev->private == NULL) {
				394	ret = create_strip_zones(mddev, &conf);
				395	if (ret < 0)
				396	return ret;
				397	mddev->private = conf;
				398	}
				399	conf = mddev->private;
				400	if (mddev->queue) {
				401	struct md_rdev *rdev;
				402	bool discard_supported = false;
				403
				404	blk_queue_max_hw_sectors(mddev->queue, mddev->chunk_sectors);
				405	blk_queue_max_write_same_sectors(mddev->queue, mddev->chunk_sectors);
				406	blk_queue_max_write_zeroes_sectors(mddev->queue, mddev->chunk_sectors);
				407	blk_queue_max_discard_sectors(mddev->queue, UINT_MAX);
				408
				409	blk_queue_io_min(mddev->queue, mddev->chunk_sectors << 9);
				410	blk_queue_io_opt(mddev->queue,
				411	(mddev->chunk_sectors << 9) * mddev->raid_disks);
				412
				413	rdev_for_each(rdev, mddev) {
				414	disk_stack_limits(mddev->gendisk, rdev->bdev,
				415	rdev->data_offset << 9);
				416	if (blk_queue_discard(bdev_get_queue(rdev->bdev)))
				417	discard_supported = true;
				418	}
				419	if (!discard_supported)
				420	blk_queue_flag_clear(QUEUE_FLAG_DISCARD, mddev->queue);
				421	else
				422	blk_queue_flag_set(QUEUE_FLAG_DISCARD, mddev->queue);
				423	}
				424
				425	/* calculate array device size */
				426	md_set_array_sectors(mddev, raid0_size(mddev, 0, 0));
				427
				428	pr_debug("md/raid0:%s: md_size is %llu sectors.\n",
				429	mdname(mddev),
				430	(unsigned long long)mddev->array_sectors);
				431
				432	if (mddev->queue) {
				433	/* calculate the max read-ahead size.
				434	* For read-ahead of large files to be effective, we need to
				435	* readahead at least twice a whole stripe. i.e. number of devices
				436	* multiplied by chunk size times 2.
				437	* If an individual device has an ra_pages greater than the
				438	* chunk size, then we will not drive that device as hard as it
				439	* wants. We consider this a configuration error: a larger
				440	* chunksize should be used in that case.
				441	*/
				442	int stripe = mddev->raid_disks *
				443	(mddev->chunk_sectors << 9) / PAGE_SIZE;
				444	if (mddev->queue->backing_dev_info->ra_pages < 2* stripe)
				445	mddev->queue->backing_dev_info->ra_pages = 2* stripe;
				446	}
				447
				448	dump_zones(mddev);
				449
				450	ret = md_integrity_register(mddev);
				451
				452	return ret;
				453	}
				454
				455	static void raid0_free(struct mddev mddev, void priv)
				456	{
				457	struct r0conf *conf = priv;
				458
				459	kfree(conf->strip_zone);
				460	kfree(conf->devlist);
				461	kfree(conf);
				462	}
				463
				464	/*
				465	* Is io distribute over 1 or more chunks ?
				466	*/
				467	static inline int is_io_in_chunk_boundary(struct mddev *mddev,
				468	unsigned int chunk_sects, struct bio *bio)
				469	{
				470	if (likely(is_power_of_2(chunk_sects))) {
				471	return chunk_sects >=
				472	((bio->bi_iter.bi_sector & (chunk_sects-1))
				473	+ bio_sectors(bio));
				474	} else{
				475	sector_t sector = bio->bi_iter.bi_sector;
				476	return chunk_sects >= (sector_div(sector, chunk_sects)
				477	+ bio_sectors(bio));
				478	}
				479	}
				480
				481	static void raid0_handle_discard(struct mddev mddev, struct bio bio)
				482	{
				483	struct r0conf *conf = mddev->private;
				484	struct strip_zone *zone;
				485	sector_t start = bio->bi_iter.bi_sector;
				486	sector_t end;
				487	unsigned int stripe_size;
				488	sector_t first_stripe_index, last_stripe_index;
				489	sector_t start_disk_offset;
				490	unsigned int start_disk_index;
				491	sector_t end_disk_offset;
				492	unsigned int end_disk_index;
				493	unsigned int disk;
				494
				495	zone = find_zone(conf, &start);
				496
				497	if (bio_end_sector(bio) > zone->zone_end) {
				498	struct bio *split = bio_split(bio,
				499	zone->zone_end - bio->bi_iter.bi_sector, GFP_NOIO,
				500	&mddev->bio_set);
				501	bio_chain(split, bio);
				502	generic_make_request(bio);
				503	bio = split;
				504	end = zone->zone_end;
				505	} else
				506	end = bio_end_sector(bio);
				507
				508	if (zone != conf->strip_zone)
				509	end = end - zone[-1].zone_end;
				510
				511	/* Now start and end is the offset in zone */
				512	stripe_size = zone->nb_dev * mddev->chunk_sectors;
				513
				514	first_stripe_index = start;
				515	sector_div(first_stripe_index, stripe_size);
				516	last_stripe_index = end;
				517	sector_div(last_stripe_index, stripe_size);
				518
				519	start_disk_index = (int)(start - first_stripe_index * stripe_size) /
				520	mddev->chunk_sectors;
				521	start_disk_offset = ((int)(start - first_stripe_index * stripe_size) %
				522	mddev->chunk_sectors) +
				523	first_stripe_index * mddev->chunk_sectors;
				524	end_disk_index = (int)(end - last_stripe_index * stripe_size) /
				525	mddev->chunk_sectors;
				526	end_disk_offset = ((int)(end - last_stripe_index * stripe_size) %
				527	mddev->chunk_sectors) +
				528	last_stripe_index * mddev->chunk_sectors;
				529
				530	for (disk = 0; disk < zone->nb_dev; disk++) {
				531	sector_t dev_start, dev_end;
				532	struct bio *discard_bio = NULL;
				533	struct md_rdev *rdev;
				534
				535	if (disk < start_disk_index)
				536	dev_start = (first_stripe_index + 1) *
				537	mddev->chunk_sectors;
				538	else if (disk > start_disk_index)
				539	dev_start = first_stripe_index * mddev->chunk_sectors;
				540	else
				541	dev_start = start_disk_offset;
				542
				543	if (disk < end_disk_index)
				544	dev_end = (last_stripe_index + 1) * mddev->chunk_sectors;
				545	else if (disk > end_disk_index)
				546	dev_end = last_stripe_index * mddev->chunk_sectors;
				547	else
				548	dev_end = end_disk_offset;
				549
				550	if (dev_end <= dev_start)
				551	continue;
				552
				553	rdev = conf->devlist[(zone - conf->strip_zone) *
				554	conf->strip_zone[0].nb_dev + disk];
				555	if (__blkdev_issue_discard(rdev->bdev,
				556	dev_start + zone->dev_start + rdev->data_offset,
				557	dev_end - dev_start, GFP_NOIO, 0, &discard_bio) \|\|
				558	!discard_bio)
				559	continue;
				560	bio_chain(discard_bio, bio);
				561	bio_clone_blkcg_association(discard_bio, bio);
				562	if (mddev->gendisk)
				563	trace_block_bio_remap(bdev_get_queue(rdev->bdev),
				564	discard_bio, disk_devt(mddev->gendisk),
				565	bio->bi_iter.bi_sector);
				566	bio_clear_flag(bio, BIO_QUEUE_ENTERED);
				567	generic_make_request(discard_bio);
				568	}
				569	bio_endio(bio);
				570	}
				571
				572	static bool raid0_make_request(struct mddev mddev, struct bio bio)
				573	{
				574	struct r0conf *conf = mddev->private;
				575	struct strip_zone *zone;
				576	struct md_rdev *tmp_dev;
				577	sector_t bio_sector;
				578	sector_t sector;
				579	sector_t orig_sector;
				580	unsigned chunk_sects;
				581	unsigned sectors;
				582
				583	if (unlikely(bio->bi_opf & REQ_PREFLUSH)
				584	&& md_flush_request(mddev, bio))
				585	return true;
				586
				587	if (unlikely((bio_op(bio) == REQ_OP_DISCARD))) {
				588	raid0_handle_discard(mddev, bio);
				589	return true;
				590	}
				591
				592	bio_sector = bio->bi_iter.bi_sector;
				593	sector = bio_sector;
				594	chunk_sects = mddev->chunk_sectors;
				595
				596	sectors = chunk_sects -
				597	(likely(is_power_of_2(chunk_sects))
				598	? (sector & (chunk_sects-1))
				599	: sector_div(sector, chunk_sects));
				600
				601	/* Restore due to sector_div */
				602	sector = bio_sector;
				603
				604	if (sectors < bio_sectors(bio)) {
				605	struct bio *split = bio_split(bio, sectors, GFP_NOIO,
				606	&mddev->bio_set);
				607	bio_chain(split, bio);
				608	generic_make_request(bio);
				609	bio = split;
				610	}
				611
				612	orig_sector = sector;
				613	zone = find_zone(mddev->private, &sector);
				614	switch (conf->layout) {
				615	case RAID0_ORIG_LAYOUT:
				616	tmp_dev = map_sector(mddev, zone, orig_sector, &sector);
				617	break;
				618	case RAID0_ALT_MULTIZONE_LAYOUT:
				619	tmp_dev = map_sector(mddev, zone, sector, &sector);
				620	break;
				621	default:
				622	WARN(1, "md/raid0:%s: Invalid layout\n", mdname(mddev));
				623	bio_io_error(bio);
				624	return true;
				625	}
				626
				627	bio_set_dev(bio, tmp_dev->bdev);
				628	bio->bi_iter.bi_sector = sector + zone->dev_start +
				629	tmp_dev->data_offset;
				630
				631	if (mddev->gendisk)
				632	trace_block_bio_remap(bio->bi_disk->queue, bio,
				633	disk_devt(mddev->gendisk), bio_sector);
				634	mddev_check_writesame(mddev, bio);
				635	mddev_check_write_zeroes(mddev, bio);
				636	bio_clear_flag(bio, BIO_QUEUE_ENTERED);
				637	generic_make_request(bio);
				638	return true;
				639	}
				640
				641	static void raid0_status(struct seq_file seq, struct mddev mddev)
				642	{
				643	seq_printf(seq, " %dk chunks", mddev->chunk_sectors / 2);
				644	return;
				645	}
				646
				647	static void raid0_takeover_raid45(struct mddev mddev)
				648	{
				649	struct md_rdev *rdev;
				650	struct r0conf *priv_conf;
				651
				652	if (mddev->degraded != 1) {
				653	pr_warn("md/raid0:%s: raid5 must be degraded! Degraded disks: %d\n",
				654	mdname(mddev),
				655	mddev->degraded);
				656	return ERR_PTR(-EINVAL);
				657	}
				658
				659	rdev_for_each(rdev, mddev) {
				660	/* check slot number for a disk */
				661	if (rdev->raid_disk == mddev->raid_disks-1) {
				662	pr_warn("md/raid0:%s: raid5 must have missing parity disk!\n",
				663	mdname(mddev));
				664	return ERR_PTR(-EINVAL);
				665	}
				666	rdev->sectors = mddev->dev_sectors;
				667	}
				668
				669	/* Set new parameters */
				670	mddev->new_level = 0;
				671	mddev->new_layout = 0;
				672	mddev->new_chunk_sectors = mddev->chunk_sectors;
				673	mddev->raid_disks--;
				674	mddev->delta_disks = -1;
				675	/* make sure it will be not marked as dirty */
				676	mddev->recovery_cp = MaxSector;
				677	mddev_clear_unsupported_flags(mddev, UNSUPPORTED_MDDEV_FLAGS);
				678
				679	create_strip_zones(mddev, &priv_conf);
				680
				681	return priv_conf;
				682	}
				683
				684	static void raid0_takeover_raid10(struct mddev mddev)
				685	{
				686	struct r0conf *priv_conf;
				687
				688	/* Check layout:
				689	* - far_copies must be 1
				690	* - near_copies must be 2
				691	* - disks number must be even
				692	* - all mirrors must be already degraded
				693	*/
				694	if (mddev->layout != ((1 << 8) + 2)) {
				695	pr_warn("md/raid0:%s:: Raid0 cannot takeover layout: 0x%x\n",
				696	mdname(mddev),
				697	mddev->layout);
				698	return ERR_PTR(-EINVAL);
				699	}
				700	if (mddev->raid_disks & 1) {
				701	pr_warn("md/raid0:%s: Raid0 cannot takeover Raid10 with odd disk number.\n",
				702	mdname(mddev));
				703	return ERR_PTR(-EINVAL);
				704	}
				705	if (mddev->degraded != (mddev->raid_disks>>1)) {
				706	pr_warn("md/raid0:%s: All mirrors must be already degraded!\n",
				707	mdname(mddev));
				708	return ERR_PTR(-EINVAL);
				709	}
				710
				711	/* Set new parameters */
				712	mddev->new_level = 0;
				713	mddev->new_layout = 0;
				714	mddev->new_chunk_sectors = mddev->chunk_sectors;
				715	mddev->delta_disks = - mddev->raid_disks / 2;
				716	mddev->raid_disks += mddev->delta_disks;
				717	mddev->degraded = 0;
				718	/* make sure it will be not marked as dirty */
				719	mddev->recovery_cp = MaxSector;
				720	mddev_clear_unsupported_flags(mddev, UNSUPPORTED_MDDEV_FLAGS);
				721
				722	create_strip_zones(mddev, &priv_conf);
				723	return priv_conf;
				724	}
				725
				726	static void raid0_takeover_raid1(struct mddev mddev)
				727	{
				728	struct r0conf *priv_conf;
				729	int chunksect;
				730
				731	/* Check layout:
				732	* - (N - 1) mirror drives must be already faulty
				733	*/
				734	if ((mddev->raid_disks - 1) != mddev->degraded) {
				735	pr_err("md/raid0:%s: (N - 1) mirrors drives must be already faulty!\n",
				736	mdname(mddev));
				737	return ERR_PTR(-EINVAL);
				738	}
				739
				740	/*
				741	* a raid1 doesn't have the notion of chunk size, so
				742	* figure out the largest suitable size we can use.
				743	*/
				744	chunksect = 64 * 2; /* 64K by default */
				745
				746	/* The array must be an exact multiple of chunksize */
				747	while (chunksect && (mddev->array_sectors & (chunksect - 1)))
				748	chunksect >>= 1;
				749
				750	if ((chunksect << 9) < PAGE_SIZE)
				751	/* array size does not allow a suitable chunk size */
				752	return ERR_PTR(-EINVAL);
				753
				754	/* Set new parameters */
				755	mddev->new_level = 0;
				756	mddev->new_layout = 0;
				757	mddev->new_chunk_sectors = chunksect;
				758	mddev->chunk_sectors = chunksect;
				759	mddev->delta_disks = 1 - mddev->raid_disks;
				760	mddev->raid_disks = 1;
				761	/* make sure it will be not marked as dirty */
				762	mddev->recovery_cp = MaxSector;
				763	mddev_clear_unsupported_flags(mddev, UNSUPPORTED_MDDEV_FLAGS);
				764
				765	create_strip_zones(mddev, &priv_conf);
				766	return priv_conf;
				767	}
				768
				769	static void raid0_takeover(struct mddev mddev)
				770	{
				771	/* raid0 can take over:
				772	* raid4 - if all data disks are active.
				773	* raid5 - providing it is Raid4 layout and one disk is faulty
				774	* raid10 - assuming we have all necessary active disks
				775	* raid1 - with (N -1) mirror drives faulty
				776	*/
				777
				778	if (mddev->bitmap) {
				779	pr_warn("md/raid0: %s: cannot takeover array with bitmap\n",
				780	mdname(mddev));
				781	return ERR_PTR(-EBUSY);
				782	}
				783	if (mddev->level == 4)
				784	return raid0_takeover_raid45(mddev);
				785
				786	if (mddev->level == 5) {
				787	if (mddev->layout == ALGORITHM_PARITY_N)
				788	return raid0_takeover_raid45(mddev);
				789
				790	pr_warn("md/raid0:%s: Raid can only takeover Raid5 with layout: %d\n",
				791	mdname(mddev), ALGORITHM_PARITY_N);
				792	}
				793
				794	if (mddev->level == 10)
				795	return raid0_takeover_raid10(mddev);
				796
				797	if (mddev->level == 1)
				798	return raid0_takeover_raid1(mddev);
				799
				800	pr_warn("Takeover from raid%i to raid0 not supported\n",
				801	mddev->level);
				802
				803	return ERR_PTR(-EINVAL);
				804	}
				805
				806	static void raid0_quiesce(struct mddev *mddev, int quiesce)
				807	{
				808	}
				809
				810	static struct md_personality raid0_personality=
				811	{
				812	.name = "raid0",
				813	.level = 0,
				814	.owner = THIS_MODULE,
				815	.make_request = raid0_make_request,
				816	.run = raid0_run,
				817	.free = raid0_free,
				818	.status = raid0_status,
				819	.size = raid0_size,
				820	.takeover = raid0_takeover,
				821	.quiesce = raid0_quiesce,
				822	.congested = raid0_congested,
				823	};
				824
				825	static int __init raid0_init (void)
				826	{
				827	return register_md_personality (&raid0_personality);
				828	}
				829
				830	static void raid0_exit (void)
				831	{
				832	unregister_md_personality (&raid0_personality);
				833	}
				834
				835	module_init(raid0_init);
				836	module_exit(raid0_exit);
				837	MODULE_LICENSE("GPL");
				838	MODULE_DESCRIPTION("RAID0 (striping) personality for MD");
				839	MODULE_ALIAS("md-personality-2"); /* RAID0 */
				840	MODULE_ALIAS("md-raid0");
				841	MODULE_ALIAS("md-level-0");