Blame - src/kernel/linux/v4.14/drivers/md/raid0.c - T103

blob: e179c121c03003a9aa4fbc1c8b423326a886b3a9 [file] [log] [blame]

rjw	1f88458	2022-01-06 17:20:42 +0800	[diff] [blame]	1	/*
				2	raid0.c : Multiple Devices driver for Linux
				3	Copyright (C) 1994-96 Marc ZYNGIER
				4	<zyngier@ufr-info-p7.ibp.fr> or
				5	<maz@gloups.fdn.fr>
				6	Copyright (C) 1999, 2000 Ingo Molnar, Red Hat
				7
				8	RAID-0 management functions.
				9
				10	This program is free software; you can redistribute it and/or modify
				11	it under the terms of the GNU General Public License as published by
				12	the Free Software Foundation; either version 2, or (at your option)
				13	any later version.
				14
				15	You should have received a copy of the GNU General Public License
				16	(for example /usr/src/linux/COPYING); if not, write to the Free
				17	Software Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
				18	*/
				19
				20	#include <linux/blkdev.h>
				21	#include <linux/seq_file.h>
				22	#include <linux/module.h>
				23	#include <linux/slab.h>
				24	#include <trace/events/block.h>
				25	#include "md.h"
				26	#include "raid0.h"
				27	#include "raid5.h"
				28
				29	static int default_layout = 0;
				30	module_param(default_layout, int, 0644);
				31
				32	#define UNSUPPORTED_MDDEV_FLAGS \
				33	((1L << MD_HAS_JOURNAL) \| \
				34	(1L << MD_JOURNAL_CLEAN) \| \
				35	(1L << MD_FAILFAST_SUPPORTED) \|\
				36	(1L << MD_HAS_PPL) \| \
				37	(1L << MD_HAS_MULTIPLE_PPLS))
				38
				39	static int raid0_congested(struct mddev *mddev, int bits)
				40	{
				41	struct r0conf *conf = mddev->private;
				42	struct md_rdev **devlist = conf->devlist;
				43	int raid_disks = conf->strip_zone[0].nb_dev;
				44	int i, ret = 0;
				45
				46	for (i = 0; i < raid_disks && !ret ; i++) {
				47	struct request_queue *q = bdev_get_queue(devlist[i]->bdev);
				48
				49	ret \|= bdi_congested(q->backing_dev_info, bits);
				50	}
				51	return ret;
				52	}
				53
				54	/*
				55	* inform the user of the raid configuration
				56	*/
				57	static void dump_zones(struct mddev *mddev)
				58	{
				59	int j, k;
				60	sector_t zone_size = 0;
				61	sector_t zone_start = 0;
				62	char b[BDEVNAME_SIZE];
				63	struct r0conf *conf = mddev->private;
				64	int raid_disks = conf->strip_zone[0].nb_dev;
				65	pr_debug("md: RAID0 configuration for %s - %d zone%s\n",
				66	mdname(mddev),
				67	conf->nr_strip_zones, conf->nr_strip_zones==1?"":"s");
				68	for (j = 0; j < conf->nr_strip_zones; j++) {
				69	char line[200];
				70	int len = 0;
				71
				72	for (k = 0; k < conf->strip_zone[j].nb_dev; k++)
				73	len += snprintf(line+len, 200-len, "%s%s", k?"/":"",
				74	bdevname(conf->devlist[j*raid_disks
				75	+ k]->bdev, b));
				76	pr_debug("md: zone%d=[%s]\n", j, line);
				77
				78	zone_size = conf->strip_zone[j].zone_end - zone_start;
				79	pr_debug(" zone-offset=%10lluKB, device-offset=%10lluKB, size=%10lluKB\n",
				80	(unsigned long long)zone_start>>1,
				81	(unsigned long long)conf->strip_zone[j].dev_start>>1,
				82	(unsigned long long)zone_size>>1);
				83	zone_start = conf->strip_zone[j].zone_end;
				84	}
				85	}
				86
				87	static int create_strip_zones(struct mddev mddev, struct r0conf *private_conf)
				88	{
				89	int i, c, err;
				90	sector_t curr_zone_end, sectors;
				91	struct md_rdev smallest, rdev1, rdev2, rdev, **dev;
				92	struct strip_zone *zone;
				93	int cnt;
				94	char b[BDEVNAME_SIZE];
				95	char b2[BDEVNAME_SIZE];
				96	struct r0conf conf = kzalloc(sizeof(conf), GFP_KERNEL);
				97	unsigned blksize = 512;
				98
				99	*private_conf = ERR_PTR(-ENOMEM);
				100	if (!conf)
				101	return -ENOMEM;
				102	rdev_for_each(rdev1, mddev) {
				103	pr_debug("md/raid0:%s: looking at %s\n",
				104	mdname(mddev),
				105	bdevname(rdev1->bdev, b));
				106	c = 0;
				107
				108	/* round size to chunk_size */
				109	sectors = rdev1->sectors;
				110	sector_div(sectors, mddev->chunk_sectors);
				111	rdev1->sectors = sectors * mddev->chunk_sectors;
				112
				113	blksize = max(blksize, queue_logical_block_size(
				114	rdev1->bdev->bd_disk->queue));
				115
				116	rdev_for_each(rdev2, mddev) {
				117	pr_debug("md/raid0:%s: comparing %s(%llu)"
				118	" with %s(%llu)\n",
				119	mdname(mddev),
				120	bdevname(rdev1->bdev,b),
				121	(unsigned long long)rdev1->sectors,
				122	bdevname(rdev2->bdev,b2),
				123	(unsigned long long)rdev2->sectors);
				124	if (rdev2 == rdev1) {
				125	pr_debug("md/raid0:%s: END\n",
				126	mdname(mddev));
				127	break;
				128	}
				129	if (rdev2->sectors == rdev1->sectors) {
				130	/*
				131	* Not unique, don't count it as a new
				132	* group
				133	*/
				134	pr_debug("md/raid0:%s: EQUAL\n",
				135	mdname(mddev));
				136	c = 1;
				137	break;
				138	}
				139	pr_debug("md/raid0:%s: NOT EQUAL\n",
				140	mdname(mddev));
				141	}
				142	if (!c) {
				143	pr_debug("md/raid0:%s: ==> UNIQUE\n",
				144	mdname(mddev));
				145	conf->nr_strip_zones++;
				146	pr_debug("md/raid0:%s: %d zones\n",
				147	mdname(mddev), conf->nr_strip_zones);
				148	}
				149	}
				150	pr_debug("md/raid0:%s: FINAL %d zones\n",
				151	mdname(mddev), conf->nr_strip_zones);
				152
				153	if (conf->nr_strip_zones == 1) {
				154	conf->layout = RAID0_ORIG_LAYOUT;
				155	} else if (mddev->layout == RAID0_ORIG_LAYOUT \|\|
				156	mddev->layout == RAID0_ALT_MULTIZONE_LAYOUT) {
				157	conf->layout = mddev->layout;
				158	} else if (default_layout == RAID0_ORIG_LAYOUT \|\|
				159	default_layout == RAID0_ALT_MULTIZONE_LAYOUT) {
				160	conf->layout = default_layout;
				161	} else {
				162	pr_err("md/raid0:%s: cannot assemble multi-zone RAID0 with default_layout setting\n",
				163	mdname(mddev));
				164	pr_err("md/raid0: please set raid0.default_layout to 1 or 2\n");
				165	err = -ENOTSUPP;
				166	goto abort;
				167	}
				168	/*
				169	* now since we have the hard sector sizes, we can make sure
				170	* chunk size is a multiple of that sector size
				171	*/
				172	if ((mddev->chunk_sectors << 9) % blksize) {
				173	pr_warn("md/raid0:%s: chunk_size of %d not multiple of block size %d\n",
				174	mdname(mddev),
				175	mddev->chunk_sectors << 9, blksize);
				176	err = -EINVAL;
				177	goto abort;
				178	}
				179
				180	err = -ENOMEM;
				181	conf->strip_zone = kzalloc(sizeof(struct strip_zone)*
				182	conf->nr_strip_zones, GFP_KERNEL);
				183	if (!conf->strip_zone)
				184	goto abort;
				185	conf->devlist = kzalloc(sizeof(struct md_rdev)
				186	conf->nr_strip_zones*mddev->raid_disks,
				187	GFP_KERNEL);
				188	if (!conf->devlist)
				189	goto abort;
				190
				191	/* The first zone must contain all devices, so here we check that
				192	* there is a proper alignment of slots to devices and find them all
				193	*/
				194	zone = &conf->strip_zone[0];
				195	cnt = 0;
				196	smallest = NULL;
				197	dev = conf->devlist;
				198	err = -EINVAL;
				199	rdev_for_each(rdev1, mddev) {
				200	int j = rdev1->raid_disk;
				201
				202	if (mddev->level == 10) {
				203	/* taking over a raid10-n2 array */
				204	j /= 2;
				205	rdev1->new_raid_disk = j;
				206	}
				207
				208	if (mddev->level == 1) {
				209	/* taiking over a raid1 array-
				210	* we have only one active disk
				211	*/
				212	j = 0;
				213	rdev1->new_raid_disk = j;
				214	}
				215
				216	if (j < 0) {
				217	pr_warn("md/raid0:%s: remove inactive devices before converting to RAID0\n",
				218	mdname(mddev));
				219	goto abort;
				220	}
				221	if (j >= mddev->raid_disks) {
				222	pr_warn("md/raid0:%s: bad disk number %d - aborting!\n",
				223	mdname(mddev), j);
				224	goto abort;
				225	}
				226	if (dev[j]) {
				227	pr_warn("md/raid0:%s: multiple devices for %d - aborting!\n",
				228	mdname(mddev), j);
				229	goto abort;
				230	}
				231	dev[j] = rdev1;
				232
				233	if (!smallest \|\| (rdev1->sectors < smallest->sectors))
				234	smallest = rdev1;
				235	cnt++;
				236	}
				237	if (cnt != mddev->raid_disks) {
				238	pr_warn("md/raid0:%s: too few disks (%d of %d) - aborting!\n",
				239	mdname(mddev), cnt, mddev->raid_disks);
				240	goto abort;
				241	}
				242	zone->nb_dev = cnt;
				243	zone->zone_end = smallest->sectors * cnt;
				244
				245	curr_zone_end = zone->zone_end;
				246
				247	/* now do the other zones */
				248	for (i = 1; i < conf->nr_strip_zones; i++)
				249	{
				250	int j;
				251
				252	zone = conf->strip_zone + i;
				253	dev = conf->devlist + i * mddev->raid_disks;
				254
				255	pr_debug("md/raid0:%s: zone %d\n", mdname(mddev), i);
				256	zone->dev_start = smallest->sectors;
				257	smallest = NULL;
				258	c = 0;
				259
				260	for (j=0; j<cnt; j++) {
				261	rdev = conf->devlist[j];
				262	if (rdev->sectors <= zone->dev_start) {
				263	pr_debug("md/raid0:%s: checking %s ... nope\n",
				264	mdname(mddev),
				265	bdevname(rdev->bdev, b));
				266	continue;
				267	}
				268	pr_debug("md/raid0:%s: checking %s ..."
				269	" contained as device %d\n",
				270	mdname(mddev),
				271	bdevname(rdev->bdev, b), c);
				272	dev[c] = rdev;
				273	c++;
				274	if (!smallest \|\| rdev->sectors < smallest->sectors) {
				275	smallest = rdev;
				276	pr_debug("md/raid0:%s: (%llu) is smallest!.\n",
				277	mdname(mddev),
				278	(unsigned long long)rdev->sectors);
				279	}
				280	}
				281
				282	zone->nb_dev = c;
				283	sectors = (smallest->sectors - zone->dev_start) * c;
				284	pr_debug("md/raid0:%s: zone->nb_dev: %d, sectors: %llu\n",
				285	mdname(mddev),
				286	zone->nb_dev, (unsigned long long)sectors);
				287
				288	curr_zone_end += sectors;
				289	zone->zone_end = curr_zone_end;
				290
				291	pr_debug("md/raid0:%s: current zone start: %llu\n",
				292	mdname(mddev),
				293	(unsigned long long)smallest->sectors);
				294	}
				295
				296	pr_debug("md/raid0:%s: done.\n", mdname(mddev));
				297	*private_conf = conf;
				298
				299	return 0;
				300	abort:
				301	kfree(conf->strip_zone);
				302	kfree(conf->devlist);
				303	kfree(conf);
				304	*private_conf = ERR_PTR(err);
				305	return err;
				306	}
				307
				308	/* Find the zone which holds a particular offset
				309	* Update *sectorp to be an offset in that zone
				310	*/
				311	static struct strip_zone find_zone(struct r0conf conf,
				312	sector_t *sectorp)
				313	{
				314	int i;
				315	struct strip_zone *z = conf->strip_zone;
				316	sector_t sector = *sectorp;
				317
				318	for (i = 0; i < conf->nr_strip_zones; i++)
				319	if (sector < z[i].zone_end) {
				320	if (i)
				321	*sectorp = sector - z[i-1].zone_end;
				322	return z + i;
				323	}
				324	BUG();
				325	}
				326
				327	/*
				328	* remaps the bio to the target device. we separate two flows.
				329	* power 2 flow and a general flow for the sake of performance
				330	*/
				331	static struct md_rdev map_sector(struct mddev mddev, struct strip_zone *zone,
				332	sector_t sector, sector_t *sector_offset)
				333	{
				334	unsigned int sect_in_chunk;
				335	sector_t chunk;
				336	struct r0conf *conf = mddev->private;
				337	int raid_disks = conf->strip_zone[0].nb_dev;
				338	unsigned int chunk_sects = mddev->chunk_sectors;
				339
				340	if (is_power_of_2(chunk_sects)) {
				341	int chunksect_bits = ffz(~chunk_sects);
				342	/* find the sector offset inside the chunk */
				343	sect_in_chunk = sector & (chunk_sects - 1);
				344	sector >>= chunksect_bits;
				345	/* chunk in zone */
				346	chunk = *sector_offset;
				347	/* quotient is the chunk in real device*/
				348	sector_div(chunk, zone->nb_dev << chunksect_bits);
				349	} else{
				350	sect_in_chunk = sector_div(sector, chunk_sects);
				351	chunk = *sector_offset;
				352	sector_div(chunk, chunk_sects * zone->nb_dev);
				353	}
				354	/*
				355	* position the bio over the real device
				356	* real sector = chunk in device + starting of zone
				357	* + the position in the chunk
				358	*/
				359	sector_offset = (chunk chunk_sects) + sect_in_chunk;
				360	return conf->devlist[(zone - conf->strip_zone)*raid_disks
				361	+ sector_div(sector, zone->nb_dev)];
				362	}
				363
				364	static sector_t raid0_size(struct mddev *mddev, sector_t sectors, int raid_disks)
				365	{
				366	sector_t array_sectors = 0;
				367	struct md_rdev *rdev;
				368
				369	WARN_ONCE(sectors \|\| raid_disks,
				370	"%s does not support generic reshape\n", __func__);
				371
				372	rdev_for_each(rdev, mddev)
				373	array_sectors += (rdev->sectors &
				374	~(sector_t)(mddev->chunk_sectors-1));
				375
				376	return array_sectors;
				377	}
				378
				379	static void raid0_free(struct mddev mddev, void priv);
				380
				381	static int raid0_run(struct mddev *mddev)
				382	{
				383	struct r0conf *conf;
				384	int ret;
				385
				386	if (mddev->chunk_sectors == 0) {
				387	pr_warn("md/raid0:%s: chunk size must be set.\n", mdname(mddev));
				388	return -EINVAL;
				389	}
				390	if (md_check_no_bitmap(mddev))
				391	return -EINVAL;
				392
				393	/* if private is not null, we are here after takeover */
				394	if (mddev->private == NULL) {
				395	ret = create_strip_zones(mddev, &conf);
				396	if (ret < 0)
				397	return ret;
				398	mddev->private = conf;
				399	}
				400	conf = mddev->private;
				401	if (mddev->queue) {
				402	struct md_rdev *rdev;
				403	bool discard_supported = false;
				404
				405	blk_queue_max_hw_sectors(mddev->queue, mddev->chunk_sectors);
				406	blk_queue_max_write_same_sectors(mddev->queue, mddev->chunk_sectors);
				407	blk_queue_max_write_zeroes_sectors(mddev->queue, mddev->chunk_sectors);
				408	blk_queue_max_discard_sectors(mddev->queue, UINT_MAX);
				409
				410	blk_queue_io_min(mddev->queue, mddev->chunk_sectors << 9);
				411	blk_queue_io_opt(mddev->queue,
				412	(mddev->chunk_sectors << 9) * mddev->raid_disks);
				413
				414	rdev_for_each(rdev, mddev) {
				415	disk_stack_limits(mddev->gendisk, rdev->bdev,
				416	rdev->data_offset << 9);
				417	if (blk_queue_discard(bdev_get_queue(rdev->bdev)))
				418	discard_supported = true;
				419	}
				420	if (!discard_supported)
				421	queue_flag_clear_unlocked(QUEUE_FLAG_DISCARD, mddev->queue);
				422	else
				423	queue_flag_set_unlocked(QUEUE_FLAG_DISCARD, mddev->queue);
				424	}
				425
				426	/* calculate array device size */
				427	md_set_array_sectors(mddev, raid0_size(mddev, 0, 0));
				428
				429	pr_debug("md/raid0:%s: md_size is %llu sectors.\n",
				430	mdname(mddev),
				431	(unsigned long long)mddev->array_sectors);
				432
				433	if (mddev->queue) {
				434	/* calculate the max read-ahead size.
				435	* For read-ahead of large files to be effective, we need to
				436	* readahead at least twice a whole stripe. i.e. number of devices
				437	* multiplied by chunk size times 2.
				438	* If an individual device has an ra_pages greater than the
				439	* chunk size, then we will not drive that device as hard as it
				440	* wants. We consider this a configuration error: a larger
				441	* chunksize should be used in that case.
				442	*/
				443	int stripe = mddev->raid_disks *
				444	(mddev->chunk_sectors << 9) / PAGE_SIZE;
				445	if (mddev->queue->backing_dev_info->ra_pages < 2* stripe)
				446	mddev->queue->backing_dev_info->ra_pages = 2* stripe;
				447	}
				448
				449	dump_zones(mddev);
				450
				451	ret = md_integrity_register(mddev);
				452
				453	return ret;
				454	}
				455
				456	static void raid0_free(struct mddev mddev, void priv)
				457	{
				458	struct r0conf *conf = priv;
				459
				460	kfree(conf->strip_zone);
				461	kfree(conf->devlist);
				462	kfree(conf);
				463	}
				464
				465	/*
				466	* Is io distribute over 1 or more chunks ?
				467	*/
				468	static inline int is_io_in_chunk_boundary(struct mddev *mddev,
				469	unsigned int chunk_sects, struct bio *bio)
				470	{
				471	if (likely(is_power_of_2(chunk_sects))) {
				472	return chunk_sects >=
				473	((bio->bi_iter.bi_sector & (chunk_sects-1))
				474	+ bio_sectors(bio));
				475	} else{
				476	sector_t sector = bio->bi_iter.bi_sector;
				477	return chunk_sects >= (sector_div(sector, chunk_sects)
				478	+ bio_sectors(bio));
				479	}
				480	}
				481
				482	static void raid0_handle_discard(struct mddev mddev, struct bio bio)
				483	{
				484	struct r0conf *conf = mddev->private;
				485	struct strip_zone *zone;
				486	sector_t start = bio->bi_iter.bi_sector;
				487	sector_t end;
				488	unsigned int stripe_size;
				489	sector_t first_stripe_index, last_stripe_index;
				490	sector_t start_disk_offset;
				491	unsigned int start_disk_index;
				492	sector_t end_disk_offset;
				493	unsigned int end_disk_index;
				494	unsigned int disk;
				495
				496	zone = find_zone(conf, &start);
				497
				498	if (bio_end_sector(bio) > zone->zone_end) {
				499	struct bio *split = bio_split(bio,
				500	zone->zone_end - bio->bi_iter.bi_sector, GFP_NOIO,
				501	mddev->bio_set);
				502	bio_chain(split, bio);
				503	generic_make_request(bio);
				504	bio = split;
				505	end = zone->zone_end;
				506	} else
				507	end = bio_end_sector(bio);
				508
				509	if (zone != conf->strip_zone)
				510	end = end - zone[-1].zone_end;
				511
				512	/* Now start and end is the offset in zone */
				513	stripe_size = zone->nb_dev * mddev->chunk_sectors;
				514
				515	first_stripe_index = start;
				516	sector_div(first_stripe_index, stripe_size);
				517	last_stripe_index = end;
				518	sector_div(last_stripe_index, stripe_size);
				519
				520	start_disk_index = (int)(start - first_stripe_index * stripe_size) /
				521	mddev->chunk_sectors;
				522	start_disk_offset = ((int)(start - first_stripe_index * stripe_size) %
				523	mddev->chunk_sectors) +
				524	first_stripe_index * mddev->chunk_sectors;
				525	end_disk_index = (int)(end - last_stripe_index * stripe_size) /
				526	mddev->chunk_sectors;
				527	end_disk_offset = ((int)(end - last_stripe_index * stripe_size) %
				528	mddev->chunk_sectors) +
				529	last_stripe_index * mddev->chunk_sectors;
				530
				531	for (disk = 0; disk < zone->nb_dev; disk++) {
				532	sector_t dev_start, dev_end;
				533	struct bio *discard_bio = NULL;
				534	struct md_rdev *rdev;
				535
				536	if (disk < start_disk_index)
				537	dev_start = (first_stripe_index + 1) *
				538	mddev->chunk_sectors;
				539	else if (disk > start_disk_index)
				540	dev_start = first_stripe_index * mddev->chunk_sectors;
				541	else
				542	dev_start = start_disk_offset;
				543
				544	if (disk < end_disk_index)
				545	dev_end = (last_stripe_index + 1) * mddev->chunk_sectors;
				546	else if (disk > end_disk_index)
				547	dev_end = last_stripe_index * mddev->chunk_sectors;
				548	else
				549	dev_end = end_disk_offset;
				550
				551	if (dev_end <= dev_start)
				552	continue;
				553
				554	rdev = conf->devlist[(zone - conf->strip_zone) *
				555	conf->strip_zone[0].nb_dev + disk];
				556	if (__blkdev_issue_discard(rdev->bdev,
				557	dev_start + zone->dev_start + rdev->data_offset,
				558	dev_end - dev_start, GFP_NOIO, 0, &discard_bio) \|\|
				559	!discard_bio)
				560	continue;
				561	bio_chain(discard_bio, bio);
				562	bio_clone_blkcg_association(discard_bio, bio);
				563	if (mddev->gendisk)
				564	trace_block_bio_remap(bdev_get_queue(rdev->bdev),
				565	discard_bio, disk_devt(mddev->gendisk),
				566	bio->bi_iter.bi_sector);
				567	generic_make_request(discard_bio);
				568	}
				569	bio_endio(bio);
				570	}
				571
				572	static bool raid0_make_request(struct mddev mddev, struct bio bio)
				573	{
				574	struct r0conf *conf = mddev->private;
				575	struct strip_zone *zone;
				576	struct md_rdev *tmp_dev;
				577	sector_t bio_sector;
				578	sector_t sector;
				579	sector_t orig_sector;
				580	unsigned chunk_sects;
				581	unsigned sectors;
				582
				583	if (unlikely(bio->bi_opf & REQ_PREFLUSH)) {
				584	md_flush_request(mddev, bio);
				585	return true;
				586	}
				587
				588	if (unlikely((bio_op(bio) == REQ_OP_DISCARD))) {
				589	raid0_handle_discard(mddev, bio);
				590	return true;
				591	}
				592
				593	bio_sector = bio->bi_iter.bi_sector;
				594	sector = bio_sector;
				595	chunk_sects = mddev->chunk_sectors;
				596
				597	sectors = chunk_sects -
				598	(likely(is_power_of_2(chunk_sects))
				599	? (sector & (chunk_sects-1))
				600	: sector_div(sector, chunk_sects));
				601
				602	/* Restore due to sector_div */
				603	sector = bio_sector;
				604
				605	if (sectors < bio_sectors(bio)) {
				606	struct bio *split = bio_split(bio, sectors, GFP_NOIO, mddev->bio_set);
				607	bio_chain(split, bio);
				608	generic_make_request(bio);
				609	bio = split;
				610	}
				611
				612	orig_sector = sector;
				613	zone = find_zone(mddev->private, &sector);
				614	switch (conf->layout) {
				615	case RAID0_ORIG_LAYOUT:
				616	tmp_dev = map_sector(mddev, zone, orig_sector, &sector);
				617	break;
				618	case RAID0_ALT_MULTIZONE_LAYOUT:
				619	tmp_dev = map_sector(mddev, zone, sector, &sector);
				620	break;
				621	default:
				622	WARN(1, "md/raid0:%s: Invalid layout\n", mdname(mddev));
				623	bio_io_error(bio);
				624	return true;
				625	}
				626
				627	bio_set_dev(bio, tmp_dev->bdev);
				628	bio->bi_iter.bi_sector = sector + zone->dev_start +
				629	tmp_dev->data_offset;
				630
				631	if (mddev->gendisk)
				632	trace_block_bio_remap(bio->bi_disk->queue, bio,
				633	disk_devt(mddev->gendisk), bio_sector);
				634	mddev_check_writesame(mddev, bio);
				635	mddev_check_write_zeroes(mddev, bio);
				636	generic_make_request(bio);
				637	return true;
				638	}
				639
				640	static void raid0_status(struct seq_file seq, struct mddev mddev)
				641	{
				642	seq_printf(seq, " %dk chunks", mddev->chunk_sectors / 2);
				643	return;
				644	}
				645
				646	static void raid0_takeover_raid45(struct mddev mddev)
				647	{
				648	struct md_rdev *rdev;
				649	struct r0conf *priv_conf;
				650
				651	if (mddev->degraded != 1) {
				652	pr_warn("md/raid0:%s: raid5 must be degraded! Degraded disks: %d\n",
				653	mdname(mddev),
				654	mddev->degraded);
				655	return ERR_PTR(-EINVAL);
				656	}
				657
				658	rdev_for_each(rdev, mddev) {
				659	/* check slot number for a disk */
				660	if (rdev->raid_disk == mddev->raid_disks-1) {
				661	pr_warn("md/raid0:%s: raid5 must have missing parity disk!\n",
				662	mdname(mddev));
				663	return ERR_PTR(-EINVAL);
				664	}
				665	rdev->sectors = mddev->dev_sectors;
				666	}
				667
				668	/* Set new parameters */
				669	mddev->new_level = 0;
				670	mddev->new_layout = 0;
				671	mddev->new_chunk_sectors = mddev->chunk_sectors;
				672	mddev->raid_disks--;
				673	mddev->delta_disks = -1;
				674	/* make sure it will be not marked as dirty */
				675	mddev->recovery_cp = MaxSector;
				676	mddev_clear_unsupported_flags(mddev, UNSUPPORTED_MDDEV_FLAGS);
				677
				678	create_strip_zones(mddev, &priv_conf);
				679
				680	return priv_conf;
				681	}
				682
				683	static void raid0_takeover_raid10(struct mddev mddev)
				684	{
				685	struct r0conf *priv_conf;
				686
				687	/* Check layout:
				688	* - far_copies must be 1
				689	* - near_copies must be 2
				690	* - disks number must be even
				691	* - all mirrors must be already degraded
				692	*/
				693	if (mddev->layout != ((1 << 8) + 2)) {
				694	pr_warn("md/raid0:%s:: Raid0 cannot takeover layout: 0x%x\n",
				695	mdname(mddev),
				696	mddev->layout);
				697	return ERR_PTR(-EINVAL);
				698	}
				699	if (mddev->raid_disks & 1) {
				700	pr_warn("md/raid0:%s: Raid0 cannot takeover Raid10 with odd disk number.\n",
				701	mdname(mddev));
				702	return ERR_PTR(-EINVAL);
				703	}
				704	if (mddev->degraded != (mddev->raid_disks>>1)) {
				705	pr_warn("md/raid0:%s: All mirrors must be already degraded!\n",
				706	mdname(mddev));
				707	return ERR_PTR(-EINVAL);
				708	}
				709
				710	/* Set new parameters */
				711	mddev->new_level = 0;
				712	mddev->new_layout = 0;
				713	mddev->new_chunk_sectors = mddev->chunk_sectors;
				714	mddev->delta_disks = - mddev->raid_disks / 2;
				715	mddev->raid_disks += mddev->delta_disks;
				716	mddev->degraded = 0;
				717	/* make sure it will be not marked as dirty */
				718	mddev->recovery_cp = MaxSector;
				719	mddev_clear_unsupported_flags(mddev, UNSUPPORTED_MDDEV_FLAGS);
				720
				721	create_strip_zones(mddev, &priv_conf);
				722	return priv_conf;
				723	}
				724
				725	static void raid0_takeover_raid1(struct mddev mddev)
				726	{
				727	struct r0conf *priv_conf;
				728	int chunksect;
				729
				730	/* Check layout:
				731	* - (N - 1) mirror drives must be already faulty
				732	*/
				733	if ((mddev->raid_disks - 1) != mddev->degraded) {
				734	pr_err("md/raid0:%s: (N - 1) mirrors drives must be already faulty!\n",
				735	mdname(mddev));
				736	return ERR_PTR(-EINVAL);
				737	}
				738
				739	/*
				740	* a raid1 doesn't have the notion of chunk size, so
				741	* figure out the largest suitable size we can use.
				742	*/
				743	chunksect = 64 * 2; /* 64K by default */
				744
				745	/* The array must be an exact multiple of chunksize */
				746	while (chunksect && (mddev->array_sectors & (chunksect - 1)))
				747	chunksect >>= 1;
				748
				749	if ((chunksect << 9) < PAGE_SIZE)
				750	/* array size does not allow a suitable chunk size */
				751	return ERR_PTR(-EINVAL);
				752
				753	/* Set new parameters */
				754	mddev->new_level = 0;
				755	mddev->new_layout = 0;
				756	mddev->new_chunk_sectors = chunksect;
				757	mddev->chunk_sectors = chunksect;
				758	mddev->delta_disks = 1 - mddev->raid_disks;
				759	mddev->raid_disks = 1;
				760	/* make sure it will be not marked as dirty */
				761	mddev->recovery_cp = MaxSector;
				762	mddev_clear_unsupported_flags(mddev, UNSUPPORTED_MDDEV_FLAGS);
				763
				764	create_strip_zones(mddev, &priv_conf);
				765	return priv_conf;
				766	}
				767
				768	static void raid0_takeover(struct mddev mddev)
				769	{
				770	/* raid0 can take over:
				771	* raid4 - if all data disks are active.
				772	* raid5 - providing it is Raid4 layout and one disk is faulty
				773	* raid10 - assuming we have all necessary active disks
				774	* raid1 - with (N -1) mirror drives faulty
				775	*/
				776
				777	if (mddev->bitmap) {
				778	pr_warn("md/raid0: %s: cannot takeover array with bitmap\n",
				779	mdname(mddev));
				780	return ERR_PTR(-EBUSY);
				781	}
				782	if (mddev->level == 4)
				783	return raid0_takeover_raid45(mddev);
				784
				785	if (mddev->level == 5) {
				786	if (mddev->layout == ALGORITHM_PARITY_N)
				787	return raid0_takeover_raid45(mddev);
				788
				789	pr_warn("md/raid0:%s: Raid can only takeover Raid5 with layout: %d\n",
				790	mdname(mddev), ALGORITHM_PARITY_N);
				791	}
				792
				793	if (mddev->level == 10)
				794	return raid0_takeover_raid10(mddev);
				795
				796	if (mddev->level == 1)
				797	return raid0_takeover_raid1(mddev);
				798
				799	pr_warn("Takeover from raid%i to raid0 not supported\n",
				800	mddev->level);
				801
				802	return ERR_PTR(-EINVAL);
				803	}
				804
				805	static void raid0_quiesce(struct mddev *mddev, int quiesce)
				806	{
				807	}
				808
				809	static struct md_personality raid0_personality=
				810	{
				811	.name = "raid0",
				812	.level = 0,
				813	.owner = THIS_MODULE,
				814	.make_request = raid0_make_request,
				815	.run = raid0_run,
				816	.free = raid0_free,
				817	.status = raid0_status,
				818	.size = raid0_size,
				819	.takeover = raid0_takeover,
				820	.quiesce = raid0_quiesce,
				821	.congested = raid0_congested,
				822	};
				823
				824	static int __init raid0_init (void)
				825	{
				826	return register_md_personality (&raid0_personality);
				827	}
				828
				829	static void raid0_exit (void)
				830	{
				831	unregister_md_personality (&raid0_personality);
				832	}
				833
				834	module_init(raid0_init);
				835	module_exit(raid0_exit);
				836	MODULE_LICENSE("GPL");
				837	MODULE_DESCRIPTION("RAID0 (striping) personality for MD");
				838	MODULE_ALIAS("md-personality-2"); /* RAID0 */
				839	MODULE_ALIAS("md-raid0");
				840	MODULE_ALIAS("md-level-0");