Blame - marvell/linux/drivers/md/raid0.c - T108

blob: 7f80e86459b19db7f1e9b846d66cfba508ce4a41 [file] [log] [blame]

b.liu	e958203	2025-04-17 19:18:16 +0800	[diff] [blame^]	1	// SPDX-License-Identifier: GPL-2.0-or-later
				2	/*
				3	raid0.c : Multiple Devices driver for Linux
				4	Copyright (C) 1994-96 Marc ZYNGIER
				5	<zyngier@ufr-info-p7.ibp.fr> or
				6	<maz@gloups.fdn.fr>
				7	Copyright (C) 1999, 2000 Ingo Molnar, Red Hat
				8
				9	RAID-0 management functions.
				10
				11	*/
				12
				13	#include <linux/blkdev.h>
				14	#include <linux/seq_file.h>
				15	#include <linux/module.h>
				16	#include <linux/slab.h>
				17	#include <trace/events/block.h>
				18	#include "md.h"
				19	#include "raid0.h"
				20	#include "raid5.h"
				21
				22	static int default_layout = 0;
				23	module_param(default_layout, int, 0644);
				24
				25	#define UNSUPPORTED_MDDEV_FLAGS \
				26	((1L << MD_HAS_JOURNAL) \| \
				27	(1L << MD_JOURNAL_CLEAN) \| \
				28	(1L << MD_FAILFAST_SUPPORTED) \|\
				29	(1L << MD_HAS_PPL) \| \
				30	(1L << MD_HAS_MULTIPLE_PPLS))
				31
				32	static int raid0_congested(struct mddev *mddev, int bits)
				33	{
				34	struct r0conf *conf = mddev->private;
				35	struct md_rdev **devlist = conf->devlist;
				36	int raid_disks = conf->strip_zone[0].nb_dev;
				37	int i, ret = 0;
				38
				39	for (i = 0; i < raid_disks && !ret ; i++) {
				40	struct request_queue *q = bdev_get_queue(devlist[i]->bdev);
				41
				42	ret \|= bdi_congested(q->backing_dev_info, bits);
				43	}
				44	return ret;
				45	}
				46
				47	/*
				48	* inform the user of the raid configuration
				49	*/
				50	static void dump_zones(struct mddev *mddev)
				51	{
				52	int j, k;
				53	sector_t zone_size = 0;
				54	sector_t zone_start = 0;
				55	char b[BDEVNAME_SIZE];
				56	struct r0conf *conf = mddev->private;
				57	int raid_disks = conf->strip_zone[0].nb_dev;
				58	pr_debug("md: RAID0 configuration for %s - %d zone%s\n",
				59	mdname(mddev),
				60	conf->nr_strip_zones, conf->nr_strip_zones==1?"":"s");
				61	for (j = 0; j < conf->nr_strip_zones; j++) {
				62	char line[200];
				63	int len = 0;
				64
				65	for (k = 0; k < conf->strip_zone[j].nb_dev; k++)
				66	len += scnprintf(line+len, 200-len, "%s%s", k?"/":"",
				67	bdevname(conf->devlist[j*raid_disks
				68	+ k]->bdev, b));
				69	pr_debug("md: zone%d=[%s]\n", j, line);
				70
				71	zone_size = conf->strip_zone[j].zone_end - zone_start;
				72	pr_debug(" zone-offset=%10lluKB, device-offset=%10lluKB, size=%10lluKB\n",
				73	(unsigned long long)zone_start>>1,
				74	(unsigned long long)conf->strip_zone[j].dev_start>>1,
				75	(unsigned long long)zone_size>>1);
				76	zone_start = conf->strip_zone[j].zone_end;
				77	}
				78	}
				79
				80	static int create_strip_zones(struct mddev mddev, struct r0conf *private_conf)
				81	{
				82	int i, c, err;
				83	sector_t curr_zone_end, sectors;
				84	struct md_rdev smallest, rdev1, rdev2, rdev, **dev;
				85	struct strip_zone *zone;
				86	int cnt;
				87	char b[BDEVNAME_SIZE];
				88	char b2[BDEVNAME_SIZE];
				89	struct r0conf conf = kzalloc(sizeof(conf), GFP_KERNEL);
				90	unsigned blksize = 512;
				91
				92	*private_conf = ERR_PTR(-ENOMEM);
				93	if (!conf)
				94	return -ENOMEM;
				95	rdev_for_each(rdev1, mddev) {
				96	pr_debug("md/raid0:%s: looking at %s\n",
				97	mdname(mddev),
				98	bdevname(rdev1->bdev, b));
				99	c = 0;
				100
				101	/* round size to chunk_size */
				102	sectors = rdev1->sectors;
				103	sector_div(sectors, mddev->chunk_sectors);
				104	rdev1->sectors = sectors * mddev->chunk_sectors;
				105
				106	blksize = max(blksize, queue_logical_block_size(
				107	rdev1->bdev->bd_disk->queue));
				108
				109	rdev_for_each(rdev2, mddev) {
				110	pr_debug("md/raid0:%s: comparing %s(%llu)"
				111	" with %s(%llu)\n",
				112	mdname(mddev),
				113	bdevname(rdev1->bdev,b),
				114	(unsigned long long)rdev1->sectors,
				115	bdevname(rdev2->bdev,b2),
				116	(unsigned long long)rdev2->sectors);
				117	if (rdev2 == rdev1) {
				118	pr_debug("md/raid0:%s: END\n",
				119	mdname(mddev));
				120	break;
				121	}
				122	if (rdev2->sectors == rdev1->sectors) {
				123	/*
				124	* Not unique, don't count it as a new
				125	* group
				126	*/
				127	pr_debug("md/raid0:%s: EQUAL\n",
				128	mdname(mddev));
				129	c = 1;
				130	break;
				131	}
				132	pr_debug("md/raid0:%s: NOT EQUAL\n",
				133	mdname(mddev));
				134	}
				135	if (!c) {
				136	pr_debug("md/raid0:%s: ==> UNIQUE\n",
				137	mdname(mddev));
				138	conf->nr_strip_zones++;
				139	pr_debug("md/raid0:%s: %d zones\n",
				140	mdname(mddev), conf->nr_strip_zones);
				141	}
				142	}
				143	pr_debug("md/raid0:%s: FINAL %d zones\n",
				144	mdname(mddev), conf->nr_strip_zones);
				145
				146	/*
				147	* now since we have the hard sector sizes, we can make sure
				148	* chunk size is a multiple of that sector size
				149	*/
				150	if ((mddev->chunk_sectors << 9) % blksize) {
				151	pr_warn("md/raid0:%s: chunk_size of %d not multiple of block size %d\n",
				152	mdname(mddev),
				153	mddev->chunk_sectors << 9, blksize);
				154	err = -EINVAL;
				155	goto abort;
				156	}
				157
				158	err = -ENOMEM;
				159	conf->strip_zone = kcalloc(conf->nr_strip_zones,
				160	sizeof(struct strip_zone),
				161	GFP_KERNEL);
				162	if (!conf->strip_zone)
				163	goto abort;
				164	conf->devlist = kzalloc(array3_size(sizeof(struct md_rdev *),
				165	conf->nr_strip_zones,
				166	mddev->raid_disks),
				167	GFP_KERNEL);
				168	if (!conf->devlist)
				169	goto abort;
				170
				171	/* The first zone must contain all devices, so here we check that
				172	* there is a proper alignment of slots to devices and find them all
				173	*/
				174	zone = &conf->strip_zone[0];
				175	cnt = 0;
				176	smallest = NULL;
				177	dev = conf->devlist;
				178	err = -EINVAL;
				179	rdev_for_each(rdev1, mddev) {
				180	int j = rdev1->raid_disk;
				181
				182	if (mddev->level == 10) {
				183	/* taking over a raid10-n2 array */
				184	j /= 2;
				185	rdev1->new_raid_disk = j;
				186	}
				187
				188	if (mddev->level == 1) {
				189	/* taiking over a raid1 array-
				190	* we have only one active disk
				191	*/
				192	j = 0;
				193	rdev1->new_raid_disk = j;
				194	}
				195
				196	if (j < 0) {
				197	pr_warn("md/raid0:%s: remove inactive devices before converting to RAID0\n",
				198	mdname(mddev));
				199	goto abort;
				200	}
				201	if (j >= mddev->raid_disks) {
				202	pr_warn("md/raid0:%s: bad disk number %d - aborting!\n",
				203	mdname(mddev), j);
				204	goto abort;
				205	}
				206	if (dev[j]) {
				207	pr_warn("md/raid0:%s: multiple devices for %d - aborting!\n",
				208	mdname(mddev), j);
				209	goto abort;
				210	}
				211	dev[j] = rdev1;
				212
				213	if (!smallest \|\| (rdev1->sectors < smallest->sectors))
				214	smallest = rdev1;
				215	cnt++;
				216	}
				217	if (cnt != mddev->raid_disks) {
				218	pr_warn("md/raid0:%s: too few disks (%d of %d) - aborting!\n",
				219	mdname(mddev), cnt, mddev->raid_disks);
				220	goto abort;
				221	}
				222	zone->nb_dev = cnt;
				223	zone->zone_end = smallest->sectors * cnt;
				224
				225	curr_zone_end = zone->zone_end;
				226
				227	/* now do the other zones */
				228	for (i = 1; i < conf->nr_strip_zones; i++)
				229	{
				230	int j;
				231
				232	zone = conf->strip_zone + i;
				233	dev = conf->devlist + i * mddev->raid_disks;
				234
				235	pr_debug("md/raid0:%s: zone %d\n", mdname(mddev), i);
				236	zone->dev_start = smallest->sectors;
				237	smallest = NULL;
				238	c = 0;
				239
				240	for (j=0; j<cnt; j++) {
				241	rdev = conf->devlist[j];
				242	if (rdev->sectors <= zone->dev_start) {
				243	pr_debug("md/raid0:%s: checking %s ... nope\n",
				244	mdname(mddev),
				245	bdevname(rdev->bdev, b));
				246	continue;
				247	}
				248	pr_debug("md/raid0:%s: checking %s ..."
				249	" contained as device %d\n",
				250	mdname(mddev),
				251	bdevname(rdev->bdev, b), c);
				252	dev[c] = rdev;
				253	c++;
				254	if (!smallest \|\| rdev->sectors < smallest->sectors) {
				255	smallest = rdev;
				256	pr_debug("md/raid0:%s: (%llu) is smallest!.\n",
				257	mdname(mddev),
				258	(unsigned long long)rdev->sectors);
				259	}
				260	}
				261
				262	zone->nb_dev = c;
				263	sectors = (smallest->sectors - zone->dev_start) * c;
				264	pr_debug("md/raid0:%s: zone->nb_dev: %d, sectors: %llu\n",
				265	mdname(mddev),
				266	zone->nb_dev, (unsigned long long)sectors);
				267
				268	curr_zone_end += sectors;
				269	zone->zone_end = curr_zone_end;
				270
				271	pr_debug("md/raid0:%s: current zone start: %llu\n",
				272	mdname(mddev),
				273	(unsigned long long)smallest->sectors);
				274	}
				275
				276	if (conf->nr_strip_zones == 1 \|\| conf->strip_zone[1].nb_dev == 1) {
				277	conf->layout = RAID0_ORIG_LAYOUT;
				278	} else if (mddev->layout == RAID0_ORIG_LAYOUT \|\|
				279	mddev->layout == RAID0_ALT_MULTIZONE_LAYOUT) {
				280	conf->layout = mddev->layout;
				281	} else if (default_layout == RAID0_ORIG_LAYOUT \|\|
				282	default_layout == RAID0_ALT_MULTIZONE_LAYOUT) {
				283	conf->layout = default_layout;
				284	} else {
				285	pr_err("md/raid0:%s: cannot assemble multi-zone RAID0 with default_layout setting\n",
				286	mdname(mddev));
				287	pr_err("md/raid0: please set raid0.default_layout to 1 or 2\n");
				288	err = -EOPNOTSUPP;
				289	goto abort;
				290	}
				291
				292	if (conf->layout == RAID0_ORIG_LAYOUT) {
				293	for (i = 1; i < conf->nr_strip_zones; i++) {
				294	sector_t first_sector = conf->strip_zone[i-1].zone_end;
				295
				296	sector_div(first_sector, mddev->chunk_sectors);
				297	zone = conf->strip_zone + i;
				298	/* disk_shift is first disk index used in the zone */
				299	zone->disk_shift = sector_div(first_sector,
				300	zone->nb_dev);
				301	}
				302	}
				303
				304	pr_debug("md/raid0:%s: done.\n", mdname(mddev));
				305	*private_conf = conf;
				306
				307	return 0;
				308	abort:
				309	kfree(conf->strip_zone);
				310	kfree(conf->devlist);
				311	kfree(conf);
				312	*private_conf = ERR_PTR(err);
				313	return err;
				314	}
				315
				316	/* Find the zone which holds a particular offset
				317	* Update *sectorp to be an offset in that zone
				318	*/
				319	static struct strip_zone find_zone(struct r0conf conf,
				320	sector_t *sectorp)
				321	{
				322	int i;
				323	struct strip_zone *z = conf->strip_zone;
				324	sector_t sector = *sectorp;
				325
				326	for (i = 0; i < conf->nr_strip_zones; i++)
				327	if (sector < z[i].zone_end) {
				328	if (i)
				329	*sectorp = sector - z[i-1].zone_end;
				330	return z + i;
				331	}
				332	BUG();
				333	}
				334
				335	/*
				336	* remaps the bio to the target device. we separate two flows.
				337	* power 2 flow and a general flow for the sake of performance
				338	*/
				339	static struct md_rdev map_sector(struct mddev mddev, struct strip_zone *zone,
				340	sector_t sector, sector_t *sector_offset)
				341	{
				342	unsigned int sect_in_chunk;
				343	sector_t chunk;
				344	struct r0conf *conf = mddev->private;
				345	int raid_disks = conf->strip_zone[0].nb_dev;
				346	unsigned int chunk_sects = mddev->chunk_sectors;
				347
				348	if (is_power_of_2(chunk_sects)) {
				349	int chunksect_bits = ffz(~chunk_sects);
				350	/* find the sector offset inside the chunk */
				351	sect_in_chunk = sector & (chunk_sects - 1);
				352	sector >>= chunksect_bits;
				353	/* chunk in zone */
				354	chunk = *sector_offset;
				355	/* quotient is the chunk in real device*/
				356	sector_div(chunk, zone->nb_dev << chunksect_bits);
				357	} else{
				358	sect_in_chunk = sector_div(sector, chunk_sects);
				359	chunk = *sector_offset;
				360	sector_div(chunk, chunk_sects * zone->nb_dev);
				361	}
				362	/*
				363	* position the bio over the real device
				364	* real sector = chunk in device + starting of zone
				365	* + the position in the chunk
				366	*/
				367	sector_offset = (chunk chunk_sects) + sect_in_chunk;
				368	return conf->devlist[(zone - conf->strip_zone)*raid_disks
				369	+ sector_div(sector, zone->nb_dev)];
				370	}
				371
				372	static sector_t raid0_size(struct mddev *mddev, sector_t sectors, int raid_disks)
				373	{
				374	sector_t array_sectors = 0;
				375	struct md_rdev *rdev;
				376
				377	WARN_ONCE(sectors \|\| raid_disks,
				378	"%s does not support generic reshape\n", __func__);
				379
				380	rdev_for_each(rdev, mddev)
				381	array_sectors += (rdev->sectors &
				382	~(sector_t)(mddev->chunk_sectors-1));
				383
				384	return array_sectors;
				385	}
				386
				387	static void raid0_free(struct mddev mddev, void priv);
				388
				389	static int raid0_run(struct mddev *mddev)
				390	{
				391	struct r0conf *conf;
				392	int ret;
				393
				394	if (mddev->chunk_sectors == 0) {
				395	pr_warn("md/raid0:%s: chunk size must be set.\n", mdname(mddev));
				396	return -EINVAL;
				397	}
				398	if (md_check_no_bitmap(mddev))
				399	return -EINVAL;
				400
				401	/* if private is not null, we are here after takeover */
				402	if (mddev->private == NULL) {
				403	ret = create_strip_zones(mddev, &conf);
				404	if (ret < 0)
				405	return ret;
				406	mddev->private = conf;
				407	}
				408	conf = mddev->private;
				409	if (mddev->queue) {
				410	struct md_rdev *rdev;
				411	bool discard_supported = false;
				412
				413	blk_queue_max_hw_sectors(mddev->queue, mddev->chunk_sectors);
				414	blk_queue_max_write_same_sectors(mddev->queue, mddev->chunk_sectors);
				415	blk_queue_max_write_zeroes_sectors(mddev->queue, mddev->chunk_sectors);
				416	blk_queue_max_discard_sectors(mddev->queue, UINT_MAX);
				417
				418	blk_queue_io_min(mddev->queue, mddev->chunk_sectors << 9);
				419	blk_queue_io_opt(mddev->queue,
				420	(mddev->chunk_sectors << 9) * mddev->raid_disks);
				421
				422	rdev_for_each(rdev, mddev) {
				423	disk_stack_limits(mddev->gendisk, rdev->bdev,
				424	rdev->data_offset << 9);
				425	if (blk_queue_discard(bdev_get_queue(rdev->bdev)))
				426	discard_supported = true;
				427	}
				428	if (!discard_supported)
				429	blk_queue_flag_clear(QUEUE_FLAG_DISCARD, mddev->queue);
				430	else
				431	blk_queue_flag_set(QUEUE_FLAG_DISCARD, mddev->queue);
				432	}
				433
				434	/* calculate array device size */
				435	md_set_array_sectors(mddev, raid0_size(mddev, 0, 0));
				436
				437	pr_debug("md/raid0:%s: md_size is %llu sectors.\n",
				438	mdname(mddev),
				439	(unsigned long long)mddev->array_sectors);
				440
				441	if (mddev->queue) {
				442	/* calculate the max read-ahead size.
				443	* For read-ahead of large files to be effective, we need to
				444	* readahead at least twice a whole stripe. i.e. number of devices
				445	* multiplied by chunk size times 2.
				446	* If an individual device has an ra_pages greater than the
				447	* chunk size, then we will not drive that device as hard as it
				448	* wants. We consider this a configuration error: a larger
				449	* chunksize should be used in that case.
				450	*/
				451	int stripe = mddev->raid_disks *
				452	(mddev->chunk_sectors << 9) / PAGE_SIZE;
				453	if (mddev->queue->backing_dev_info->ra_pages < 2* stripe)
				454	mddev->queue->backing_dev_info->ra_pages = 2* stripe;
				455	}
				456
				457	dump_zones(mddev);
				458
				459	ret = md_integrity_register(mddev);
				460
				461	return ret;
				462	}
				463
				464	static void raid0_free(struct mddev mddev, void priv)
				465	{
				466	struct r0conf *conf = priv;
				467
				468	kfree(conf->strip_zone);
				469	kfree(conf->devlist);
				470	kfree(conf);
				471	}
				472
				473	/*
				474	* Is io distribute over 1 or more chunks ?
				475	*/
				476	static inline int is_io_in_chunk_boundary(struct mddev *mddev,
				477	unsigned int chunk_sects, struct bio *bio)
				478	{
				479	if (likely(is_power_of_2(chunk_sects))) {
				480	return chunk_sects >=
				481	((bio->bi_iter.bi_sector & (chunk_sects-1))
				482	+ bio_sectors(bio));
				483	} else{
				484	sector_t sector = bio->bi_iter.bi_sector;
				485	return chunk_sects >= (sector_div(sector, chunk_sects)
				486	+ bio_sectors(bio));
				487	}
				488	}
				489
				490	/*
				491	* Convert disk_index to the disk order in which it is read/written.
				492	* For example, if we have 4 disks, they are numbered 0,1,2,3. If we
				493	* write the disks starting at disk 3, then the read/write order would
				494	* be disk 3, then 0, then 1, and then disk 2 and we want map_disk_shift()
				495	* to map the disks as follows 0,1,2,3 => 1,2,3,0. So disk 0 would map
				496	* to 1, 1 to 2, 2 to 3, and 3 to 0. That way we can compare disks in
				497	* that 'output' space to understand the read/write disk ordering.
				498	*/
				499	static int map_disk_shift(int disk_index, int num_disks, int disk_shift)
				500	{
				501	return ((disk_index + num_disks - disk_shift) % num_disks);
				502	}
				503
				504	static void raid0_handle_discard(struct mddev mddev, struct bio bio)
				505	{
				506	struct r0conf *conf = mddev->private;
				507	struct strip_zone *zone;
				508	sector_t start = bio->bi_iter.bi_sector;
				509	sector_t end;
				510	unsigned int stripe_size;
				511	sector_t first_stripe_index, last_stripe_index;
				512	sector_t start_disk_offset;
				513	unsigned int start_disk_index;
				514	sector_t end_disk_offset;
				515	unsigned int end_disk_index;
				516	unsigned int disk;
				517	sector_t orig_start, orig_end;
				518
				519	orig_start = start;
				520	zone = find_zone(conf, &start);
				521
				522	if (bio_end_sector(bio) > zone->zone_end) {
				523	struct bio *split = bio_split(bio,
				524	zone->zone_end - bio->bi_iter.bi_sector, GFP_NOIO,
				525	&mddev->bio_set);
				526	bio_chain(split, bio);
				527	generic_make_request(bio);
				528	bio = split;
				529	end = zone->zone_end;
				530	} else
				531	end = bio_end_sector(bio);
				532
				533	orig_end = end;
				534	if (zone != conf->strip_zone)
				535	end = end - zone[-1].zone_end;
				536
				537	/* Now start and end is the offset in zone */
				538	stripe_size = zone->nb_dev * mddev->chunk_sectors;
				539
				540	first_stripe_index = start;
				541	sector_div(first_stripe_index, stripe_size);
				542	last_stripe_index = end;
				543	sector_div(last_stripe_index, stripe_size);
				544
				545	/* In the first zone the original and alternate layouts are the same */
				546	if ((conf->layout == RAID0_ORIG_LAYOUT) && (zone != conf->strip_zone)) {
				547	sector_div(orig_start, mddev->chunk_sectors);
				548	start_disk_index = sector_div(orig_start, zone->nb_dev);
				549	start_disk_index = map_disk_shift(start_disk_index,
				550	zone->nb_dev,
				551	zone->disk_shift);
				552	sector_div(orig_end, mddev->chunk_sectors);
				553	end_disk_index = sector_div(orig_end, zone->nb_dev);
				554	end_disk_index = map_disk_shift(end_disk_index,
				555	zone->nb_dev, zone->disk_shift);
				556	} else {
				557	start_disk_index = (int)(start - first_stripe_index * stripe_size) /
				558	mddev->chunk_sectors;
				559	end_disk_index = (int)(end - last_stripe_index * stripe_size) /
				560	mddev->chunk_sectors;
				561	}
				562	start_disk_offset = ((int)(start - first_stripe_index * stripe_size) %
				563	mddev->chunk_sectors) +
				564	first_stripe_index * mddev->chunk_sectors;
				565	end_disk_offset = ((int)(end - last_stripe_index * stripe_size) %
				566	mddev->chunk_sectors) +
				567	last_stripe_index * mddev->chunk_sectors;
				568
				569	for (disk = 0; disk < zone->nb_dev; disk++) {
				570	sector_t dev_start, dev_end;
				571	struct bio *discard_bio = NULL;
				572	struct md_rdev *rdev;
				573	int compare_disk;
				574
				575	compare_disk = map_disk_shift(disk, zone->nb_dev,
				576	zone->disk_shift);
				577
				578	if (compare_disk < start_disk_index)
				579	dev_start = (first_stripe_index + 1) *
				580	mddev->chunk_sectors;
				581	else if (compare_disk > start_disk_index)
				582	dev_start = first_stripe_index * mddev->chunk_sectors;
				583	else
				584	dev_start = start_disk_offset;
				585
				586	if (compare_disk < end_disk_index)
				587	dev_end = (last_stripe_index + 1) * mddev->chunk_sectors;
				588	else if (compare_disk > end_disk_index)
				589	dev_end = last_stripe_index * mddev->chunk_sectors;
				590	else
				591	dev_end = end_disk_offset;
				592
				593	if (dev_end <= dev_start)
				594	continue;
				595
				596	rdev = conf->devlist[(zone - conf->strip_zone) *
				597	conf->strip_zone[0].nb_dev + disk];
				598	if (__blkdev_issue_discard(rdev->bdev,
				599	dev_start + zone->dev_start + rdev->data_offset,
				600	dev_end - dev_start, GFP_NOIO, 0, &discard_bio) \|\|
				601	!discard_bio)
				602	continue;
				603	bio_chain(discard_bio, bio);
				604	bio_clone_blkg_association(discard_bio, bio);
				605	if (mddev->gendisk)
				606	trace_block_bio_remap(bdev_get_queue(rdev->bdev),
				607	discard_bio, disk_devt(mddev->gendisk),
				608	bio->bi_iter.bi_sector);
				609	generic_make_request(discard_bio);
				610	}
				611	bio_endio(bio);
				612	}
				613
				614	static bool raid0_make_request(struct mddev mddev, struct bio bio)
				615	{
				616	struct r0conf *conf = mddev->private;
				617	struct strip_zone *zone;
				618	struct md_rdev *tmp_dev;
				619	sector_t bio_sector;
				620	sector_t sector;
				621	sector_t orig_sector;
				622	unsigned chunk_sects;
				623	unsigned sectors;
				624
				625	if (unlikely(bio->bi_opf & REQ_PREFLUSH)
				626	&& md_flush_request(mddev, bio))
				627	return true;
				628
				629	if (unlikely((bio_op(bio) == REQ_OP_DISCARD))) {
				630	raid0_handle_discard(mddev, bio);
				631	return true;
				632	}
				633
				634	bio_sector = bio->bi_iter.bi_sector;
				635	sector = bio_sector;
				636	chunk_sects = mddev->chunk_sectors;
				637
				638	sectors = chunk_sects -
				639	(likely(is_power_of_2(chunk_sects))
				640	? (sector & (chunk_sects-1))
				641	: sector_div(sector, chunk_sects));
				642
				643	/* Restore due to sector_div */
				644	sector = bio_sector;
				645
				646	if (sectors < bio_sectors(bio)) {
				647	struct bio *split = bio_split(bio, sectors, GFP_NOIO,
				648	&mddev->bio_set);
				649	bio_chain(split, bio);
				650	generic_make_request(bio);
				651	bio = split;
				652	}
				653
				654	orig_sector = sector;
				655	zone = find_zone(mddev->private, &sector);
				656	switch (conf->layout) {
				657	case RAID0_ORIG_LAYOUT:
				658	tmp_dev = map_sector(mddev, zone, orig_sector, &sector);
				659	break;
				660	case RAID0_ALT_MULTIZONE_LAYOUT:
				661	tmp_dev = map_sector(mddev, zone, sector, &sector);
				662	break;
				663	default:
				664	WARN(1, "md/raid0:%s: Invalid layout\n", mdname(mddev));
				665	bio_io_error(bio);
				666	return true;
				667	}
				668
				669	if (unlikely(is_mddev_broken(tmp_dev, "raid0"))) {
				670	bio_io_error(bio);
				671	return true;
				672	}
				673
				674	bio_set_dev(bio, tmp_dev->bdev);
				675	bio->bi_iter.bi_sector = sector + zone->dev_start +
				676	tmp_dev->data_offset;
				677
				678	if (mddev->gendisk)
				679	trace_block_bio_remap(bio->bi_disk->queue, bio,
				680	disk_devt(mddev->gendisk), bio_sector);
				681	mddev_check_writesame(mddev, bio);
				682	mddev_check_write_zeroes(mddev, bio);
				683	generic_make_request(bio);
				684	return true;
				685	}
				686
				687	static void raid0_status(struct seq_file seq, struct mddev mddev)
				688	{
				689	seq_printf(seq, " %dk chunks", mddev->chunk_sectors / 2);
				690	return;
				691	}
				692
				693	static void raid0_takeover_raid45(struct mddev mddev)
				694	{
				695	struct md_rdev *rdev;
				696	struct r0conf *priv_conf;
				697
				698	if (mddev->degraded != 1) {
				699	pr_warn("md/raid0:%s: raid5 must be degraded! Degraded disks: %d\n",
				700	mdname(mddev),
				701	mddev->degraded);
				702	return ERR_PTR(-EINVAL);
				703	}
				704
				705	rdev_for_each(rdev, mddev) {
				706	/* check slot number for a disk */
				707	if (rdev->raid_disk == mddev->raid_disks-1) {
				708	pr_warn("md/raid0:%s: raid5 must have missing parity disk!\n",
				709	mdname(mddev));
				710	return ERR_PTR(-EINVAL);
				711	}
				712	rdev->sectors = mddev->dev_sectors;
				713	}
				714
				715	/* Set new parameters */
				716	mddev->new_level = 0;
				717	mddev->new_layout = 0;
				718	mddev->new_chunk_sectors = mddev->chunk_sectors;
				719	mddev->raid_disks--;
				720	mddev->delta_disks = -1;
				721	/* make sure it will be not marked as dirty */
				722	mddev->recovery_cp = MaxSector;
				723	mddev_clear_unsupported_flags(mddev, UNSUPPORTED_MDDEV_FLAGS);
				724
				725	create_strip_zones(mddev, &priv_conf);
				726
				727	return priv_conf;
				728	}
				729
				730	static void raid0_takeover_raid10(struct mddev mddev)
				731	{
				732	struct r0conf *priv_conf;
				733
				734	/* Check layout:
				735	* - far_copies must be 1
				736	* - near_copies must be 2
				737	* - disks number must be even
				738	* - all mirrors must be already degraded
				739	*/
				740	if (mddev->layout != ((1 << 8) + 2)) {
				741	pr_warn("md/raid0:%s:: Raid0 cannot takeover layout: 0x%x\n",
				742	mdname(mddev),
				743	mddev->layout);
				744	return ERR_PTR(-EINVAL);
				745	}
				746	if (mddev->raid_disks & 1) {
				747	pr_warn("md/raid0:%s: Raid0 cannot takeover Raid10 with odd disk number.\n",
				748	mdname(mddev));
				749	return ERR_PTR(-EINVAL);
				750	}
				751	if (mddev->degraded != (mddev->raid_disks>>1)) {
				752	pr_warn("md/raid0:%s: All mirrors must be already degraded!\n",
				753	mdname(mddev));
				754	return ERR_PTR(-EINVAL);
				755	}
				756
				757	/* Set new parameters */
				758	mddev->new_level = 0;
				759	mddev->new_layout = 0;
				760	mddev->new_chunk_sectors = mddev->chunk_sectors;
				761	mddev->delta_disks = - mddev->raid_disks / 2;
				762	mddev->raid_disks += mddev->delta_disks;
				763	mddev->degraded = 0;
				764	/* make sure it will be not marked as dirty */
				765	mddev->recovery_cp = MaxSector;
				766	mddev_clear_unsupported_flags(mddev, UNSUPPORTED_MDDEV_FLAGS);
				767
				768	create_strip_zones(mddev, &priv_conf);
				769	return priv_conf;
				770	}
				771
				772	static void raid0_takeover_raid1(struct mddev mddev)
				773	{
				774	struct r0conf *priv_conf;
				775	int chunksect;
				776
				777	/* Check layout:
				778	* - (N - 1) mirror drives must be already faulty
				779	*/
				780	if ((mddev->raid_disks - 1) != mddev->degraded) {
				781	pr_err("md/raid0:%s: (N - 1) mirrors drives must be already faulty!\n",
				782	mdname(mddev));
				783	return ERR_PTR(-EINVAL);
				784	}
				785
				786	/*
				787	* a raid1 doesn't have the notion of chunk size, so
				788	* figure out the largest suitable size we can use.
				789	*/
				790	chunksect = 64 * 2; /* 64K by default */
				791
				792	/* The array must be an exact multiple of chunksize */
				793	while (chunksect && (mddev->array_sectors & (chunksect - 1)))
				794	chunksect >>= 1;
				795
				796	if ((chunksect << 9) < PAGE_SIZE)
				797	/* array size does not allow a suitable chunk size */
				798	return ERR_PTR(-EINVAL);
				799
				800	/* Set new parameters */
				801	mddev->new_level = 0;
				802	mddev->new_layout = 0;
				803	mddev->new_chunk_sectors = chunksect;
				804	mddev->chunk_sectors = chunksect;
				805	mddev->delta_disks = 1 - mddev->raid_disks;
				806	mddev->raid_disks = 1;
				807	/* make sure it will be not marked as dirty */
				808	mddev->recovery_cp = MaxSector;
				809	mddev_clear_unsupported_flags(mddev, UNSUPPORTED_MDDEV_FLAGS);
				810
				811	create_strip_zones(mddev, &priv_conf);
				812	return priv_conf;
				813	}
				814
				815	static void raid0_takeover(struct mddev mddev)
				816	{
				817	/* raid0 can take over:
				818	* raid4 - if all data disks are active.
				819	* raid5 - providing it is Raid4 layout and one disk is faulty
				820	* raid10 - assuming we have all necessary active disks
				821	* raid1 - with (N -1) mirror drives faulty
				822	*/
				823
				824	if (mddev->bitmap) {
				825	pr_warn("md/raid0: %s: cannot takeover array with bitmap\n",
				826	mdname(mddev));
				827	return ERR_PTR(-EBUSY);
				828	}
				829	if (mddev->level == 4)
				830	return raid0_takeover_raid45(mddev);
				831
				832	if (mddev->level == 5) {
				833	if (mddev->layout == ALGORITHM_PARITY_N)
				834	return raid0_takeover_raid45(mddev);
				835
				836	pr_warn("md/raid0:%s: Raid can only takeover Raid5 with layout: %d\n",
				837	mdname(mddev), ALGORITHM_PARITY_N);
				838	}
				839
				840	if (mddev->level == 10)
				841	return raid0_takeover_raid10(mddev);
				842
				843	if (mddev->level == 1)
				844	return raid0_takeover_raid1(mddev);
				845
				846	pr_warn("Takeover from raid%i to raid0 not supported\n",
				847	mddev->level);
				848
				849	return ERR_PTR(-EINVAL);
				850	}
				851
				852	static void raid0_quiesce(struct mddev *mddev, int quiesce)
				853	{
				854	}
				855
				856	static struct md_personality raid0_personality=
				857	{
				858	.name = "raid0",
				859	.level = 0,
				860	.owner = THIS_MODULE,
				861	.make_request = raid0_make_request,
				862	.run = raid0_run,
				863	.free = raid0_free,
				864	.status = raid0_status,
				865	.size = raid0_size,
				866	.takeover = raid0_takeover,
				867	.quiesce = raid0_quiesce,
				868	.congested = raid0_congested,
				869	};
				870
				871	static int __init raid0_init (void)
				872	{
				873	return register_md_personality (&raid0_personality);
				874	}
				875
				876	static void raid0_exit (void)
				877	{
				878	unregister_md_personality (&raid0_personality);
				879	}
				880
				881	module_init(raid0_init);
				882	module_exit(raid0_exit);
				883	MODULE_LICENSE("GPL");
				884	MODULE_DESCRIPTION("RAID0 (striping) personality for MD");
				885	MODULE_ALIAS("md-personality-2"); /* RAID0 */
				886	MODULE_ALIAS("md-raid0");
				887	MODULE_ALIAS("md-level-0");