]> git.hungrycats.org Git - linux/commitdiff
Updated state model for SCSI devices
authorJames Bottomley <jejb@raven.il.steeleye.com>
Sat, 22 Nov 2003 12:21:22 +0000 (06:21 -0600)
committerJames Bottomley <jejb@mulgrave.(none)>
Sat, 22 Nov 2003 12:21:22 +0000 (06:21 -0600)
I've been looking at enforcing lifetime phases for SCSI devices
(primarily to try to get the mid layer to offload as much of the device
creation and hotplug pieces as it can).

I've hijacked the sdev_state field of the struct scsi_device (formerly
this was a bitmap, now it becomes an enumerated state).

I've also begun adding references sdev_gendev into the code to pin the
scsi_device---initially in the queue function, but possibly this should
also be done in the scsi_command_get/put, the idea being to prevent
scsi_device freeing while there's still device activity.

The object phases I identified are:

1. SDEV_CREATED - we've just allocated the device.  It may respond to
internally generated commands, but not to user ones (the user should
actually have no way to access a device in this state, but just in
case).

2. SDEV_RUNNING - the device is fully operational

3. SDEV_CANCEL - The device is cleanly shutting down.  It may respond to
internally generated commands (for cancellation/recovery) only; all user
commands are errored unless they have already been queued (QUEUE_FULL
handling and the like).

4. SDEV_DEL - The device is gone. *all* commands are errored out.

Ordinarily, the device should move through all four phases from creation
to destruction, but moving SDEV_RUNNING->SDEV_DEL because of surprise
ejection should work.

It's starting to look like the online flag should be absorbed into this
(offlined devices move essentially to SDEV_CANCEL and could be
reactivated by moving to SDEV_RUNNING).

I haven't altered the similar bitmap model that scsi_host has, although
this too should probably move to an enumerated state model.

I've tested this by physically yanking a module out from underneath a
running filesystem with no ill effects (other than a slew of I/O
errors).

The obvious problem is that this kills possible user error handling, but
we don't do any of that yet.

drivers/scsi/scsi.c
drivers/scsi/scsi_lib.c
drivers/scsi/scsi_scan.c
drivers/scsi/scsi_sysfs.c
include/scsi/scsi_device.h

index 5f3e89aa403fb4d1f12d9d50d8122f911519b378..fc4f6f34a9232c1b76f0f81159cc348710c827df 100644 (file)
@@ -367,6 +367,16 @@ int scsi_dispatch_cmd(struct scsi_cmnd *cmd)
        unsigned long timeout;
        int rtn = 0;
 
+       /* check if the device is still usable */
+       if (unlikely(cmd->device->sdev_state == SDEV_DEL)) {
+               /* in SDEV_DEL we error all commands. DID_NO_CONNECT
+                * returns an immediate error upwards, and signals
+                * that the device is no longer present */
+               cmd->result = DID_NO_CONNECT << 16;
+               scsi_done(cmd);
+               /* return 0 (because the command has been processed) */
+               goto out;
+       }
        /* Assign a unique nonzero serial_number. */
        /* XXX(hch): this is racy */
        if (++serial_number == 0)
@@ -893,7 +903,7 @@ int scsi_track_queue_full(struct scsi_device *sdev, int depth)
  */
 int scsi_device_get(struct scsi_device *sdev)
 {
-       if (test_bit(SDEV_DEL, &sdev->sdev_state))
+       if (sdev->sdev_state == SDEV_DEL)
                return -ENXIO;
        if (!get_device(&sdev->sdev_gendev))
                return -ENXIO;
@@ -1015,7 +1025,7 @@ int scsi_device_cancel(struct scsi_device *sdev, int recovery)
        struct list_head *lh, *lh_sf;
        unsigned long flags;
 
-       set_bit(SDEV_CANCEL, &sdev->sdev_state);
+       sdev->sdev_state = SDEV_CANCEL;
 
        spin_lock_irqsave(&sdev->list_lock, flags);
        list_for_each_entry(scmd, &sdev->cmd_list, list) {
index eda915b3dccf9b078bed6b4accae836e199fd9df..feec3908fac1f412ff3656cece0b7c83d456d3eb 100644 (file)
@@ -923,6 +923,22 @@ static int scsi_prep_fn(struct request_queue *q, struct request *req)
 {
        struct scsi_device *sdev = q->queuedata;
        struct scsi_cmnd *cmd;
+       int specials_only = 0;
+
+       if(unlikely(sdev->sdev_state != SDEV_RUNNING)) {
+               /* OK, we're not in a running state don't prep
+                * user commands */
+               if(sdev->sdev_state == SDEV_DEL) {
+                       /* Device is fully deleted, no commands
+                        * at all allowed down */
+                       printk(KERN_ERR "scsi%d (%d:%d): rejecting I/O to dead device\n",
+                              sdev->host->host_no, sdev->id, sdev->lun);
+                       return BLKPREP_KILL;
+               }
+               /* OK, we only allow special commands (i.e. not
+                * user initiated ones */
+               specials_only = 1;
+       }
 
        /*
         * Find the actual device driver associated with this command.
@@ -945,6 +961,14 @@ static int scsi_prep_fn(struct request_queue *q, struct request *req)
                } else
                        cmd = req->special;
        } else if (req->flags & (REQ_CMD | REQ_BLOCK_PC)) {
+
+               if(unlikely(specials_only)) {
+                       printk(KERN_ERR "scsi%d (%d:%d): rejecting I/O to device being removed\n",
+                              sdev->host->host_no, sdev->id, sdev->lun);
+                       return BLKPREP_KILL;
+               }
+                       
+                       
                /*
                 * Just check to see if the device is online.  If
                 * it isn't, we refuse to process ordinary commands
@@ -1127,6 +1151,10 @@ static void scsi_request_fn(struct request_queue *q)
        struct scsi_cmnd *cmd;
        struct request *req;
 
+       if(!get_device(&sdev->sdev_gendev))
+               /* We must be tearing the block queue down already */
+               return;
+
        /*
         * To start with, we keep looping until the queue is empty, or until
         * the host is no longer able to accept any more requests.
@@ -1199,7 +1227,7 @@ static void scsi_request_fn(struct request_queue *q)
                }
        }
 
-       return;
+       goto out;
 
  not_ready:
        spin_unlock_irq(shost->host_lock);
@@ -1217,6 +1245,12 @@ static void scsi_request_fn(struct request_queue *q)
        sdev->device_busy--;
        if(sdev->device_busy == 0)
                blk_plug_device(q);
+ out:
+       /* must be careful here...if we trigger the ->remove() function
+        * we cannot be holding the q lock */
+       spin_unlock_irq(q->queue_lock);
+       put_device(&sdev->sdev_gendev);
+       spin_lock_irq(q->queue_lock);
 }
 
 u64 scsi_calculate_bounce_limit(struct Scsi_Host *shost)
index b19652f9344597a71350a84ddc75fdff90cc5394..6896e1b6ecfbff31956ddc00a47dcc61fc635bc7 100644 (file)
@@ -205,6 +205,7 @@ static struct scsi_device *scsi_alloc_sdev(struct Scsi_Host *shost,
        sdev->lun = lun;
        sdev->channel = channel;
        sdev->online = TRUE;
+       sdev->sdev_state = SDEV_CREATED;
        INIT_LIST_HEAD(&sdev->siblings);
        INIT_LIST_HEAD(&sdev->same_target_siblings);
        INIT_LIST_HEAD(&sdev->cmd_list);
index 0684bbda096e14d80bc3c724f868173cc28ce8b9..13ce9ea629d4dce982fb8a37f9c53f860700c796 100644 (file)
@@ -346,9 +346,11 @@ int scsi_sysfs_add_sdev(struct scsi_device *sdev)
 {
        int error = -EINVAL, i;
 
-       if (test_and_set_bit(SDEV_ADD, &sdev->sdev_state))
+       if (sdev->sdev_state != SDEV_CREATED)
                return error;
 
+       sdev->sdev_state = SDEV_RUNNING;
+
        error = device_add(&sdev->sdev_gendev);
        if (error) {
                printk(KERN_INFO "error 1\n");
@@ -386,8 +388,11 @@ int scsi_sysfs_add_sdev(struct scsi_device *sdev)
        return error;
 
 clean_device:
+       sdev->sdev_state = SDEV_CANCEL;
+
        device_del(&sdev->sdev_gendev);
        put_device(&sdev->sdev_gendev);
+
        return error;
 
 }
@@ -398,8 +403,8 @@ clean_device:
  **/
 void scsi_remove_device(struct scsi_device *sdev)
 {
-       if (test_and_clear_bit(SDEV_ADD, &sdev->sdev_state)) {
-               set_bit(SDEV_DEL, &sdev->sdev_state);
+       if (sdev->sdev_state == SDEV_RUNNING || sdev->sdev_state == SDEV_CANCEL) {
+               sdev->sdev_state = SDEV_DEL;
                class_device_unregister(&sdev->sdev_classdev);
                device_del(&sdev->sdev_gendev);
                if (sdev->host->hostt->slave_destroy)
index 63e6f16e76e57c7bc8c70308af50aa3dbd7736af..87efd277a1c0be7340c3f4a84f2c0a7dc75835fb 100644 (file)
@@ -14,11 +14,15 @@ struct scsi_mode_data;
 /*
  * sdev state
  */
-enum {
-       SDEV_ADD,
-       SDEV_DEL,
-       SDEV_CANCEL,
-       SDEV_RECOVERY,
+enum scsi_device_state {
+       SDEV_CREATED,           /* device created but not added to sysfs
+                                * Only internal commands allowed (for inq) */
+       SDEV_RUNNING,           /* device properly configured
+                                * All commands allowed */
+       SDEV_CANCEL,            /* beginning to delete device
+                                * Only error handler commands allowed */
+       SDEV_DEL,               /* device deleted 
+                                * no commands allowed */
 };
 
 struct scsi_device {
@@ -99,7 +103,7 @@ struct scsi_device {
        struct device           sdev_gendev;
        struct class_device     sdev_classdev;
 
-       unsigned long sdev_state;
+       enum scsi_device_state sdev_state;
 };
 #define        to_scsi_device(d)       \
        container_of(d, struct scsi_device, sdev_gendev)