Вопрос: Фиксирование сломанного рейдового массива (Hetzner-Root-Server из Германии)


Я не знаю, почему, но мой Hetzner Root Server теряет один раз в квартал свой RAID-массив, и ситуация меняется каждый раз. На этот раз мне нужна дополнительная помощь. Может быть, они хотят, чтобы я перешел на управляемый сервер, это примерно на 40% дороже :).

EDIT: Желаемый результат:

md3 : active raid1 sda4[2] sdb4[1]
      1822442815 blocks super 1.2 [2/2] [UU]

md2 : active raid1 sda3[2] sdb3[1]
      1073740664 blocks super 1.2 [2/2] [UU]

md1 : active raid1 sda2[2] sdb2[1]
      524276 blocks super 1.2 [2/2] [UU]

md0 : active raid1 sda1[2] sdb1[1]
      33553336 blocks super 1.2 [2/2] [UU]

Как я могу исправить следующий массив рейдов?

cat /proc/mdstat

Personalities : [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] 
md124 : active (auto-read-only) raid1 sda1[2]
      33553336 blocks super 1.2 [2/1] [U_]

md125 : active (auto-read-only) raid1 sda2[2]
      524276 blocks super 1.2 [2/1] [U_]

md126 : active (auto-read-only) raid1 sda3[2]
      1073740664 blocks super 1.2 [2/1] [U_]

md127 : active (auto-read-only) raid1 sda4[2]
      1822442815 blocks super 1.2 [2/1] [U_]

md3 : active (auto-read-only) raid1 sdb4[1]
      1822442815 blocks super 1.2 [2/1] [_U]

md2 : active raid1 sdb3[1]
      1073740664 blocks super 1.2 [2/1] [_U]

md1 : active (auto-read-only) raid1 sdb2[1]
      524276 blocks super 1.2 [2/1] [_U]

md0 : active (auto-read-only) raid1 sdb1[1]
      33553336 blocks super 1.2 [2/1] [_U]

unused devices: <none>

Вот подробности:

 /dev/sda1:
          Magic : a92b4efc
        Version : 1.2
    Feature Map : 0x0
     Array UUID : 79ca4cbd:5d44fcad:01e8ed8e:0bd7009a
           Name : rescue:0
  Creation Time : Mon Aug 20 11:23:55 2012
     Raid Level : raid1
   Raid Devices : 2

 Avail Dev Size : 67106816 (32.00 GiB 34.36 GB)
     Array Size : 67106672 (32.00 GiB 34.36 GB)
  Used Dev Size : 67106672 (32.00 GiB 34.36 GB)
    Data Offset : 2048 sectors
   Super Offset : 8 sectors
          State : clean
    Device UUID : facee938:5e51285d:e49d35a7:4e3ae212

    Update Time : Sun Jan 17 02:23:41 2016
       Checksum : cf49c9d3 - correct
         Events : 504


   Device Role : Active device 0
   Array State : AA ('A' == active, '.' == missing)
/dev/sda2:
          Magic : a92b4efc
        Version : 1.2
    Feature Map : 0x0
     Array UUID : 4cdff7b7:2ec9bae4:8c9cbf02:67bfe971
           Name : rescue:1
  Creation Time : Mon Aug 20 11:23:55 2012
     Raid Level : raid1
   Raid Devices : 2

 Avail Dev Size : 1048552 (512.07 MiB 536.86 MB)
     Array Size : 1048552 (512.07 MiB 536.86 MB)
    Data Offset : 24 sectors
   Super Offset : 8 sectors
          State : clean
    Device UUID : 181560d1:abc6d39b:3bd45252:6c5bff30

    Update Time : Sat Jan 23 06:48:30 2016
       Checksum : e5f248df - correct
         Events : 2064


   Device Role : Active device 0
   Array State : AA ('A' == active, '.' == missing)
/dev/sda3:
          Magic : a92b4efc
        Version : 1.2
    Feature Map : 0x0
     Array UUID : 009a5d9b:7a0f238e:3ede62a0:0d2ee0ba
           Name : rescue:2
  Creation Time : Mon Aug 20 11:23:56 2012
     Raid Level : raid1
   Raid Devices : 2

 Avail Dev Size : 2147481600 (1024.00 GiB 1099.51 GB)
     Array Size : 2147481328 (1024.00 GiB 1099.51 GB)
  Used Dev Size : 2147481328 (1024.00 GiB 1099.51 GB)
    Data Offset : 2048 sectors
   Super Offset : 8 sectors
          State : clean
    Device UUID : 106e6b66:9365ada0:b0ee61bf:15cf9585

    Update Time : Sat Jan 23 11:20:33 2016
       Checksum : b62dfda7 - correct
         Events : 6901428


   Device Role : Active device 0
   Array State : AA ('A' == active, '.' == missing)
/dev/sda4:
          Magic : a92b4efc
        Version : 1.2
    Feature Map : 0x0
     Array UUID : aa151e0d:2430bfba:a79d7030:d56a7872
           Name : rescue:3
  Creation Time : Mon Aug 20 11:23:56 2012
     Raid Level : raid1
   Raid Devices : 2

 Avail Dev Size : 3644885903 (1738.02 GiB 1866.18 GB)
     Array Size : 3644885630 (1738.02 GiB 1866.18 GB)
  Used Dev Size : 3644885630 (1738.02 GiB 1866.18 GB)
    Data Offset : 2048 sectors
   Super Offset : 8 sectors
          State : clean
    Device UUID : 1a883ec6:768c6884:f8465824:69bddd2e

    Update Time : Sat Jan 23 06:48:30 2016
       Checksum : a114be68 - correct
         Events : 2062


   Device Role : Active device 0
   Array State : AA ('A' == active, '.' == missing)
/dev/sdb1:
          Magic : a92b4efc
        Version : 1.2
    Feature Map : 0x0
     Array UUID : 79ca4cbd:5d44fcad:01e8ed8e:0bd7009a
           Name : rescue:0
  Creation Time : Mon Aug 20 11:23:55 2012
     Raid Level : raid1
   Raid Devices : 2

 Avail Dev Size : 67106816 (32.00 GiB 34.36 GB)
     Array Size : 67106672 (32.00 GiB 34.36 GB)
  Used Dev Size : 67106672 (32.00 GiB 34.36 GB)
    Data Offset : 2048 sectors
   Super Offset : 8 sectors
          State : clean
    Device UUID : 2df660db:6eaab24e:be6a2b7e:6295cc6f

    Update Time : Sat Jan 23 11:20:53 2016
       Checksum : 9734d8ec - correct
         Events : 506


   Device Role : Active device 1
   Array State : .A ('A' == active, '.' == missing)
/dev/sdb2:
          Magic : a92b4efc
        Version : 1.2
    Feature Map : 0x0
     Array UUID : 4cdff7b7:2ec9bae4:8c9cbf02:67bfe971
           Name : rescue:1
  Creation Time : Mon Aug 20 11:23:55 2012
     Raid Level : raid1
   Raid Devices : 2

 Avail Dev Size : 1048552 (512.07 MiB 536.86 MB)
     Array Size : 1048552 (512.07 MiB 536.86 MB)
    Data Offset : 24 sectors
   Super Offset : 8 sectors
          State : clean
    Device UUID : 2594f11b:7e7289b6:8bff6aff:10bf1b05

    Update Time : Mon Jan 25 06:46:16 2016
       Checksum : cc71a538 - correct
         Events : 2078


   Device Role : Active device 1
   Array State : .A ('A' == active, '.' == missing)
/dev/sdb3:
          Magic : a92b4efc
        Version : 1.2
    Feature Map : 0x0
     Array UUID : 009a5d9b:7a0f238e:3ede62a0:0d2ee0ba
           Name : rescue:2
  Creation Time : Mon Aug 20 11:23:56 2012
     Raid Level : raid1
   Raid Devices : 2

 Avail Dev Size : 2147481600 (1024.00 GiB 1099.51 GB)
     Array Size : 2147481328 (1024.00 GiB 1099.51 GB)
  Used Dev Size : 2147481328 (1024.00 GiB 1099.51 GB)
    Data Offset : 2048 sectors
   Super Offset : 8 sectors
          State : clean
    Device UUID : b838fbbb:1dafe023:afce822f:45c7ba0d

    Update Time : Tue Jan 26 09:27:55 2016
       Checksum : 873de764 - correct
         Events : 7041530


   Device Role : Active device 1
   Array State : .A ('A' == active, '.' == missing)
/dev/sdb4:
          Magic : a92b4efc
        Version : 1.2
    Feature Map : 0x0
     Array UUID : aa151e0d:2430bfba:a79d7030:d56a7872
           Name : rescue:3
  Creation Time : Mon Aug 20 11:23:56 2012
     Raid Level : raid1
   Raid Devices : 2

 Avail Dev Size : 3644885903 (1738.02 GiB 1866.18 GB)
     Array Size : 3644885630 (1738.02 GiB 1866.18 GB)
  Used Dev Size : 3644885630 (1738.02 GiB 1866.18 GB)
    Data Offset : 2048 sectors
   Super Offset : 8 sectors
          State : clean
    Device UUID : 8e56f14c:a1478ce7:59c6ba88:09d18a60

    Update Time : Mon Jan 25 06:46:11 2016
       Checksum : 20fe7d89 - correct
         Events : 2076


   Device Role : Active device 1
   Array State : .A ('A' == active, '.' == missing)

И более подробная информация:

/dev/md0:
        Version : 1.2
  Creation Time : Mon Aug 20 11:23:55 2012
     Raid Level : raid1
     Array Size : 33553336 (32.00 GiB 34.36 GB)
  Used Dev Size : 33553336 (32.00 GiB 34.36 GB)
   Raid Devices : 2
  Total Devices : 1
    Persistence : Superblock is persistent

    Update Time : Tue Jan 26 09:38:15 2016
          State : clean, degraded
 Active Devices : 1
Working Devices : 1
 Failed Devices : 0
  Spare Devices : 0

           Name : rescue:0
           UUID : 79ca4cbd:5d44fcad:01e8ed8e:0bd7009a
         Events : 508

    Number   Major   Minor   RaidDevice State
       0       0        0        0      removed
       1       8       17        1      active sync   /dev/sdb1
/dev/md1:
        Version : 1.2
  Creation Time : Mon Aug 20 11:23:55 2012
     Raid Level : raid1
     Array Size : 524276 (512.07 MiB 536.86 MB)
  Used Dev Size : 524276 (512.07 MiB 536.86 MB)
   Raid Devices : 2
  Total Devices : 1
    Persistence : Superblock is persistent

    Update Time : Mon Jan 25 06:46:16 2016
          State : clean, degraded
 Active Devices : 1
Working Devices : 1
 Failed Devices : 0
  Spare Devices : 0

           Name : rescue:1
           UUID : 4cdff7b7:2ec9bae4:8c9cbf02:67bfe971
         Events : 2078

    Number   Major   Minor   RaidDevice State
       0       0        0        0      removed
       1       8       18        1      active sync   /dev/sdb2
/dev/md2:
        Version : 1.2
  Creation Time : Mon Aug 20 11:23:56 2012
     Raid Level : raid1
     Array Size : 1073740664 (1024.00 GiB 1099.51 GB)
  Used Dev Size : 1073740664 (1024.00 GiB 1099.51 GB)
   Raid Devices : 2
  Total Devices : 1
    Persistence : Superblock is persistent

    Update Time : Tue Jan 26 09:42:42 2016
          State : clean, degraded
 Active Devices : 1
Working Devices : 1
 Failed Devices : 0
  Spare Devices : 0

           Name : rescue:2
           UUID : 009a5d9b:7a0f238e:3ede62a0:0d2ee0ba
         Events : 7042054

    Number   Major   Minor   RaidDevice State
       0       0        0        0      removed
       1       8       19        1      active sync   /dev/sdb3
/dev/md3:
        Version : 1.2
  Creation Time : Mon Aug 20 11:23:56 2012
     Raid Level : raid1
     Array Size : 1822442815 (1738.02 GiB 1866.18 GB)
  Used Dev Size : 1822442815 (1738.02 GiB 1866.18 GB)
   Raid Devices : 2
  Total Devices : 1
    Persistence : Superblock is persistent

    Update Time : Mon Jan 25 06:46:11 2016
          State : clean, degraded
 Active Devices : 1
Working Devices : 1
 Failed Devices : 0
  Spare Devices : 0

           Name : rescue:3
           UUID : aa151e0d:2430bfba:a79d7030:d56a7872
         Events : 2076

    Number   Major   Minor   RaidDevice State
       0       0        0        0      removed
       1       8       20        1      active sync   /dev/sdb4
/dev/md124:
        Version : 1.2
  Creation Time : Mon Aug 20 11:23:55 2012
     Raid Level : raid1
     Array Size : 33553336 (32.00 GiB 34.36 GB)
  Used Dev Size : 33553336 (32.00 GiB 34.36 GB)
   Raid Devices : 2
  Total Devices : 1
    Persistence : Superblock is persistent

    Update Time : Sun Jan 17 02:23:41 2016
          State : clean, degraded
 Active Devices : 1
Working Devices : 1
 Failed Devices : 0
  Spare Devices : 0

           Name : rescue:0
           UUID : 79ca4cbd:5d44fcad:01e8ed8e:0bd7009a
         Events : 504

    Number   Major   Minor   RaidDevice State
       2       8        1        0      active sync   /dev/sda1
       1       0        0        1      removed
/dev/md125:
        Version : 1.2
  Creation Time : Mon Aug 20 11:23:55 2012
     Raid Level : raid1
     Array Size : 524276 (512.07 MiB 536.86 MB)
  Used Dev Size : 524276 (512.07 MiB 536.86 MB)
   Raid Devices : 2
  Total Devices : 1
    Persistence : Superblock is persistent

    Update Time : Sat Jan 23 06:48:30 2016
          State : clean, degraded
 Active Devices : 1
Working Devices : 1
 Failed Devices : 0
  Spare Devices : 0

           Name : rescue:1
           UUID : 4cdff7b7:2ec9bae4:8c9cbf02:67bfe971
         Events : 2064

    Number   Major   Minor   RaidDevice State
       2       8        2        0      active sync   /dev/sda2
       1       0        0        1      removed
/dev/md126:
        Version : 1.2
  Creation Time : Mon Aug 20 11:23:56 2012
     Raid Level : raid1
     Array Size : 1073740664 (1024.00 GiB 1099.51 GB)
  Used Dev Size : 1073740664 (1024.00 GiB 1099.51 GB)
   Raid Devices : 2
  Total Devices : 1
    Persistence : Superblock is persistent

    Update Time : Sat Jan 23 11:20:33 2016
          State : clean, degraded
 Active Devices : 1
Working Devices : 1
 Failed Devices : 0
  Spare Devices : 0

           Name : rescue:2
           UUID : 009a5d9b:7a0f238e:3ede62a0:0d2ee0ba
         Events : 6901428

    Number   Major   Minor   RaidDevice State
       2       8        3        0      active sync   /dev/sda3
       1       0        0        1      removed
/dev/md127:
        Version : 1.2
  Creation Time : Mon Aug 20 11:23:56 2012
     Raid Level : raid1
     Array Size : 1822442815 (1738.02 GiB 1866.18 GB)
  Used Dev Size : 1822442815 (1738.02 GiB 1866.18 GB)
   Raid Devices : 2
  Total Devices : 1
    Persistence : Superblock is persistent

    Update Time : Sat Jan 23 06:48:30 2016
          State : clean, degraded
 Active Devices : 1
Working Devices : 1
 Failed Devices : 0
  Spare Devices : 0

           Name : rescue:3
           UUID : aa151e0d:2430bfba:a79d7030:d56a7872
         Events : 2062

    Number   Major   Minor   RaidDevice State
       2       8        4        0      active sync   /dev/sda4
       1       0        0        1      removed

0
2018-01-25 21:18


Источник


В чем проблема? Какой RAID-массив вы не можете монтировать? Вы получаете сообщение об ошибке? Это похоже на то, что вам не хватает диска, что ожидается? - Claris
Благодарим вас за отзыв (первый раз). Я отредактировал вопрос и добавил желаемый (возможно, правильный) результат.
видеть: serverfault.com/questions/445315/... ... - Claris
Спасибо, но я уже это видел, это еще одна конфигурация (я думаю), и решение не объяснено достаточно ясно (чтобы узнать, какое из двух устройств имеет более свежую копию -> как?) Монтируйте их только для чтения - > как? Тогда убейте другого рейда -> как) и добавьте устройство в правильное -> как? )
Похоже, у вас есть два диска (sda и sdb), каждый из которых состоит из 4 разделов (1,2,3,4). я думать идея состоит в том, чтобы отразить эти разделы. Вместо этого у вас есть 4 раздела RAID, подключенные к разделам sda (md0, md1, md2 и md3) с удалением их зеркала. Кроме того, у вас есть 4 раздела RAID, связанные с разделами sdb (md124, md125, md126 и md127). Чтобы помочь вам, нам нужно понять: 1. Какова роль / точка монтирования каждой части (предположим: root, boot, swap, home)? И 2. как появилась эта ситуация? Например, можем ли мы предположить, что md0 и md124 имеют одинаковые данные? - agtoever


Ответы:


Элементы RAID 1 разделов на / dev / sdb являются самыми текущими, как показано здесь ...

a1
Array UUID : 79ca4cbd:5d44fcad:01e8ed8e:0bd7009a
Events : 504
Update Time : Sun Jan 17 02:23:41 2016
Device Role : Active device 0

b1
Array UUID : 79ca4cbd:5d44fcad:01e8ed8e:0bd7009a
Events : 506
Update Time : Sat Jan 23 11:20:53 2016
Device Role : Active device 1

a2
Array UUID : 4cdff7b7:2ec9bae4:8c9cbf02:67bfe971
Events : 2064
Update Time : Sat Jan 23 06:48:30 2016
Device Role : Active device 0

b2
Array UUID : 4cdff7b7:2ec9bae4:8c9cbf02:67bfe971
Events : 2078
Update Time : Mon Jan 25 06:46:16 2016
Device Role : Active device 1

a3
Array UUID : 009a5d9b:7a0f238e:3ede62a0:0d2ee0ba
Events : 6901428
Update Time : Sat Jan 23 11:20:33 2016
Device Role : Active device 0

b3
Array UUID : 009a5d9b:7a0f238e:3ede62a0:0d2ee0ba
Events : 7041530
Update Time : Tue Jan 26 09:27:55 2016
Device Role : Active device 1

a4
Array UUID : aa151e0d:2430bfba:a79d7030:d56a7872
Events : 2062
Update Time : Sat Jan 23 06:48:30 2016
Device Role : Active device 0

b4
Array UUID : aa151e0d:2430bfba:a79d7030:d56a7872
Events : 2076
Update Time : Mon Jan 25 06:46:11 2016
Device Role : Active device 1

Итак, чтобы достичь желаемого результата, сначала остановите ложные массивы md12X ....

mdadm --stop /dev/md124
mdadm --stop /dev/md125
mdadm --stop /dev/md126
mdadm --stop /dev/md127

Затем просто добавьте каждый удаленный раздел раздела RAID обратно в исходный RAID1

mdadm --add /dev/md0 /dev/sda1
mdadm --add /dev/md1 /dev/sda2
mdadm --add /dev/md2 /dev/sda3
mdadm --add /dev/md3 /dev/sda4

0
2018-01-31 17:16



Я думаю, что произошло то, что в какой-то момент mdadm не мог видеть sda, поэтому он удалил все разделы RAID-члена 0. Затем, когда mdadm видит, что sda появляется снова, он создает массивы md12X с внесинхронными секциями sda. Итак, вопрос в том, почему mdadam порой не видит sda? Возможна проблема с питанием, проблема с кабелем или проблема с диском. Проверьте состояние SMART на дисках. - S.Haran
Я инициирую это, спасибо вам большое.
Произошел сбой md2 : active raid1 sda3[2](F) sdb3[1] 1073740664 blocks super 1.2 [2/1] [_U] как я могу это исправить? Еще раз спасибо ..
Я подозреваю, что у вас проблемы с / dev / sda. Исправление будет похоже на последний раз, но, конечно, покажет вывод ... cat / proc / mdstat - S.Haran