Имя: Пароль:
IT
 
Нужна консультация эбаут ProxMox VE
,
0 live in sky dreams
 
27.06.14
10:48
Предыстория.

Хост-машина: Debian 6, аптайм уже пару лет.
Установлен ProxMox
Гостевухи:
1) WinServer 2008 r2 Std в роли терминал-сервера (обычный аптайм - пару тройку месяцев)
2) WinServer 2008 r2 Std в роли SQL Сервера (обычный аптайм - с пол года)
3) Debian 6 в роли Web-сервера
4) FTP сервер из OpenVZ

С завидной периодичностью умирают загрузчики на Win тачках. Каждый раз, перегружая машину ожидаю, что она не загрузится. Собсно часто это и происходит. Сразу же после ребута загружается режим восстановления. Без альтернативы.

В первый раз удалось восстановить из командной строки установочного диска Windows.
Во второй и третий раз нет.
Вчера вот снова умер, да и в добавок еще вирт. машина из резервной копии не развернулась. Заново все устанавливаю.

Хочу:
1) Понять почему умирают загрузчики;
2) Возможно ли пофиксить, если да, то как;
3) Возможно ли бэкапить и ресторить загрузчик стандартными средствами Windows;
4) Почему не развернулся бэкап виртуалки;

По первому вопросу вводная такая:
При Попытке RebuildBCD - ответ "Элемент не найден"
по четвертому вопросу:

progress 31% (read 39943208960 bytes, duration 1337 sec)

** (process:911905): ERROR **: restore failed - bdrv_write to drive-sata0 failed (-28)
/bin/bash: line 1: 911904 Broken pipe             lzop -d -c /data/backups/dump/vzdump-qemu-100-2013_11_08-14_23_24.vma.lzo
     911905 Trace/breakpoint trap   | vma extract -v -r /var/tmp/vzdumptmp911902.fifo - /var/tmp/vzdumptmp911902
temporary volume 'backups:100/vm-100-disk-3.qcow2' sucessfuly removed
temporary volume 'backups:100/vm-100-disk-2.qcow2' sucessfuly removed
TASK ERROR: command 'lzop -d -c /data/backups/dump/vzdump-qemu-100-2013_11_08-14_23_24.vma.lzo|vma extract -v -r /var/tmp/vzdumptmp911902.fifo - /var/tmp/vzdumptmp911902' failed: exit code 133
1 Biker
 
27.06.14
11:08
(0)  bdrv_write to drive-sata0 failed (-28)

SMART смотрел ? похоже что диск сыпется
2 live in sky dreams
 
27.06.14
11:27
Во как.. хм..
неа, не сотрел
3 live in sky dreams
 
27.06.14
11:28
гляну, спасибо. Возможно это как раз причина вылета загрузчика
4 live in sky dreams
 
27.06.14
12:10
Прогнал "легонько" и вот что вылезло.

smartctl -l selftest /dev/sdb
smartctl 5.41 2011-06-09 r3365 [x86_64-linux-2.6.32-23-pve] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed: read failure       80%     24337         1034609372
# 2  Extended offline    Completed without error       00%      7202         -
# 3  Extended offline    Completed without error       00%      5542         -
# 4  Extended offline    Completed without error       00%      2334         -
# 5  Extended offline    Completed without error       00%      2302         -


Это все, похоже. Диску не один год был еще до меня.
5 live in sky dreams
 
27.06.14
12:18
судя по
smartctl -A /dev/sdb
smartctl 5.41 2011-06-09 r3365 [x86_64-linux-2.6.32-23-pve] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   093   092   006    Pre-fail  Always       -       100172791
  3 Spin_Up_Time            0x0003   095   095   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       30
  5 Reallocated_Sector_Ct   0x0033   098   098   036    Pre-fail  Always       -       122
  7 Seek_Error_Rate         0x000f   082   060   030    Pre-fail  Always       -       180445927
  9 Power_On_Hours          0x0032   073   073   000    Old_age   Always       -       24337
10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       15
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   001   001   000    Old_age   Always       -       239
188 Command_Timeout         0x0032   100   047   000    Old_age   Always       -       77
189 High_Fly_Writes         0x003a   099   099   000    Old_age   Always       -       1
190 Airflow_Temperature_Cel 0x0022   059   055   045    Old_age   Always       -       41 (Min/Max 35/45)
194 Temperature_Celsius     0x0022   041   045   000    Old_age   Always       -       41 (0 21 0 0)
195 Hardware_ECC_Recovered  0x001a   043   031   000    Old_age   Always       -       100172791
197 Current_Pending_Sector  0x0012   097   097   000    Old_age   Always       -       155
198 Offline_Uncorrectable   0x0010   097   097   000    Old_age   Offline      -       155
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       93754841128760
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       1421853788
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       1450172287

диску почти 3 года. Уже срок наверное.
Буду составлять заявку.

Рейд софтовый, как мне обезопасить себя от фейла после замены?
Какие шаги предпринять перед заменой и после?
6 live in sky dreams
 
27.06.14
12:32
Кто нибудь (((
Не оставляйте меня одного в глубокой печали (( Тут холодно, сыро и воняет переустановкой всего ((
7 Biker
 
27.06.14
12:42
а второй диск покаж
8 1Сукпун
 
27.06.14
12:54
возьми   внешний  usb   диск  , на него   можешь  clonzil ой  сделать образы  твоей  хостовой  машины  , это так  на всякий  случай .  потом  можно  на  тот  же  диск   когда  примаунтишь  сделать   архивы    виртуалок  
Ну а потом  можно уже  пробовать менять  диски и  включать  их в  рейд .
9 live in sky dreams
 
27.06.14
13:24
(7)
Второй еще старее
smartctl -A /dev/sda
smartctl 5.41 2011-06-09 r3365 [x86_64-linux-2.6.32-23-pve] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   100   100   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0007   071   071   011    Pre-fail  Always       -       9350
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       22
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   100   100   051    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0025   100   100   015    Pre-fail  Offline      -       12052
  9 Power_On_Hours          0x0032   092   092   000    Old_age   Always       -       40255
10 Spin_Retry_Count        0x0033   100   100   051    Pre-fail  Always       -       0
11 Calibration_Retry_Count 0x0012   100   100   000    Old_age   Always       -       0
12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       22
13 Read_Soft_Error_Rate    0x000e   100   100   000    Old_age   Always       -       0
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0033   100   100   000    Pre-fail  Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   059   057   000    Old_age   Always       -       41 (Min/Max 17/41)
194 Temperature_Celsius     0x0022   058   055   000    Old_age   Always       -       42 (0 5 47 17)
195 Hardware_ECC_Recovered  0x001a   100   100   000    Old_age   Always       -       160697549
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   100   100   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x000a   100   100   000    Old_age   Always       -       0
201 Soft_Read_Error_Rate    0x000a   100   100   000    Old_age   Always       -       0

==========================================================

Но пока без ошибок, хотя глубокую проверку еще не проводил, по легкой проверке вот:
smartctl -l selftest /dev/sda
smartctl 5.41 2011-06-09 r3365 [x86_64-linux-2.6.32-23-pve] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%     40253         -
# 2  Extended offline    Completed without error       00%     33163         -
# 3  Extended offline    Completed without error       00%     32251         -
10 live in sky dreams
 
27.06.14
13:33
(8)Это дедик, подключить внешний хард денег стоит немалых.
У меня есть 100 гигов для бэкапа (тачка в той же "локалке")
маловато конечно, но пока что больше не требовалось. Все важные бакапы (БД, доки и пр) сливал по инету к себе и чистил место. Расширить не вопрос, тоже платно, но по цене гораздо дешевле, чем внешний хард.
Бакапы виртуалок да, хранил на том же железе, что и рабочие тачки, каюсь, кидайте камни.. Все понял, осознал.
Возможно ли бэкапнуть как то средствами самого дебиана тачку в каталог по сети, а в дальнейшем ее развернуть средствами того же дебиана?
11 Biker
 
27.06.14
14:36
(10) sda имхо еще жив
если бы был lvm, то снапшот без проблем,
а так, на рабочей тачке, клона не сделать, хотя клонезилла может и может как-то, я с ней не работал или можно поотключать машинки и через rsync.
И вообще, если это дедик напрягай поддержку хостера - железо то их.
12 live in sky dreams
 
28.06.14
22:05
Итак, перегрузил машину и она не включается.
Grub: file not found

Что делать?
Сейчас загрузился с liveCd
Кaк может человек ожидaть, что его мольбaм о снисхождении ответит тот, кто превыше, когдa сaм он откaзывaет в милосердии тем, кто ниже его? Петр Трубецкой