Имя: Пароль:
IT
Админ
SSD M.2 Шрёдингера
,
0 ig0z
 
03.10.23
13:14
На новый сервер Администраторы установили и настроили ОС + MS SQL 2022 (почему не 2019 сказали что он лучше больше функционала для настройки и пофиг что 1С пока не поддерживает его официально)

сервер физический (MS server 2012 R2): 1й рейд (Операционка) + 10й рейд (SQL BD) + SSD M2 (TempDB + Журнал) + жесткий для резервных копий

настроил TempDB на SSD M2 + перенёс туда журналы  регистрации, сервисные файлы, кэшы, индексы и прочее, так же настроил туда файл подкачки (потом отключил)

Развернул копию базы, выполнил перепровердение, регламентные операции на MS SQL (реструктуризация, индексация, обновление статистики, резервные копии и т.д), пересчитал итоги, тестовую нагрузку, в течении недели нагружал 1C и перезагружал сервер

НО после одной из перезагрузок пропала SSD M.2 ни в устройствах ни в Управлении жестких дисках его не было, перезагружал ещё несколько раз, не появлялся, обратился к админам.
Администраторы зашли в биос, сначала не нашли, а потом узнали куда смотреть и увидели его, перезагрузили и SSD M2 появилась, и все взлетело, теперь кидают мне претензию что я что-то настроил и он пропал, т.е по их словам ОС его почему-то отфутболила, а оптом видимо передумала (почему и что не известно)

в ошибках ОС одна ошибка сопряженная с моментом исчезновения SSD M2 "Драйвер обнаружил ошибку контроллера \Device\RaidPort1" - но SSD M2 воткнута в материнскую плату, причем тут RAID Port? - на что Администраторы сказали что это к исчезновению не относится.
А так же ошибки программ пытающиеся запуститься и им нахватает файлов которые лежат на данном диске и уходят в ошибки

Куда ещё посмотреть и копнуть? Теперь не могу с эмулировать исчезновение SSD M2

Samsung Magician и Crystal Disk Info говорит что живая, кто с таким сталкивался? и куда копнуть?
1 ig0z
 
03.10.23
13:19
Администраторы в BIOS ничего не меняли, зашли увидели, не сохраняя настройки, перезагрузили
2 mikecool
 
03.10.23
13:22
а у тебя хватает прав на настройку жестких дисков?
3 ig0z
 
03.10.23
13:25
Админский пользователь

Главная проблема в том что данный сервер уедет в ЦОД, где более не будет нам доступен физический! Только регламентное обслуживание раз в год либо замена рейд батареи
4 ig0z
 
03.10.23
13:33
и тишина ...
5 Garykom
 
гуру
03.10.23
13:39
ssd помирает, бывает
поменяй на новый
6 Garykom
 
гуру
03.10.23
13:40
и да выбор операционки и софта слегка странный
для сервера 1С сейчас стандарт линукс и постгре
7 Garykom
 
гуру
03.10.23
13:41
а не винда 2012 древняя с новым скулем 2022

нахрена 10 рейд для ssd? или вы там 10й на hdd подняли?
для ssd достаточно raid 1
8 ig0z
 
03.10.23
13:48
(7) на SAS под базу для ssd достаточно raid 1 это под операционку
9 ig0z
 
03.10.23
13:52
(7) Ааааа нет, не SAS-кие, там 10 рейд из SSD
10 Chai Nic
 
03.10.23
13:54
(3) "Главная проблема в том что данный сервер уедет в ЦОД, где более не будет нам доступен физический"
Тогда ставьте ip-kvm с управлением питанием.
11 ig0z
 
03.10.23
13:57
(10) не будет
12 d4rkmesa
 
03.10.23
14:02
(0) А почему это ваша проблема, вы администратор 1С ?
13 Chai Nic
 
03.10.23
14:08
(11) Тогда сервер должен быть виртуальным на надежном гипервизоре..
14 Волшебник
 
03.10.23
14:11
(0) Вы разместили tempDB на M2-диске, который перегрелся. Скорее всего он дешёвый китайский и не предназначен для серверного использования
15 ig0z
 
03.10.23
14:12
(14)SSD M2 1Tb Samsung 990 PRO
16 ig0z
 
03.10.23
14:14
(14) БЛИН первый же отзыв на citilink:

"Недостатки:
отваливается от системы и пока не выключишь и не включишь обратно комп - не появляется в системе. Читайте комментарии."
17 d4rkmesa
 
03.10.23
14:16
(14) По словам админов, перегрев сейчас - обычное дело даже для брендовых ssd.
18 ig0z
 
03.10.23
14:24
Всем спасибо)
19 RomanYS
 
03.10.23
14:24
(17) брендовый <> серверный
20 ansh15
 
03.10.23
14:30
https://3dnews.ru/1081903/samsung-990-pro-new-firmware
Надо же..
Купите что-нибудь другое
21 Волшебник
 
03.10.23
14:38
(15) это не серверный
22 Волшебник
 
03.10.23
14:48
23 Волшебник
 
03.10.23
14:50
(22)+ Но даже среди них есть такие: "Для сервера баз данных: Не подходит"
Так что ищите лучше
24 arsik
 
гуру
03.10.23
15:06
(23) Они там все "Для сервера баз данных - Не подходит"
25 ig0z
 
03.10.23
15:11
Благодарю все, Ещё вопрос при переносе TempdDB и 1С туда журнала регистрации, сервисных файлов, кэша, индекса и прочего на быструю SSD не в рейде и её отказе службы ложатся и не поднимутся, без вмешательства, то зачем её не на рейд ставить? или я отстал от жизни? там как-то можно подстраховаться?
26 katamoto
 
03.10.23
15:15
Журнал транзакций сиквела на одиночном диске? Рисковый вы человек
27 Chai Nic
 
03.10.23
15:16
(25) Дублированием страхуйтесь. Ставьте в райд1 сразу много. Разных производителей. Что-нибудь да выживет.
28 ig0z
 
03.10.23
15:20
(26) нет, TEMPDB представляет собой системную базу данных Microsoft SQL Server, в которой хранятся временные таблицы созданные как самим сервером, так и пользователями. Эта база данных создается заново при каждом перезапуске Microsoft SQL Server.
29 katamoto
 
03.10.23
15:50
(28) В первом сообщении же сказано, что база на рейде, а журнал и темпбд на m2. Ну да ладно, наверное я не так понял
30 Волшебник
 
03.10.23
16:36
(24) Значит надо сбросить некоторые фильтры.
31 Волшебник
 
03.10.23
16:38
(28) в TEMPDB идёт большой поток данных НА ЗАПИСЬ. Если разместить эту базу на NVME, который перегревается, да ещё не снабжён отдельным вентилятором и радиатором, то будет плохо, ну как в сабже
32 Волшебник
 
03.10.23
16:38
NVME-диски больше для геймеров. Они хорошо переносят быстрое чтение, загрузку текстур, танчиков... Для серверов это всё не годится.
33 Волшебник
 
03.10.23
17:06
NVME-диск на сервере может содержать хост-систему, чтобы она быстро загружалась. Хотя зачем ему быстро загружаться, если он не выключается?

Может там расположить файлы веб-сервера? Да, наверное, хотя они все кэшируются в памяти на всех уровнях.

Что же разместить на NVME-диске сервера? Да нахер он нужен!
34 ptiz
 
03.10.23
17:14
(0) "кидают мне претензию что я что-то настроил" - пусть скажут, что именно ты не так настроил.
Радиатор хоть поставили на этот SSD ?
35 ptiz
 
03.10.23
17:15
(0) А вообще после пункта "1С пока не поддерживает его официально" - надо умывать руки. Пусть ставят то, что поддерживается официально платформой.
36 Jackman
 
03.10.23
17:15
(0) SSD M2 с радиаторами? Если диск постоянно под нагрузкой, идет с ним интенсивная работа, то будет сильно нагреваться, под сотню градусов и выше. Может контроллер от перегрева дал сбой.
37 Garykom
 
гуру
05.10.23
21:32
(32) (33) Нет.
NVMe диски нужны для кэширования.
Конечно идеально все на них сделать но это дорого, поэтому придумали
https://learn.microsoft.com/en-us/windows-server/storage/storage-spaces/storage-spaces-storage-bus-cache

Причем кэширование может быть двухуровневное HDD - SSD - NVMe
Лично я юзаю это в Windows 10 и оно прекрасно, особенно как для NTFS стало доступным а не только для ReFS
Только чтобы как кэш врубить (в Win10) приходится юзать
https://github.com/freemansoft/win10-storage-spaces скрипт
38 Garykom
 
гуру
03.10.23
21:48
(37)+ Причем никакие аппаратные RAID нафик не нужны
Windows Server сама все сделает на программном уровне с резервированием нужного числа дисков
39 Злопчинский
 
03.10.23
22:04
(37) ссылка на гитхаб - 404
40 Волшебник
 
04.10.23
10:54
(37) Кэширование означает "один раз записал и много раз читаешь". Да, так можно.
А вот tempDB на них размещать нельзя
41 Garikk
 
04.10.23
12:05
(36) под сотню градусов? так можно? это выглядит максимально неадекватно
42 Волшебник
 
04.10.23
12:34
(41) Там же написано, что так нельзя
43 dali
 
04.10.23
13:19
(36) Да не греются они настолько. Но троттлинг никто не отменял.
44 dali
 
04.10.23
13:26
И радиатор конечно нужен.
(0) Надеюсь, ты не весь объем диска разметил?
Если используешь обычный диск в качестве серверного, главное не размечать весь объем, как минимум треть диска оставить не размеченным, это твой overprovision, иначе сдохнет он быстро.
45 dali
 
04.10.23
13:35
я бы думал в сторону перегрева, поставь что-нибудь для мониторинга температуры, понаблюдай
46 Djelf
 
04.10.23
14:35
(45) Он же сервер пытается приручить, а админы накосчили, не осилили держать темперурный режим в норме.
Купили кто? Админы!
Но виноват, как обычно 1С~ник, "Это его код в 1С вырубает винт", и это всегда весело.
47 Волшебник
 
04.10.23
14:36
(46) Тут 1С-ник взялся настраивать tempDB сервера, по сути стал админом
48 Praktik
 
05.10.23
11:47
(0) Не слушайте про перегрев и т.п глупости.
Вам, как и мне не повезло с SSD Samsung 990/980 Pro на платформе Intel.

В начале 2023 г. мы купили 3 шт с внештатными радиаторами для платы на Z790 c Windows 2019. Зная про ошибки в прошивке - сразу обновили на новейшие.
1 SSD - система
2 SSD- база
3 SSD- TempDB

Через неделю, в ПРОЦЕССЕ работы, стали исчезать SSD (после ребут не видны в биосе).
Благо быстро сообразили - обесточить корпус. Диски появились и работали до следующего отвала через 3 недели. Иногда пропадали после ребутов.

Ха. Заменили на Samsung 980 Pro и ... Тоже самое..
49 Волшебник
 
05.10.23
11:51
(48) У Вас тоже перегрелись
50 Praktik
 
05.10.23
11:55
(49) Без нагрузки. В помещении + 18 град. С такими радиаторами https://www.onlinetrade.ru/catalogue/aksessuary_dlya_moddinga_pk-c3952/id_cooling/radiator_dlya_ssd_id_cooling_zero_m15_m.2_2280-3349861.html
51 Волшебник
 
05.10.23
11:59
(50) Да, бывает. Перегрелись и точка.
52 Волшебник
 
05.10.23
12:00
Может админ решил помайнить крипту... Всякое бывает
53 GlRoznica
 
05.10.23
12:06
(50) И что? Кто вам сказал, что радиатор что то может сделать? Сони5 специально новый корпус разработали чисто для охлаждения М2. Только активное охлаждение и то, по тестам снижает температуру нагрева всего процентов на 10-15.
54 Djelf
 
05.10.23
13:48
Перегрев можно легко проверить и поймать непрерывным мониторингом smart и записью в лог. Стресс-тесты тоже никто не отменял...
На 3dnews есть обзор, там тестировали 990й, он в стресс-тесте, на смешаной нагрузке, через пару минут по smart нагревался до 83 градусов, а дальше троттлил и температура выше не поднималась.
Предел по паспорту 85 градусов, видимо и при 90 не зависнет...
Но у (0) зависание произошло при перезагрузке, сомневаюсь что именно в этот момент происходил стресс-тест.
Видимо что-то еще происходит.
Но раз так, то это сочетание материнки, проца и этого nvme привода лучше не использовать, даже если пройдут все тесты.
55 Garykom
 
гуру
05.10.23
20:39
(39) пробел забыл убрать
https://github.com/freemansoft/win10-storage-spaces