?

Log in

No account? Create an account
 
 
17 June 2014 @ 09:42 pm
LanmanServer впадает в задумчивость  
Мы тут столкнулись с одной проблемой:
Есть сервер с установленной на него Windows 2012 R2 Standard. На нём с невыявленной периодичностью встаёт раком служба "LanmanServer".
Внешне это выглядит следующим образом. На сервере есть N-ное количество расшаренных папок. (DFS не используется)
В одной из таких папок установлен "Коснультант+" (если это важно). Несколько дней всё работает без проблем.
Потом расшаренные папки по сети начинают открываться, простите за мой французский, с пердежом и рвотой. Листинг файлов и директорий выдается по нескольку минут. Копирование, если вообще удаётся его стартовать, идёт со скоростью нескольких килобайт в секунду. При этом загрузка процессора на сервере остается низкой, никаких проблем с железом выявлено не было.
В итоге заходишь в консоль сервера, перезапускаешь руками пресловутую LanmanServer, в результате чего всё снова взвивается ракетой. Ещё на несколько дней. До наступления следующего тупняка.
В логах смотрел, ничего интересного либо подозрительного там нет.
Вопрос к залу. Как вообще можно продиагностировать проблему? Как понять кто, как и при каких обстоятельствах ставит в столь интимную позу сервер? Куда смотреть, что искать?

UPD: Спасибо за дельные советы! Будем пробовать.
 
 
 
sishsish on June 17th, 2014 06:11 pm (UTC)
Консультант и гадит скорее всего. Поэтому он у нас ребутился еженощно.
khanidkhanid on June 17th, 2014 06:43 pm (UTC)
Не думаю. У меня 3 сервера с консультантом. 2 из них ребутаются раз в месяц стабильно (по накату обновлений). 1 как получится (обычно чаще из-за того, что в проблемном по питанию месте стоит). Проблем за всё время не возникало (самому старому (а он на 2003 виндах) уже лет 8, если не больше, я тогда ещё даже не работал, когда этот сервер уже был).
Хвостат Хвостатычhvostat_hvostat on June 17th, 2014 07:02 pm (UTC)
>У меня 3 сервера с консультантом

Какая ОС?
* * * - khanid on June 17th, 2014 07:22 pm (UTC) (Expand)
* * * - vovney on June 18th, 2014 02:59 am (UTC) (Expand)
sish: йожыгsish on June 17th, 2014 07:03 pm (UTC)
А у меня на 3 регулярно было. Примерно 1200 юзеров.
Ну и это проверить быстрее, чем собирать счетчиками.
Я думаю, что на сервере множество незакрытых сессий накапливается, отсюда тормоза.
* * * - khanid on June 17th, 2014 07:30 pm (UTC) (Expand)
* * * - sish on June 17th, 2014 09:23 pm (UTC) (Expand)
* * * - khanid on June 18th, 2014 06:17 am (UTC) (Expand)
sishsish on June 17th, 2014 06:12 pm (UTC)
Ну а диагностика-запускать счетчики производительности SMB для начала.
Хвостат Хвостатычhvostat_hvostat on June 18th, 2014 06:18 pm (UTC)
Отлавливал несколько дней. Вроде отловил.

Во время "тошноты" SMB-сервера анормальное значение принимает параметр
"total durable handle reopen count"
Если быть точным: 59’000.

Да, и у обычного пользователя NumOpens - 2-4, а у наших, блин, любителей проконсультироваться - 150-200.

Оно?
sishsish on June 18th, 2014 07:01 pm (UTC)
Похоже на то.
Осталось найти, как победить зависшие хэндлы. Но способ точно был, читал когда-то.
* * * - hvostat_hvostat on June 18th, 2014 07:03 pm (UTC) (Expand)
* * * - sish on June 18th, 2014 07:15 pm (UTC) (Expand)
* * * - hvostat_hvostat on June 18th, 2014 07:23 pm (UTC) (Expand)
* * * - sish on June 18th, 2014 07:37 pm (UTC) (Expand)
* * * - klink0v on June 19th, 2014 05:00 am (UTC) (Expand)
* * * - klink0v on June 19th, 2014 04:57 am (UTC) (Expand)
khanidkhanid on June 17th, 2014 06:40 pm (UTC)
Попробуйте в гпедит computer -> windows settings-> security settings-> local policies -> security options отключить следующие штуки. На 2008 (не r2) было похожее. решалось вот этим самым.
microsoft network server: digitally sign communications (always)
domain member: digitally encrypt or sign secure channel data (always).
Гуглить за подробностями smb signing.
Среди десятков серверов проблема возникала однажды, и только на 2008. Хотя бысто сейчас окинув взглдом гугл по диагонали вижу, что и в 2012 встречается.
sish: йожыгsish on June 17th, 2014 07:05 pm (UTC)
Локальные политики лучше не трогать никогда. Либо тщательно документировать. Потому что отсутствие подписи может в будущем вызвать проблемы с другим софтом и устанешь искать-отчего.
khanidkhanid on June 17th, 2014 07:24 pm (UTC)
Да. Не трогать. Но как костыль, дающий время для поиска решения - сойдёт. Народу-то надо работать здесь и сейчас.
* * * - sish on June 17th, 2014 09:24 pm (UTC) (Expand)
* * * - khanid on June 18th, 2014 06:27 am (UTC) (Expand)
* * * - sish on June 18th, 2014 03:34 pm (UTC) (Expand)
* * * - khanid on June 18th, 2014 04:45 pm (UTC) (Expand)
* * * - sish on June 18th, 2014 07:04 pm (UTC) (Expand)
* * * - khanid on June 18th, 2014 07:44 pm (UTC) (Expand)
* * * - sish on June 18th, 2014 07:51 pm (UTC) (Expand)
* * * - khanid on June 18th, 2014 08:17 pm (UTC) (Expand)
* * * - klink0v on June 19th, 2014 05:13 am (UTC) (Expand)
* * * - klink0v on June 19th, 2014 05:11 am (UTC) (Expand)
Eugeneeugenebo on June 17th, 2014 07:42 pm (UTC)
Первая мысль -- потыкать диагностиками из SysInternals на какую-нибудь папку. Может, удастся разглядеть, кто набирает и не выпускает хэндлы (на это по описанию похоже).
Хвостат Хвостатычhvostat_hvostat on June 18th, 2014 06:32 pm (UTC)
Отлавливал несколько дней. Вроде отловил.

Во время "тошноты" SMB-сервера анормальное значение принимает параметр
"total durable handle reopen count"
Если быть точным: 59’000.

Да, и у обычного пользователя NumOpens - 2-4, а у наших, блин, любителей проконсультироваться - 150-200.

Оно?
pozo_de_cienciapozo_de_ciencia on June 17th, 2014 11:04 pm (UTC)
Консультант как то влияет, но как, не было времени прояснить. Жопа была полная с такой вот проблемой (консультант на одном серваке с 1С тусовался).
IT: like anvovney on June 18th, 2014 03:02 am (UTC)
как и сказали выше - скорее всего из-за кол-ва сессий и консультанта

попробуй каждую ночь отключать скриптом все сессии.
klink0vklink0v on June 18th, 2014 04:28 am (UTC)
Пробовали. Не помогает.

Каждый ночь по расписанию делается рестарт LanmanServer, но иногда вышеописанные затупы случаются в обед, например.