RU-Moscow-SINP-LCG2 Resource Center
 Главная страница  Общая информация  Операционный центр РДИГ  БАК-РДИГ  EGI/NGI  Ресурсный центр НИИЯФ  Группа НИИЯФ  

Новости ресурсного центра НИИЯФ МГУ

2010

Канал связи с М9 на 10 Гб/с

Запущен новый канал свзяи до М9 и далее на 10 Гб/с.

Alexander Kryukov 2010/01/16 14:51

2009

Миграция РЦ SL4 --> SL5 завершена

С 16.12.09 кластер CE lcg02 работает под SL5 (48 CPU's).

С 22.12.09 кластер CE lcg38 работает под SL5 (124 CPU's).

С 23.12.09 кластер CE grid129 работает под SL5 (32 CPU's).

24.12.09 кластер CE lcg06 (SL4, 4 CPU's) выведен из состава РЦ.

24.12.09 запущен новый VOBOX lcg53 (SL5) для ALICE. Старый - lcg43 (SL4) - выведен из состава РЦ.

Сергей Зоткин, 2009/12/24 13:06

Запущен новый UI под SL5

В соответствии с планом миграции сайта SL4 –> SL5 , запущен новй UI (gLite 3.2, SL5) на lcg51.

Сергей Зоткин, 2009/10/05 14:23

Сроки перехода сайта на SL5 переносятся

В результате тестирования кластера lcg48(lcg-CE, SL4) + lcg50(WN, SL5) в режиме “production”, выяснилась несовместимость используемых версий Torque-server (gLite 3.1, SL4) и Torque-client (gLite 3.2, SL5). Кроме того, нет сертифицированной версии VOBOX (gLite 3.2, SL5). В связи с этим сроки перехода на SL5 сдвигаются, вплоть до решения этих проблем.

Сергей Зоткин, 2009/09/29 10:23

План перехода сайта на SL5

  1. 07.09.09 - 18.09.09
    Установка SL5 и WN на lcg50, установка lcg-CE на lcg48, тестирование кластера lcg48(lcg-CE) + lcg50(WN SL5) в режиме “production”.
  2. 21.09.09 - 30.09.09
    Переход кластеров lcg06,lcg02 и lcg38 под SL5.
  3. 01.10.09 - 31.10.09
    Установка SL5 и VOBOX на lcg43, установка cream-CE на lcg48, тестирование кластера lcg48(creame-CE) + lcg50(WN SL5) + lcg43(VOBOX SL5) для ALICE.

Сергей Зоткин, 2009/09/15 10:28

Последствия аварии файл-серверов

В результате аварии файл-серверов в НИИЯФ МГУ были потеряны все домашнии директории пользователей User Interface. Работоспособность UI восстановлена, логины/пароли остались без изменений, но домашние директории теперь пусты. Также потерян прикладной софт всех виртуальных организаций.

Lev Shamardin/Sergey Zotkin 2009/04/21 11:01

Изменение схемы электропитания

В связи с предстоящим изменением схемы электропитания РС, и для предотвращения из-за этого возможных потерь задач пользователей, на lcg02,lcg06 и grid129 приостановлены все очереди, кроме ops и dteam. lcg38 работает в штатном режиме.

Sergey Zotkin 2008/04/08 17:15

Список сертификатов НИИЯФ

В меню раздела "Ресурсный центр НИИЯФ" добавлена таблица пользовательских сертификатов и сертификатов узлов НИИЯФ (См. Сертификаты в подразделе “Статус”). Красный цвет даты означает что сертификату осталось жить меньше месяца.

Andrei Gribushin 18/01/2008 16:29

Сводка работы Ресурсного Центра

В меню раздела "Ресурсный центр НИИЯФ" добавлена позиция Сводка, публикующая сводную информацию о работе РЦ за указанный период времени (последние 7 дней по умолчанию).

Andrei Gribushin 24/12/2007 17:33

Новый CE

22.11.2007 запущен в тестовом режиме для параллельных вычислений новый СЕ - lcg85. Разрешенные VO - ops, dteam.

Sergey Zotkin 2007/11/23 11:15

Статус РЦ на 19.11.2007

В настоящий момент в режиме “production” стабильно работают 2 СЕ:

- lcg02.sinp.msu.ru –> 48 процессоров (AMD);

- lcg06.sinp.msu.ru –> 44 процессора (Intel XEON).

Третий кластер:

- lcg38.sinp.msu.ru –> 76 процессоров (Intel XEON),

также работает в режиме “production”, но не подключен к источникам бесперебойного питания, поэтому возможны сбои по питанию.

Sergey Zotkin 2007/11/19 14:15

Сбой по питанию

29.10.07

С 3.00 до 12.00 не было электричества. Ведутся работы по восстановлению работоспособности РЦ и операционного центра (ОЦ).

16.30 - работоспособность РЦ и ОЦ восстановлена.

Sergey Zotkin 2007/10/29 14:15

Проблема с кондиционерами частично решена

Работают 40 процессоров с СЕ lcg06.sinp.msu.ru

Sergey Zotkin 2007/10/26 14:30

Авария системы хранения

Из-за сбоя двух дисков в SE dcache lcg60.sinp.msu.ru разрушен RAID-массив и произошла потеря данных. SE будет полностью переставлен.

Nikolai Kruglov 2007/09/25 12:15

"Умер" SE-classic

Из-за проблем с диском остановлен SE-classic lcg13.sinp.msu.ru До восстановления SE-classic на другой ноде, RC отправлен в downtime.

Sergey Zotkin 2007/08/24 14:30

Остановлен SE-dcache

Из-за жары остановлен SE-dcache lcg60.sinp.msu.ru Запущен вновь будет 31 Мая после 15 часов

Nikolai Kruglov 2007/05/30 18:15

Не работает glite-CE lcg02

До 1 Июня не работает CE lcg02

Nikolai Kruglov 2007/05/29 12:25

Проблема с кондиционерами

В начале мая 2007 года вышли из строя два из трех кондиционеров в рабочем зале. В связи с этим, большая часть рабочих нод выключена.

Проблема с lcg06

24-25 марта 2007 года не работал CE lcg06.sinp.msu.ru. С 26-го марта работает опять.

Возвращение LCG

27 февраля 2007 года CE lcg06.sinp.msu.ru работает опять на LCG 2.7

Nikolai Kruglov 2007/02/27 14:50

Переход на gLite

С 15 по 22 января 2007 был произведен перевод WN подкластера lcg06.sinp.msu.ru на gLite 3.0, завершившийся переводом на gLite Computing Element lcg06.sinp.msu.ru.

Nikolai Kruglov 2007/02/02 16:30

GSM пользователь Алисы

Как известно, счетные задания от ВО Алиса запускаются от имени gsm-пользователя, учетная запись которого предназначена для установки ПО и других административных действий. Данная практика нарушает как локальную политику сайта НИИЯФ, так и цели создания такого аккаунта в структуре грид. Распоряжение координатора РДИГ В.А.Ильина для продолжения SC и до прояснения этого вопроса Алисе было временно разрешено “нецелевое” использование аккаунта gsm. Данное разрешение не распространяется на другие ВО.

Alexander Kryukov 2006/08/25 16:41

Отключение питания

14.07.06

С 14.30 до 15.30 не было электричества, профилактические работы.

14.07.06

C 17.00 РЦ восстановлен.

Сбой по питанию

12.07.06

С 9.30 до 11.00 не было электричества. Работы по восстановлению работоспособности РЦ продолжаются.

12.07.06

C 17.00 РЦ восстановлен.

Сбой по питанию

22.06.06

В 16 часов произошел сбой по питанию, в результате которого были утеряны все запущенные в тот момент задания. Работы по восстановлению работоспособности РЦ продолжаются.

23.06.06

Работы по восстановлению работоспособности РЦ закончены.

rc/main.txt · Last modified: 2010/01/17 12:17 by kryukov 
Show pagesource Old revisions Backlinks
Back to top
Recent changes RSS feed Creative Commons License Donate Powered by PHP Valid XHTML 1.0 Valid CSS Driven by DokuWiki