Розподілене програмно-апаратне середовище ГРІД
Завантажити презентаціюПрезентація по слайдам:
Тема 10. Розподілене програмно-апаратне середовище ГРІД Викладач: д.т.н., проф. Саченко А.О. Високопродуктивні комп’ютерні системи Тернопіль 2006 Тернопільський Національний Економічний Університет Факультет комп'ютерних інформаційних технологій Кафедра Інформаційно обчислювальних систем та управління
Зміст лекції Короткий огляд структури ГРІД Цілі створення інфраструктури ГРІД Характеристика деяких проектів по розподілених обчисленнях в Інтернет та ГРІД-проектів Проект EU Data GRID (EDG). Організація ресурсів в проекті EDG Програмне забезпечення середнього рівня. Набір інструментальних засобів GLOBUS. Бібілотека MPICH-G. Доступ, сертифікація та виконання задач у середовищі ГРІД
1. Короткий огляд структури ГРІД Grid - інфраструктура, яка постійно зростає, в недалекому майбутньому, мабуть, фундаментально змінить наше уявлення про обчислювальні мережі та їх можливості. Grid покликана об'єднати безліч регіональних і національних мереж, створивши, таким чином, універсальне джерело обчислювальних ресурсів, доступних широкому колу користувачів.
Авторами ідеї створення Грід є співробітник Аргонської Національної Лабораторії Університету міста Чикаго Ян Фостер (Ian Foster) і співробітник Інституту Інформатики Університету Південної Каліфорнії Карл Кессельман (Carl Kesselman). Слово grid (сітка) для назви нової технології було вибране по аналогії з терміном "електрична мережа", яка свого часу надала універсальний доступ до джерел електроенергії, і подібно до комп'ютерної техніки, здійснювала величезний вплив на людське суспільство.
2. Цілі створення інфраструктури ГРІД Серед основних напрямів використання GRID на даний момент можна виділити: організація ефективного використання ресурсів для невеликих завдань, з утилізацією тимчасово простоюючих комп'ютерних ресурсів; розподілені суперобчислення, рішення дуже великих задач, що вимагають величезних процесорних ресурсів, пам'яті і т.д.; обчислення із залученням великих об'ємів географічно розподілених даних; колективні обчислення, в яких одночасно беруть участь користувачі з різних організацій.
3. Характеристика деяких проектів по розподілених обчисленнях в Інтернет та ГРІД-проектів Distributed.net; GIMPS (Great Internet Mersenne Prime Search); SETI; TERRA ONE; Legion; Condor; Globus; EU Data GRID (EDG).
Distributed.net. Одне з найбільших об'єднань користувачів Інтернет, що надають свої комп'ютери для вирішення масштабних та складних завдань. Більшість проектів пов'язані із завданнями взлому шифрів (RSA Challenges). З моменту початку проекту в ньому зареєструвалося 191 тис. чоловік. Детальна інформація на сайті
GIMPS (Great Internet Mersenne Prime Search) Цей проект покликаний вирішувати одну із цікавих математичних задач, а саме пошук простих чисел Мерсенна (тобто простих чисел вигляду 2P-1). З початку проекту було знайдено 4 таких простих числа. Детальна інформація на сайті
SETI Проект SETI (Search for Extraterrestrial Intelligence) - пошук позаземних цивілізацій за допомогою розподіленої обробки даних, що поступають з радіотелескопу. Приєднається може будь-який охочий. Для участі в проекті зареєструвалися близько 920 тис. чоловік. Детальна інформація на сайті
TERRA ONE Комерційний проект TERRA ONE компанії Cerentis ставить своєю метою об'єднання безлічі персональних комп'ютерів, підключених (або які періодично підключаються) до Інтернет, для вирішення завдань аналізу інформації, що надається різними замовниками. Клієнтські комп'ютери (TerraProcessor), підключені до TERRA ONE, використовуються під час простою за допомогою screen-saver'а. Інформація на сайті www.cerentis.com TERRA ONE
Legion. Проект Legion: A Worldwide Virtual Computer університету Вірджинії. Мета - розробка об'єктно-орієнтованого програмного забезпечення для побудови віртуальних мета-комп'ютерів, що включають до декількох мільйонів індивідуальних ПК, об'єднаних високошвидкісними мережами. Інформація на сайті
Condor Система Condor розробляється в університеті шт. Вісконсін (Madison). Condor розподіляє незалежні підзадачі по мережі робочих станцій, під керуванням різноманітних ОС, що існує в організації, примушуючи комп'ютери працювати у вільний час. При цьому задачі не повинні бути критичними до часу їх виконання. Програмне забезпечення системи Condor є безкоштовно. Інформація на сайті
Globus Проект реалізується в Argonne National Lab. Мета The Globus Project - побудова інфраструктури для "Computational grids", що включає обчислювальні системи, системи візуалізації, експериментальні установки. В рамках проекту проводяться дослідження по побудові розподілених алгоритмів, забезпеченню безпеки і відмовостійкості мета-комп'ютерів. Детальніше дивіться на сайті .
4. Проект EU Data GRID (EDG). Організація ресурсів в проекті EDG. Багато які з перерахованих в попередньому питанні проектів (а також і інші) можуть бути в тій чи іншій мірі корисними в контексті масштабного європейського проекту EU Data Grid (www.eu-datagrid.org) для фізики високих енергій, біоінформатики і систем спостережень за Землею. Як основа проміжного програмного забезпечення для проекту EU Data Grid вибраний набір інструментальних засобів Globus.
Проект EDG включає декілька робочих пакетів: створення для всіх даних галузей (фізики високих енергій, біології і спостереження Землі) додатків, що здійснюють прозорий доступ до розподілених даних і високопродуктивних обчислювальних ресурсів; управління робочим завантаженням (розподілене планування і управління ресурсами); управління даними (створення інтегрованого інструментарію і інфраструктури проміжного шару для узгодженого управління і розділення петабайтних об'ємів даних з ефективним використанням ресурсів); ...
... моніторинг (доступ до інформації про стан і про помилки в grid-інфраструктурі); управління кластерами, що складаються з тисяч обчислювальних вузлів; створення віртуальної приватної мережі, об'єднуючої обчислювальні ресурси і ресурси даних, що беруть участь у відладці grid-инфрастуктуры; управління масовою пам'яттю (створення глобального grid-інтерфейсу до існуючих систем управління масовою пам'яттю).
5. Програмне забезпечення середнього рівня. Набір інструментальних засобів GLOBUS. Бібілотека MPICH-G. В даний час Globus більшою мірою є інфраструктурою сервісів і набором інструментів для розробки розподілених додатків, чим замкнутий комплект утиліт для користувачів.
До основних видів сервісів, включених в Globus відносяться наступні. Зв’язок; Інформаційне обслуговування; Безпека; Управління ресурсами; Локальне управління ресурсами і завданнями.
Зв’язок Інтернет протоколи не цілком задовільні: великі накладні витрати, потокова модель TCP непридатна для ряду режимів, а інтерфейси не дозволяють контролювати всі параметри. Ідея альтернативних інтерфейсів зв'язку (API Nexus) системи Globus полягає в тому, щоб на вищому рівні “перекрити” протоколи і методи нижнього рівня, залишаючи за додатком можливість вибору, одночасно забезпечуючи автоматичний вибір.
... Nexus вводить поняття комунікаційного зв'язку, що розуміється як сукупність початкової і кінцевої точки мережевого з'єднання. Операція передачі ініціюється шляхом запиту до віддаленого сервісу (RSR) і пересилці даних до асоційованих кінцевих точок і, кінець кінцем, до процесів, що відкрили їх. Базовий комунікаційний рівень Nexus застосовується для реалізації високорівневих сервісів і засобів програмування.
Інформаційне обслуговування. Функціонування метакомпютерного середовища засноване на управлінні різноманітними типами ресурсів: комп'ютерів, мереж, протоколів і алгоритмів. Управління інформацією в Globus (служба MDS - Metacomputing Directory Service) базується на протоколі LDAP. LDAP специфікує ієрархічний деревовидний простір імен об'єктів (інформаційне дерево каталогів - DIT) і спроектований як розподілена служба: довільні піддерева можуть розміщуватися на різних серверах.
Безпека Безпека в GRID-середовищі є багатоаспектною проблемою, що включає питання автентифікації, авторизації, розмежування. У традиційних додатках клієнт - сервер автентифікація відбувається між одним клієнтом і одним сервером. У Globus схема безпеки реалізується на базі стандарту GSS - Generic Security Services, що визначає процедури і API отримання сертифікатів для взаємної автентифікації клієнта з сервером, для кодування/декодування повідомлень і електронного підпису.
Управління ресурсами Під управлінням ресурсами в метакомпютингу прийнято розуміти коло проблем, пов'язаних в першу чергу з виявленням і виділенням ресурсів, а також автентифікацією, авторизацію, створення процесів і інші дії по підготовці ресурсів для використання в мережевому додатку. У системі Globus засобом замовлення ресурсів служить мова специфікації RSL (Resource Specification Language), який визначає уніфіковані для всього глобального середовища форми опису ресурсів і служить для реалізації зв'язку між компонентами GRID-середовища, які обслуговують запити.
Локальне управління ресурсами і завданнями Самий нижчий рівень в архітектурі Globus - рівень управління ресурсами реалізує локальний менеджер GRAM, який виконує обробку специфікацій RSL а також здійснює дистанційний контроль завдань і періодичне оновлення інформації сервісу MDS.
6. Доступ, сертифікація та виконання задач у середовищі ГРІД Для того, щоб почати працювати в середовищі GRID-EDG, необхідно виконати наступні дії. 1. Отримати криптографічний сертифікат від Сертифікаційного центру (Certification Authority, CA); 2. Завантаживши отриманий сертифікат у Ваш Веб-браузер, «підписати» (електронним способом) Угоду про використання GRID-ресурсів і реєструватися у віртуальній організації GRID. Це можна зробити через Інтернет-сайт організації GRID. 3. Звернутися до системного адміністратора однієї з організацій, що входять в GRID, і отримати доступ до комп'ютера, на якому встановлені програмні засоби EDG.
Отримання сертифікату Криптографічний сертифікат використовується для ідентифікації користувача або комп'ютера в рамках правил, встановлених Сертифікаційним центром . Для отримання сертифікату необхідно надіслати по електронній пошті запит в Сертифікаційний центр. У запиті необхідно вказати підрозділ, в якому Ви працюєте або навчаєтеся і характер завдань, які Ви припускаєте вирішувати за допомогою GRID. У разі позитивного рішення, Сертифікаційний центр надішле вам у відповідь електронний сертифікат.
Інсталяція сертифікату Обробка сертифікатів в EDG-середовищі здійснюється за допомогою Інфраструктури Безпеки системи Globus (Globus Security Infrastructure, GSI). Для використання GSI сертифікаційні файли usercert.pem і userkey.pem (у PEM-форматі) необхідно помістити в директорію .globus у Вашому домашньому каталозі.
Імпортування сертифікатів в браузер Підписання Угоди про використання GRID-ресурсів проводиться за допомогою Веб-форми. Щоб дістати доступ до цієї форми, розміщеної на сайті Сертифікаційного центру, необхідно завантажити сертифікат в Інтернет-браузер. Процедури завантаження істотно відрізняються для різних браузеров.
Доступ в середовище GRID Для того, щоб отримати доступ до ресурсів GRID, необхідний комп'ютер зі встановленим призначеним для користувача GRID-інтерфейсом (UI). Доступ в середовище GRID відбувається під ім'ям, що міститься в сертифікаті і контролюється за допомогою спеціальної програми-посередника (електронній «довіреності» - proxy), яка створюється на певний обмежений термін за допомогою персонального ключа (userkey.pem) користувача.
Якщо сертифікат встановлений правильно, команда grid-proxy-init створює нову довіреність. У відповідь на екран виводиться повідомлення, подібне наступному: $ grid-proxy-init Your identity: /C=FR/O=CNRS/OU=LAL/CN=Charles Loomis/Email=loomis@lal.in2p3.fr Enter GRID pass phrase for this identity:********** Creating proxy .................................................. Done Your proxy is valid until Tue Aug 13 03:15:11 2002
Окремі елементи інформації можуть бути отримані за допомогою відповідних значень параметра команди. Докладнішу інформацію про всі ці команди можна отримати, якщо їх задати з параметром --help.
Відправка завдань в середовище GRID Система відправки завдань в середовище GRID є великою СУПО з командами для напряму завдань, перевірки їх статусу і отримання результатів. На відміну від звичайних СУПО (таких як PBS, LSF і ін.), система відправки завдань EDG: 1) забезпечує одноманітний доступ до ресурсів на різних вузлах мережі; 2) автоматично погоджує вимоги, необхідні для виконання завдання, з наявними ресурсами.
Як і в кластерних системах, призначена для користувача команда запуску в Globus містить ім'я скрипта, в якому специфікується запит ресурсів у вигляді рядка RSL. Клієнтське програмне забезпечення виділяє цей запит і передає його пошуковому брокерові, що здійснює пошук в базі даних MDS через стандартний API LDAP. Інформація, що повертається, містить мережеві адреси тих GRAM, які володіють необхідними ресурсами. Далі по отриманій адресі пересилається паспорт і саме завдання.
Схожі презентації
Категорії