Технологии и решения на рынке систем хранения данных
ОДНА ИЗ НАИБОЛЕЕ СЕРЬЕЗНЫХ ЗАДАЧ ДЕПАРТАМЕНТА ПО ИНФОРМАЦИОННЫМ
ТЕХНОЛОГИЯМ – УПРАВЛЕНИЕ ОГРОМНЫМ ОБЪЕМОМ ДАННЫХ, ХРАНЯЩИХСЯ В ИНФОРМАЦИОННЫХ
СИСТЕМАХ ПРЕДПРИЯТИЯ. ОТ ЕЕ ЭФФЕКТИВНОГО РЕШЕНИЯ НАПРЯМУЮ ЗАВИСИТ ФИНАНСОВАЯ
УСПЕШНОСТЬ КОМПАНИИ И ПОТЕНЦИАЛ ЕЕ РОСТА. ПОЭТОМУ ХРАНЕНИЕ, ЗАЩИТА И УПРАВЛЕНИЕ
ДАННЫМИ В УСЛОВИЯХ ПОСТОЯННОГО РОСТА ИХ ОБЪЕМОВ – ОДНА ИЗ НАИБОЛЕЕ ОСТРЫХ
ПРОБЛЕМ СОВРЕМЕННОГО БИЗНЕСА.
На сегодняшний день на рынке систем хранения данных существует несколько
технологий, посредством которых можно решить вопрос хранения практически любого
количества информации. Построение архитектуры корпоративного хранилища
необходимо начать с выбора наиболее подходящей для каждого конкретного случая.
В общем случае, система хранения данных состоит из следующих элементов:
инфраструктуры доступа к устройствам хранения, подсистемы резервного копирования
и архивирования данных, ПО управления хранением, системы мониторинга и
управления и непосредственно устройств хранения.
В качестве аппаратных средств хранения могут быть использованы дисковые массивы,
роботизированные библиотеки на основе оптических накопителей (CD,DVD, HD-DVD и
так далее), магнитооптические диски, магнитные ленты.
При этом обработка информации и формирование логической структуры ее хранения
происходит на сервере. Доступ к данным выполняется посредством так называемых
«адаптеров», играющих роль моста между системой хранения и операционной системой
сервера приложений.
Существует несколько типов хранилищ данных, различаемых по способу
подключения устройств хранения к серверу. Традиционно, система хранения
подключается непосредственно к серверу. Эта технология получила название Server
Attached Storage (SAS) или Direct Attached Storage (DAS). Кроме того, существует
еще две распространенные технологии, которые предусматривают подключение СХД к
сети (Network Attached Storage, NAS) или создание специальной выделенной сети,
объединяющей СХД с серверами приложений (Storage area Network, SAN).
Прежде чем перейти к обзору вышеназванных технологий хранения, следует
обозначить главные требования к данному элементу ИТ-инфраструктуры:
- МАСШТАБИРУЕМОСТЬ - ВОЗМОЖНОСТЬ УЛУЧШЕНИЯ ХАРАКТЕРИСТИК СИСТЕМЫ ХРАНЕНИЯ
ПУТЕМ ДОБАВЛЕНИЯ НЕОБХОДИМЫХ РЕСУРСОВ К СУЩЕСТВУЮЩЕЙ СИСТЕМЕ БЕЗ
ПРИНЦИПИАЛЬНОГО ИЗМЕНЕНИЯ АРХИТЕКТУРЫ.
- ОТКАЗОУСТОЙЧИВОСТЬ - СПОСОБНОСТЬ СИСТЕМЫ ХРАНИТЬ И ОБЕСПЕЧИВАТЬ
ДОСТУПНОСТЬ ДАННЫХ С ЗАДАННЫМ КАЧЕСТВОМ. ОЧЕНЬ ВАЖНО, ЧТОБЫ В СЛУЧАЕ ВЫХОДА
ИЗ СТРОЯ ОТДЕЛЬНЫХ КОМПОНЕНТОВ СИСТЕМЫ ХРАНЕНИЯ ДАННЫЕ ОСТАВАЛИСЬ
ДОСТУПНЫМИ. В СВЯЗИ С ЭТИМ, НЕОБХОДИМА ОРГАНИЗАЦИЯ НЕКОТОРОЙ ИЗБЫТОЧНОСТИ В
АРХИТЕКТУРЕ.
- БЕЗОПАСНОСТЬ - ОБЕСПЕЧЕНИЕ КОНФИДЕНЦИАЛЬНОСТИ ХРАНИМОЙ ИЛИ ПЕРЕДАВАЕМОЙ
ИНФОРМАЦИИ ПУТЕМ ШИФРОВАНИЯ, ОПРЕДЕЛЕНИЯ РОЛЕЙ И ПРАВ ДОСТУПА К ДАННЫМ.
ДАННЫЙ КРИТЕРИЙ ТЕМ ВАЖНЕЕ, ЧЕМ ВАЖНЕЕ ХРАНИМАЯ ИНФОРМАЦИЯ, И ДЛЯ НЕКОТОРЫХ
КОМПАНИЙ МОЖЕТ БЫТЬ ПОСТАВЛЕН НА ПЕРВОЕ МЕСТО.
- ПРОИЗВОДИТЕЛЬНОСТЬ - НАИБОЛЬШАЯ СКОРОСТЬ ПРОВЕДЕНИЯ ТРАНЗАКЦИЙ И
ОПЕРАЦИЙ ЧТЕНИЯ/ЗАПИСИ ДАННЫХ.
- ПОДДЕРЖКА МНОЖЕСТВА ПРОГРАММНО-АППАРАТНЫХ ПЛАТФОРМ - ВОЗМОЖНОСТЬ ХРАНИТЬ
И ОПЕРИРОВАТЬ ДАННЫМИ В КРОССПЛАТФОРМЕННОЙ СРЕДЕ. ТАКУЮ ВОЗМОЖНОСТЬ НА
СЕГОДНЯШНИЙ ДЕНЬ РЕАЛИЗУЮТ ТЕХНОЛОГИИ JAVA И XML.
- УПРАВЛЯЕМОСТЬ - ВОЗМОЖНОСТЬ УПРАВЛЕНИЯ СИСТЕМОЙ ХРАНЕНИЯ ДАННЫХ ПРИ
МИНИМАЛЬНОЙ ЗАТРАТЕ РЕСУРСОВ. ВОЗМОЖНОСТЬ ГИБКО И ДИНАМИЧЕСКИ ИЗМЕНЯТЬ
КОНФИГУРАЦИЮ.
- СТОИМОСТЬ - СОВОКУПНАЯ СТОИМОСТЬ СИСТЕМЫ ХРАНЕНИЯ ДАННЫХ С УЧЕТОМ
ОБСЛУЖИВАНИЯ.
В зависимости от решаемых с помощью ИТ-системы задач, каждое требование может
иметь различный удельный вес. Системы хранения будут рассматриваться с учетом
вышеназванных критериев.
SAS/DAS – традиционная модель
Системы хранения, подключаемые непосредственно к высокоскоростному интерфейсу
сервера были разработаны для расширения емкости хранения существующих серверов.
Одно или несколько устройств подключаются к общему серверу, используя один
или несколько интерфейсов, среди которых могут быть SCSI, RAID, Fibre Channel и
другие. Специализированное ПО позволяет работать с данными, независимо от того,
на каких физических накопителях они находятся. Однако другие серверы могут
получить данные только через сервер-владелец или не могут получить их вовсе. Это
создает проблему так называемых «островов данных», файлы не могут совместно
использоваться несколькими серверами, а для добавления дисковых накопителей к
сети серверы должны быть переведены в автономный режим работы. В рамках
SAS-подхода эту проблему можно частично решить, создавая дубликаты данных на
нескольких серверах.
В общем случае, производительность SAS зависит от ОС и используемой файловой
системы, а также от уровня загрузки сервера, обслуживающего систему хранения.
На сегодняшний день архитектура SAS занимает лидирующее положение на рынке и
используется в большинстве систем хранения данных. Преимущества этой модели –
использование общепринятых стандартов, низкая стоимость и простота реализации.
Однако существует целый ряд недостатков, из-за которых SAS вытесняется более
современными сетевыми технологиями хранения данных – NAS и SAN:
- НЕДОСТАТОЧНАЯ УПРАВЛЯЕМОСТЬ.
- РОСТ ИЗДЕРЖЕК НА ХРАНЕНИЕ ДАННЫХ.
- ПЕРЕГРУЗКА ЛОКАЛЬНОЙ СЕТИ ПРИ ОБРАБОТКЕ БОЛЬШИХ ОБЪЕМОВ ДАННЫХ
(НАПРИМЕР, ВО ВРЕМЯ РЕЗЕРВНОГО КОПИРОВАНИЯ).
- ФИЗИЧЕСКИЕ ОГРАНИЧЕНИЯ НА СУММАРНУЮ ЕМКОСТЬ ПОДКЛЮЧАЕМЫХ УСТРОЙСТВ
ХРАНЕНИЯ, НАЛАГАЕМЫЕ АРХИТЕКТУРОЙ ШИН (SCSI, FIBRE CHANNEL И ТАК ДАЛЕЕ).
- ЗАВИСИМОСТЬ СХД ОТ РАБОТОСПОСОБНОСТИ СЕРВЕРА, К КОТОРОМУ ОНИ ПОДКЛЮЧЕНЫ.
Таким образом, использование архитектуры SAS может быть оправдано, когда речь
идет об архиве, содержащем большой массив данных долговременного хранения, к
которым не требуется оперативный доступ. Также можно рекомендовать SAS-системы
для рабочих станций, локально обрабатывающих большие массивы информации.
В масштабных системах уровня крупного предприятия традиционная архитектура
становится «узким местом» при решении задачи совместного использования ресурсов.
Кроме того, с ростом объемов данных затраты на SAS-системы становятся
неоправданно высокими. В результате возникает потребность в отделении систем
хранения от серверов с тем, чтобы превратить СХД в сетевой ресурс. Для этих
целей была разработана сетевая схема организации хранения данных, в рамках
которой существуют технологии NAS и SAN.
Аргументы за NAS
NAS (Network Attached Storage) – это высокопроизводительная,
платформонезависимая сетевая архитектура, в которой аппаратно-программное
обеспечение выполняет функцию файлового сервера.
Основная задача, преследуемая разработчиками – упростить совместное
использование файлов по сравнению с архитектурой SAS. Физически, устройства NAS
– это оборудование, подключаемое непосредственно к локальной сети (чаще всего
Ethernet); для передачи данных используется протокол TCP/IP. Благодаря этому,
передача данных производится между любыми устройствами сети, независимо от
программной или аппаратной платформы. Кроме того, решается свойственная
SAS-системам проблема загрузки сервера.
Хранилище этого типа часто оснащается встроенным процессором и операционной
системой. В качестве последней используются микросистемы реального времени, а
также операционные системы общего назначения с модифицированным ядром семейства
*nix. В качестве NAS-устройств применяется широкий спектр хранилищ - от
высокопроизводительных RAID-массивов до систем массового хранения данных на базе
оптических накопителей (CD, DVD) или ленточных библиотек.
Достоинства архитектуры Network Attached Storage – сокращение расходов за
счет размещения данных внутри одной логической структуры и простоты
(относительно SAS) управления хранилищем. Кроме того, для NAS характерна более
высокая производительность и удобство масштабирования: для увеличения общей
емкости хранилища не нужно переводить серверы в автономный режим – достаточно
просто добавить необходимое количество дисков простым подключением к локальной
сети.
Основной недостаток, как это бывает чаще всего, является продолжением
достоинств: ввиду того, что в качестве транспорта используется Ethernet,
возможны перегрузки локальной сети при резервном копировании или обработке
больших массивов данных. Эта проблема частично может быть решена при переходе на
Gigabit Ethernet (а в последствии - на 10 Gigabit Ethernet).
Хранилища на основе архитектуры NAS оптимально использовать в средних и
крупных сетях, обеспечивающих максимально возможную скорость передачи данных.
Стоит сказать, что NAS является переходной архитектурой между SAS и SAN.
Ведущие производители оборудования уровня предприятий – HP, EMC, Network
Appliance, уровня рабочей группы – Maxtor, Snap Appliance.
SAN - бескомпромиссная производительность
SAN (Storage Area Network) – это дополнительная выделенная сеть
данных, связывающая один или несколько серверов приложений с одной или
несколькими системами хранения. В основе SAN лежит возможность соединения любого
из серверов с любым устройством хранения данных.
Транспортом для сетей SAN чаще всего является протокол Fibre Channel. При этом
устройства могут быть соединены как посредством медного кабеля, так и с помощью
волоконно-оптических сетей. Это позволяет строить сети хранения данных между
объектами, удаленными друг от друга до 120 километров.
В качестве накопителей могут быть использованы RAID-массивы, библиотеки на
основе ленточных, магнитооптических и других видов устройств, а также простые
массивы дисков без RAID-возможностей.
Правильно организованная SAN-система обладает практически бесконечной
отказоустойчивостью, масштабируемостью и гибкостью. Также достаточно просто
организовать надежную систему безопасности. Она реализуется на уровне сервера
SAN, тогда как в NAS применяется безопасность на уровне доступа к файлам.
Дополнительные средства управления данными обеспечивают репликацию данных,
моментальные снимки данных, высокоскоростное архивирование и восстановление.
Архитектура Storage Area Network разрабатывалась с целью решения проблем
перегрузки локальных сетей, свойственных как SAS, так и NAS-системам. Так, здесь
для передачи данных используется сама сеть хранения. При этом, в отличие от NAS,
в сетях SAN используются блочный ввод-вывод. Эта особенность позволила применять
SAN-системы для работы с большими базами данных.
Пожалуй, единственный недостаток SAN – это высокая стоимость. Такие системы
могут стоить несколько сотен тысяч долларов, однако за эти деньги заказчик
получает информационную систему моментальной готовности, безопасную и
безотказную в работе.
Выбор очевиден?
Очевидно, что для больших информационных систем уровня крупной корпорации
абсолютно неприменим традиционный подход на основе архитектуры SAS/DAS. В то же
время остается выбор между SAN и NAS. Решения на основе NAS есть смысл
использовать в том случае, если система хранения данных не потребует
значительного масштабирования и уровень конфиденциальности оценивается как
средний. В то же время, SAN-системы обладают практически безграничными
возможностями масштабирования и обеспечения уровня безопасности. Они могут быть
применены там, где сеть общего назначения необходимо освободить от трафика, а
также если прирост объема данных очень значителен.
Потенциальный рынок для применения SAS-систем – малый и, частично, средний
бизнес. По данным МКСК, в малом бизнесе объем корпоративных данных в 55% случаев
не превышает 1 ТБ – здесь наиболее уместен именно традиционный подход.
В компаниях, где существует постоянная необходимость быстрого наращивания
объемов данных, стоит присмотреться к решениям на основе Network Attached
Storage. В среднем, такое хранилище обходится на 30% дешевле обычного файлового
сервера в сети. Кроме того, NAS-устройства легко внедряются в уже существующую
сетевую инфраструктуру и не требуют значительной подготовки для инсталляции,
конфигурирования и дальнейшего обслуживания.
В последнее время явно видна тенденция сближения и интеграции архитектур NAS
и SAN. Уже сегодня многие разработчики предлагают «гибридные» решения, в которых
одновременно имеются интерфейсы для подключения в сеть общего пользования и для
создания параллельной сети хранения данных.
Интервью
Александр Богуцкий: генеральный директор компании Clienttera
Компания Clientterra управляет контакт-центром, построенным на базе Cisco IP
Contact Center (IPCC) Enterprise 6.0. Cisco IPCC Enterprise является
неотъемлемой частью архитектуры Cisco AVVID и предоставляет широкие возможности
по управлению контактами: интеллектуальную маршрутизацию звонков, интеграцию с
компьютерами операторов и управление различными каналами в IP-инфраструктуре.
Кроме своей основной функциональности, возможности Cisco IPCC Enterprise
позволяют определять различные типы клиентов и эффективно управлять своими
ресурсами.
Приблизительный перечень возможностей контакт-центра:
- Возможность единовременного обслуживания основных видов контактов с
потребителями - звонки, факсы, e-mail, web-чаты.
- Поддержка очередей ожидания для удержания позвонившего абонента.
- Если абонент покинул очередь, не дождавшись оператора, то в системе
предусмотрена служба CallBack, которая перезванивает абоненту по мере
освобождения операторов.
Система записи переговоров с операторами позволяет:
- Вести тотальную запись переговоров с операторами.
- Вести выборочную запись переговоров, при которой фиксируется разговор
выбранного оператора.
- Сохранять все записанные переговоры на носителях информации с
последующим воспроизведением.
- Отслеживать, прослушивать и вмешиваться в разговор оператора в режиме
реального времени.
- Система интерактивного голосового меню IVR позволяет предоставить
абоненту интересующую его информацию без участия оператора. Абонент в
процессе прослушивания меню сам выбирает интересующую его информацию из
интерактивного меню IVR, нажимая те или иные клавиши телефона.
- Возможность автоматизации компаний исходящих вызовов.
- Предоставление заказчику доступа к статистическим отчетам на
Web-странице контакт-центра Clientterra как в режиме реального времени, так
и к данным за прошлый период.
Перечисленные возможности контакт центра поддерживают 10 серверов HP Proliant
DL 380 G4 и 2 сервера Cisco MSC-7825 стандартной комплектации на платформах
семейства ОС Windows 2000 Server с базами данных SQL 2000. Все серверы имеют
резерв в виде работающего, но неактивного второго сервера.
Две основные функции контакт-центра требуют наличия достаточно большого
дискового пространства:
- Хранение подробной статистики звонков для предоставления услуги онлайн
отчетов заказчику.
- Хранение записи разговоров для оценки качества работы операторов,
разбора конфликтных ситуаций, и т.п.
Базы данных по звонкам хранятся на сервере, именуемом AW. Для бесперебойной
работы данный сервер имеет резерв в виде второго такого же сервера с аналогичной
конфигурацией. При объеме трафика около 1 миллиона минут в месяц, основная база
данных, где хранится полная подробная история звонков, наращивается каждый месяц
на 3 – 5 Гб. Не трудно сосчитать, что через 5 месяцев такая база данных будет
иметь «вес» около 15-25 Гб. При этом необходимо учитывать, что эти данные
являются основой как для взаимодействия с заказчиком (оплата обработанных минут,
показатели качества, например количество абонентов в очереди), так и для
внутренних нужд контакт-центра, например, для показателей работы оператора во
время начисления заработной платы. Поэтому необходимо учитывать ценность этих
данных и предпринимать шаги к их сохранению. Так, например, в нашем случае на
данном сервере имеется RAID-массив из 4-х SCSI дисков в режиме «зеркало». Каждый
диск имеет размер 72GB. Значит, мы получаем общий размер полезного дискового
пространства 144 Гб, а общий размер дискового пространства равен 288 Гб. Если
принять во внимание наличие второго резервного сервера, то общий размер
дискового пространства уже равен 576 Гб.
В нашей системе имеется выделенный сервер записи разговоров, в котором тоже
используются SCSI RAID контроллер для записи голосовой информации. Запись
разговоров ведется в базу данных без образования внешних файлов (встроенная
возможность Cisco IPCC). Это существенно сокращает время записи на диск, так как
необходимо учитывать, что одновременно может вестись запись более 100
разговоров. И, если учесть, что храниться записи разговоров должны не менее
недели, то необходимый размер полезного дискового пространства приближается к
500 Гб. В этом случае ценность информации не меньше, чем статистическая
информация по звонкам, так как по этим записям идет разбор конфликтных ситуаций
с абонентами, а также оценивается общее качество работы контакт-центра.
Такая избыточность служит для сохранения наиболее ценной информации в
контакт-центре. Причем, для записи данных на такие дисковые массивы времени
тратится столько же, и а иногда даже меньше, чем на простой диск. Это происходит
благодаря оптимальной организации дисковых массивов и наличию буфера оперативной
памяти, которая работает значительно быстрее самого диска.
Заключение
Увеличение объемов накопленных данных приводит к усложнению управления ими.
Консолидация информационных ресурсов стимулирует все более широкое
распространение объединяющих дисковые и ленточные подсистемы сетей хранения,
упрощающих масштабирование, управляемость устройствами и информацией и
повышающих безопасность.
В связи с этим, уже сегодня современные устройства хранения, имеющие
интеграционные возможности и поддерживающие широкий набор сетевых архитектур, –
обязательное условие эффективного построения корпоративной информационной
системы.
Keywords: zPOSTz zANALYTICz z10026z
Для Авторов: edit delete
Автор: Евгений Ермолаев Дата: 09.12.2008 14:23:59©
|