Архив номеров
Форум
Контакты

Технологии и решения на рынке систем хранения данных

ОДНА ИЗ НАИБОЛЕЕ СЕРЬЕЗНЫХ ЗАДАЧ ДЕПАРТАМЕНТА ПО ИНФОРМАЦИОННЫМ ТЕХНОЛОГИЯМ – УПРАВЛЕНИЕ ОГРОМНЫМ ОБЪЕМОМ ДАННЫХ, ХРАНЯЩИХСЯ В ИНФОРМАЦИОННЫХ СИСТЕМАХ ПРЕДПРИЯТИЯ. ОТ ЕЕ ЭФФЕКТИВНОГО РЕШЕНИЯ НАПРЯМУЮ ЗАВИСИТ ФИНАНСОВАЯ УСПЕШНОСТЬ КОМПАНИИ И ПОТЕНЦИАЛ ЕЕ РОСТА. ПОЭТОМУ ХРАНЕНИЕ, ЗАЩИТА И УПРАВЛЕНИЕ ДАННЫМИ В УСЛОВИЯХ ПОСТОЯННОГО РОСТА ИХ ОБЪЕМОВ – ОДНА ИЗ НАИБОЛЕЕ ОСТРЫХ ПРОБЛЕМ СОВРЕМЕННОГО БИЗНЕСА.

На сегодняшний день на рынке систем хранения данных существует несколько технологий, посредством которых можно решить вопрос хранения практически любого количества информации. Построение архитектуры корпоративного хранилища необходимо начать с выбора наиболее подходящей для каждого конкретного случая.

В общем случае, система хранения данных состоит из следующих элементов: инфраструктуры доступа к устройствам хранения, подсистемы резервного копирования и архивирования данных, ПО управления хранением, системы мониторинга и управления и непосредственно устройств хранения.
В качестве аппаратных средств хранения могут быть использованы дисковые массивы, роботизированные библиотеки на основе оптических накопителей (CD,DVD, HD-DVD и так далее), магнитооптические диски, магнитные ленты.

При этом обработка информации и формирование логической структуры ее хранения происходит на сервере. Доступ к данным выполняется посредством так называемых «адаптеров», играющих роль моста между системой хранения и операционной системой сервера приложений.

Существует несколько типов хранилищ данных, различаемых по способу подключения устройств хранения к серверу. Традиционно, система хранения подключается непосредственно к серверу. Эта технология получила название Server Attached Storage (SAS) или Direct Attached Storage (DAS). Кроме того, существует еще две распространенные технологии, которые предусматривают подключение СХД к сети (Network Attached Storage, NAS) или создание специальной выделенной сети, объединяющей СХД с серверами приложений (Storage area Network, SAN).

Прежде чем перейти к обзору вышеназванных технологий хранения, следует обозначить главные требования к данному элементу ИТ-инфраструктуры:

  • МАСШТАБИРУЕМОСТЬ - ВОЗМОЖНОСТЬ УЛУЧШЕНИЯ ХАРАКТЕРИСТИК СИСТЕМЫ ХРАНЕНИЯ ПУТЕМ ДОБАВЛЕНИЯ НЕОБХОДИМЫХ РЕСУРСОВ К СУЩЕСТВУЮЩЕЙ СИСТЕМЕ БЕЗ ПРИНЦИПИАЛЬНОГО ИЗМЕНЕНИЯ АРХИТЕКТУРЫ.
  • ОТКАЗОУСТОЙЧИВОСТЬ - СПОСОБНОСТЬ СИСТЕМЫ ХРАНИТЬ И ОБЕСПЕЧИВАТЬ ДОСТУПНОСТЬ ДАННЫХ С ЗАДАННЫМ КАЧЕСТВОМ. ОЧЕНЬ ВАЖНО, ЧТОБЫ В СЛУЧАЕ ВЫХОДА ИЗ СТРОЯ ОТДЕЛЬНЫХ КОМПОНЕНТОВ СИСТЕМЫ ХРАНЕНИЯ ДАННЫЕ ОСТАВАЛИСЬ ДОСТУПНЫМИ. В СВЯЗИ С ЭТИМ, НЕОБХОДИМА ОРГАНИЗАЦИЯ НЕКОТОРОЙ ИЗБЫТОЧНОСТИ В АРХИТЕКТУРЕ.
  • БЕЗОПАСНОСТЬ - ОБЕСПЕЧЕНИЕ КОНФИДЕНЦИАЛЬНОСТИ ХРАНИМОЙ ИЛИ ПЕРЕДАВАЕМОЙ ИНФОРМАЦИИ ПУТЕМ ШИФРОВАНИЯ, ОПРЕДЕЛЕНИЯ РОЛЕЙ И ПРАВ ДОСТУПА К ДАННЫМ. ДАННЫЙ КРИТЕРИЙ ТЕМ ВАЖНЕЕ, ЧЕМ ВАЖНЕЕ ХРАНИМАЯ ИНФОРМАЦИЯ, И ДЛЯ НЕКОТОРЫХ КОМПАНИЙ МОЖЕТ БЫТЬ ПОСТАВЛЕН НА ПЕРВОЕ МЕСТО.
  • ПРОИЗВОДИТЕЛЬНОСТЬ - НАИБОЛЬШАЯ СКОРОСТЬ ПРОВЕДЕНИЯ ТРАНЗАКЦИЙ И ОПЕРАЦИЙ ЧТЕНИЯ/ЗАПИСИ ДАННЫХ.
  • ПОДДЕРЖКА МНОЖЕСТВА ПРОГРАММНО-АППАРАТНЫХ ПЛАТФОРМ - ВОЗМОЖНОСТЬ ХРАНИТЬ И ОПЕРИРОВАТЬ ДАННЫМИ В КРОССПЛАТФОРМЕННОЙ СРЕДЕ. ТАКУЮ ВОЗМОЖНОСТЬ НА СЕГОДНЯШНИЙ ДЕНЬ РЕАЛИЗУЮТ ТЕХНОЛОГИИ JAVA И XML.
  • УПРАВЛЯЕМОСТЬ - ВОЗМОЖНОСТЬ УПРАВЛЕНИЯ СИСТЕМОЙ ХРАНЕНИЯ ДАННЫХ ПРИ МИНИМАЛЬНОЙ ЗАТРАТЕ РЕСУРСОВ. ВОЗМОЖНОСТЬ ГИБКО И ДИНАМИЧЕСКИ ИЗМЕНЯТЬ КОНФИГУРАЦИЮ.
  • СТОИМОСТЬ - СОВОКУПНАЯ СТОИМОСТЬ СИСТЕМЫ ХРАНЕНИЯ ДАННЫХ С УЧЕТОМ ОБСЛУЖИВАНИЯ.

В зависимости от решаемых с помощью ИТ-системы задач, каждое требование может иметь различный удельный вес. Системы хранения будут рассматриваться с учетом вышеназванных критериев.

SAS/DAS – традиционная модель

Системы хранения, подключаемые непосредственно к высокоскоростному интерфейсу сервера были разработаны для расширения емкости хранения существующих серверов.

Одно или несколько устройств подключаются к общему серверу, используя один или несколько интерфейсов, среди которых могут быть SCSI, RAID, Fibre Channel и другие. Специализированное ПО позволяет работать с данными, независимо от того, на каких физических накопителях они находятся. Однако другие серверы могут получить данные только через сервер-владелец или не могут получить их вовсе. Это создает проблему так называемых «островов данных», файлы не могут совместно использоваться несколькими серверами, а для добавления дисковых накопителей к сети серверы должны быть переведены в автономный режим работы. В рамках SAS-подхода эту проблему можно частично решить, создавая дубликаты данных на нескольких серверах.

В общем случае, производительность SAS зависит от ОС и используемой файловой системы, а также от уровня загрузки сервера, обслуживающего систему хранения.

На сегодняшний день архитектура SAS занимает лидирующее положение на рынке и используется в большинстве систем хранения данных. Преимущества этой модели – использование общепринятых стандартов, низкая стоимость и простота реализации.

Однако существует целый ряд недостатков, из-за которых SAS вытесняется более современными сетевыми технологиями хранения данных – NAS и SAN:

  • НЕДОСТАТОЧНАЯ УПРАВЛЯЕМОСТЬ.
  • РОСТ ИЗДЕРЖЕК НА ХРАНЕНИЕ ДАННЫХ.
  • ПЕРЕГРУЗКА ЛОКАЛЬНОЙ СЕТИ ПРИ ОБРАБОТКЕ БОЛЬШИХ ОБЪЕМОВ ДАННЫХ (НАПРИМЕР, ВО ВРЕМЯ РЕЗЕРВНОГО КОПИРОВАНИЯ).
  • ФИЗИЧЕСКИЕ ОГРАНИЧЕНИЯ НА СУММАРНУЮ ЕМКОСТЬ ПОДКЛЮЧАЕМЫХ УСТРОЙСТВ ХРАНЕНИЯ, НАЛАГАЕМЫЕ АРХИТЕКТУРОЙ ШИН (SCSI, FIBRE CHANNEL И ТАК ДАЛЕЕ).
  • ЗАВИСИМОСТЬ СХД ОТ РАБОТОСПОСОБНОСТИ СЕРВЕРА, К КОТОРОМУ ОНИ ПОДКЛЮЧЕНЫ.

Таким образом, использование архитектуры SAS может быть оправдано, когда речь идет об архиве, содержащем большой массив данных долговременного хранения, к которым не требуется оперативный доступ. Также можно рекомендовать SAS-системы для рабочих станций, локально обрабатывающих большие массивы информации.

В масштабных системах уровня крупного предприятия традиционная архитектура становится «узким местом» при решении задачи совместного использования ресурсов. Кроме того, с ростом объемов данных затраты на SAS-системы становятся неоправданно высокими. В результате возникает потребность в отделении систем хранения от серверов с тем, чтобы превратить СХД в сетевой ресурс. Для этих целей была разработана сетевая схема организации хранения данных, в рамках которой существуют технологии NAS и SAN.

Аргументы за NAS

NAS (Network Attached Storage) – это высокопроизводительная, платформонезависимая сетевая архитектура, в которой аппаратно-программное обеспечение выполняет функцию файлового сервера.

Основная задача, преследуемая разработчиками – упростить совместное использование файлов по сравнению с архитектурой SAS. Физически, устройства NAS – это оборудование, подключаемое непосредственно к локальной сети (чаще всего Ethernet); для передачи данных используется протокол TCP/IP. Благодаря этому, передача данных производится между любыми устройствами сети, независимо от программной или аппаратной платформы. Кроме того, решается свойственная SAS-системам проблема загрузки сервера.

Хранилище этого типа часто оснащается встроенным процессором и операционной системой. В качестве последней используются микросистемы реального времени, а также операционные системы общего назначения с модифицированным ядром семейства *nix. В качестве NAS-устройств применяется широкий спектр хранилищ - от высокопроизводительных RAID-массивов до систем массового хранения данных на базе оптических накопителей (CD, DVD) или ленточных библиотек.

Достоинства архитектуры Network Attached Storage – сокращение расходов за счет размещения данных внутри одной логической структуры и простоты (относительно SAS) управления хранилищем. Кроме того, для NAS характерна более высокая производительность и удобство масштабирования: для увеличения общей емкости хранилища не нужно переводить серверы в автономный режим – достаточно просто добавить необходимое количество дисков простым подключением к локальной сети.

Основной недостаток, как это бывает чаще всего, является продолжением достоинств: ввиду того, что в качестве транспорта используется Ethernet, возможны перегрузки локальной сети при резервном копировании или обработке больших массивов данных. Эта проблема частично может быть решена при переходе на Gigabit Ethernet (а в последствии - на 10 Gigabit Ethernet).

Хранилища на основе архитектуры NAS оптимально использовать в средних и крупных сетях, обеспечивающих максимально возможную скорость передачи данных. Стоит сказать, что NAS является переходной архитектурой между SAS и SAN.

Ведущие производители оборудования уровня предприятий – HP, EMC, Network Appliance, уровня рабочей группы – Maxtor, Snap Appliance.

SAN - бескомпромиссная производительность

SAN (Storage Area Network) – это дополнительная выделенная сеть данных, связывающая один или несколько серверов приложений с одной или несколькими системами хранения. В основе SAN лежит возможность соединения любого из серверов с любым устройством хранения данных.
Транспортом для сетей SAN чаще всего является протокол Fibre Channel. При этом устройства могут быть соединены как посредством медного кабеля, так и с помощью волоконно-оптических сетей. Это позволяет строить сети хранения данных между объектами, удаленными друг от друга до 120 километров.

В качестве накопителей могут быть использованы RAID-массивы, библиотеки на основе ленточных, магнитооптических и других видов устройств, а также простые массивы дисков без RAID-возможностей.

Правильно организованная SAN-система обладает практически бесконечной отказоустойчивостью, масштабируемостью и гибкостью. Также достаточно просто организовать надежную систему безопасности. Она реализуется на уровне сервера SAN, тогда как в NAS применяется безопасность на уровне доступа к файлам. Дополнительные средства управления данными обеспечивают репликацию данных, моментальные снимки данных, высокоскоростное архивирование и восстановление.

Архитектура Storage Area Network разрабатывалась с целью решения проблем перегрузки локальных сетей, свойственных как SAS, так и NAS-системам. Так, здесь для передачи данных используется сама сеть хранения. При этом, в отличие от NAS, в сетях SAN используются блочный ввод-вывод. Эта особенность позволила применять SAN-системы для работы с большими базами данных.

Пожалуй, единственный недостаток SAN – это высокая стоимость. Такие системы могут стоить несколько сотен тысяч долларов, однако за эти деньги заказчик получает информационную систему моментальной готовности, безопасную и безотказную в работе.

Выбор очевиден?

Очевидно, что для больших информационных систем уровня крупной корпорации абсолютно неприменим традиционный подход на основе архитектуры SAS/DAS. В то же время остается выбор между SAN и NAS. Решения на основе NAS есть смысл использовать в том случае, если система хранения данных не потребует значительного масштабирования и уровень конфиденциальности оценивается как средний. В то же время, SAN-системы обладают практически безграничными возможностями масштабирования и обеспечения уровня безопасности. Они могут быть применены там, где сеть общего назначения необходимо освободить от трафика, а также если прирост объема данных очень значителен.

Потенциальный рынок для применения SAS-систем – малый и, частично, средний бизнес. По данным МКСК, в малом бизнесе объем корпоративных данных в 55% случаев не превышает 1 ТБ – здесь наиболее уместен именно традиционный подход.

В компаниях, где существует постоянная необходимость быстрого наращивания объемов данных, стоит присмотреться к решениям на основе Network Attached Storage. В среднем, такое хранилище обходится на 30% дешевле обычного файлового сервера в сети. Кроме того, NAS-устройства легко внедряются в уже существующую сетевую инфраструктуру и не требуют значительной подготовки для инсталляции, конфигурирования и дальнейшего обслуживания.

В последнее время явно видна тенденция сближения и интеграции архитектур NAS и SAN. Уже сегодня многие разработчики предлагают «гибридные» решения, в которых одновременно имеются интерфейсы для подключения в сеть общего пользования и для создания параллельной сети хранения данных.

Интервью

Александр Богуцкий: генеральный директор компании Clienttera

Компания Clientterra управляет контакт-центром, построенным на базе Cisco IP Contact Center (IPCC) Enterprise 6.0. Cisco IPCC Enterprise является неотъемлемой частью архитектуры Cisco AVVID и предоставляет широкие возможности по управлению контактами: интеллектуальную маршрутизацию звонков, интеграцию с компьютерами операторов и управление различными каналами в IP-инфраструктуре.

Кроме своей основной функциональности, возможности Cisco IPCC Enterprise позволяют определять различные типы клиентов и эффективно управлять своими ресурсами.

Приблизительный перечень возможностей контакт-центра:

  • Возможность единовременного обслуживания основных видов контактов с потребителями - звонки, факсы, e-mail, web-чаты.
  • Поддержка очередей ожидания для удержания позвонившего абонента.
  • Если абонент покинул очередь, не дождавшись оператора, то в системе предусмотрена служба CallBack, которая перезванивает абоненту по мере освобождения операторов.

Система записи переговоров с операторами позволяет:

  • Вести тотальную запись переговоров с операторами.
  • Вести выборочную запись переговоров, при которой фиксируется разговор выбранного оператора.
  • Сохранять все записанные переговоры на носителях информации с последующим воспроизведением.
  • Отслеживать, прослушивать и вмешиваться в разговор оператора в режиме реального времени.
  • Система интерактивного голосового меню IVR позволяет предоставить абоненту интересующую его информацию без участия оператора. Абонент в процессе прослушивания меню сам выбирает интересующую его информацию из интерактивного меню IVR, нажимая те или иные клавиши телефона.
  • Возможность автоматизации компаний исходящих вызовов.
  • Предоставление заказчику доступа к статистическим отчетам на Web-странице контакт-центра Clientterra как в режиме реального времени, так и к данным за прошлый период.

Перечисленные возможности контакт центра поддерживают 10 серверов HP Proliant DL 380 G4 и 2 сервера Cisco MSC-7825 стандартной комплектации на платформах семейства ОС Windows 2000 Server с базами данных SQL 2000. Все серверы имеют резерв в виде работающего, но неактивного второго сервера.

Две основные функции контакт-центра требуют наличия достаточно большого дискового пространства:

  • Хранение подробной статистики звонков для предоставления услуги онлайн отчетов заказчику.
  • Хранение записи разговоров для оценки качества работы операторов, разбора конфликтных ситуаций, и т.п.

Базы данных по звонкам хранятся на сервере, именуемом AW. Для бесперебойной работы данный сервер имеет резерв в виде второго такого же сервера с аналогичной конфигурацией. При объеме трафика около 1 миллиона минут в месяц, основная база данных, где хранится полная подробная история звонков, наращивается каждый месяц на 3 – 5 Гб. Не трудно сосчитать, что через 5 месяцев такая база данных будет иметь «вес» около 15-25 Гб. При этом необходимо учитывать, что эти данные являются основой как для взаимодействия с заказчиком (оплата обработанных минут, показатели качества, например количество абонентов в очереди), так и для внутренних нужд контакт-центра, например, для показателей работы оператора во время начисления заработной платы. Поэтому необходимо учитывать ценность этих данных и предпринимать шаги к их сохранению. Так, например, в нашем случае на данном сервере имеется RAID-массив из 4-х SCSI дисков в режиме «зеркало». Каждый диск имеет размер 72GB. Значит, мы получаем общий размер полезного дискового пространства 144 Гб, а общий размер дискового пространства равен 288 Гб. Если принять во внимание наличие второго резервного сервера, то общий размер дискового пространства уже равен 576 Гб.

В нашей системе имеется выделенный сервер записи разговоров, в котором тоже используются SCSI RAID контроллер для записи голосовой информации. Запись разговоров ведется в базу данных без образования внешних файлов (встроенная возможность Cisco IPCC). Это существенно сокращает время записи на диск, так как необходимо учитывать, что одновременно может вестись запись более 100 разговоров. И, если учесть, что храниться записи разговоров должны не менее недели, то необходимый размер полезного дискового пространства приближается к 500 Гб. В этом случае ценность информации не меньше, чем статистическая информация по звонкам, так как по этим записям идет разбор конфликтных ситуаций с абонентами, а также оценивается общее качество работы контакт-центра.

Такая избыточность служит для сохранения наиболее ценной информации в контакт-центре. Причем, для записи данных на такие дисковые массивы времени тратится столько же, и а иногда даже меньше, чем на простой диск. Это происходит благодаря оптимальной организации дисковых массивов и наличию буфера оперативной памяти, которая работает значительно быстрее самого диска.

Заключение

Увеличение объемов накопленных данных приводит к усложнению управления ими. Консолидация информационных ресурсов стимулирует все более широкое распространение объединяющих дисковые и ленточные подсистемы сетей хранения, упрощающих масштабирование, управляемость устройствами и информацией и повышающих безопасность.

В связи с этим, уже сегодня современные устройства хранения, имеющие интеграционные возможности и поддерживающие широкий набор сетевых архитектур, – обязательное условие эффективного построения корпоративной информационной системы.



Обсуждение статьи
Логин:
Пароль:
Регистрации на сервере не требуется. Если у вас есть форумный логин, вы можете использовать его.
Если нету, то вы можете зарегистрироваться на forum.itspecial.ru
Для отправки сообщения введите код, указанный на картинке
Заголовок
Сообщение


Теги: хранение данных


Keywords: zPOSTz zANALYTICz z10026z
Для Авторов: edit Lock delete Lock

Автор: Евгений Ермолаев
Дата: 09.12.2008 14:23:59©


Другие материалы номера
Unix desktop: бизнес-ниша систем *nix
Почему OpenBSD, почему Windows?
Корпоративный *nix: краткий обзор дистрибутивов
Open Source на корпоративном рынке: сравнение совокупной стоимости
Из Windows в Linux: некоторые аспекты переноса
Миграция в открытый стандарт: проблемы переноса
Cтроим мосты: запуск WIN-программ в среде UNIX
Армагедон XXI века: вред монополизма
Сеть своей головой: основные принципы планирования сети и обеспечения ее безопасности
Cколько стоит упасть и отжаться: вероятность тотального краха
Сетевая бюрократия: разработка пакета регламентирующих документов
Совершенно секретно: безопасность баз данных предприятия
Быстрый и меткий: Fastreport как средство корпоративной отчетности
Разделяй и властвуй: совместная разработка кода
Программирование в ACE: параллелизм
Проблематика сетевого анализа и аудита: оптимальные варианты для успешного решения сетевых проблем и превентивной проверки ЛВС
Эра дешевой, современной, ультразащищенной IP-телефонии: краткие рекомендации создателям новых монополий
Опрос: переход с Windows на Unix?
Живой офис: прорыв или крушение
На службе государства: СОРМ
Физические аспекты информационной безопасности
Обзор коммутатора HP ProCurve Switch 1800-8G

В этом разделе
Видеоконференцсвязь: технологии и оборудование
Использование Web 2.0 в бизнесе
Проводная связь в Германии – пример развитого рынка
Связь в России: консолидация рынка при значительных темпах роста
Обработка и анализ информационных потоков: системы поддержки принятия решений
Рынок информационной безопасности России
Электронный документооборот для SMB
Серверные системы для SMB – приоритетное направление производителей?
IT-аутсорсинг в мире и в России
Аутсорсинговые call-центры: увеличение требований к игрокам на фоне активного роста рынка
Всемирная сеть «будущего»: независимый взгляд на развитие интернет-технологий
Интернет-банкинг в мире и в России: история, текущее положение дел и перспективы развития
Электронные деньги: принципы работы и примеры реализации
Интернет-деньги: основа электронной коммерции?
Карты в руки: история пластиковых карт
Физические аспекты информационной безопасности
Технологии и решения на рынке систем хранения данных


Хакер | GameLand | Мобильные компьютеры | Купи Камеру | Total Football | All Hockey | Onboarg Magazine | Хулиган | Sync
Total DVD | DVDxpert | Maxi Tuning | (game)land company | GamePost | Свой Бизнес


Rambler's Top100