Публикация научных статей.
Вход на сайт
E-mail:
Пароль:
Запомнить
Регистрация/
Забыли пароль?

Научные направления

Поделиться:
Статья опубликована в №2 (октябрь) 2013
Разделы: Информационные технологии
Размещена 31.10.2013. Последняя правка: 01.11.2013.
Просмотров - 4132

Внедрение системы хранения данных в информационную структуру

Марголин Александр Юрьевич

магистрант

НГТУ

АВТФ

Аннотация:
Целью данной статьи является определение целесообразности внедрения систем хранения данных, а также их классификация по функциональности и области применения.


Abstract:
The purpose of the article is to detect an expediency of storage area network integration and to classify it by functionality and by area of implementation.


Ключевые слова:
СХД, инфраструктура, сеть хранения данных

Keywords:
SAN, NAT, Fibre Channel, iSCSI


УДК 004.772

Целью данной статьи является определение целесообразности внедрения систем хранения данных, а также их классификация по функциональности и области применения.

Прежде чем определяться с типом наиболее адекватной в каждом конкретном случае системы хранения данных (СХД), следует определить целесообразность подобного решения в целом. Для этого взглянем на то, какие задачи способно оно решить и какие преимущества оно способно привнести в инфраструктуру предприятия.

В первую очередь, система хранения данных – это централизованное хранилище. Из данного положения следует сразу целый рад важных преимуществ:

  • более экономный расход хранилища;
  • обеспечение высокой доступности данных;
  • простота расширяемости емкости хранения.
  • Централизованный подход к управлению и мониторингу.

Поясним каждый из них. Рассмотрим более традиционный подход, когда каждый из имеющихся в инфраструктуре серверов использует собственный накопитель данных. При появлении надобности в увеличении емкости, потребуется  заменять физический диск сервера на более емкий, решать проблему переноса данных. К тому же, сервер может физически не поддерживать требуемый объем жестких дисков. При использовании централизованного хранилища емкости могут выделяться логически и изменяться в соответствии с растущими потребностями конкретного сервера.  Более того, в случае централизованного хранилища, его емкость используется более эффективно, распределяясь равномерно между серверами. Расширять емкость хранилища, благодаря централизации также значительно проще: достаточно добавить требуемое количество дисков в хранилище. Использование СХД также позволяет упростить и ускорить процедуру управления и мониторинга хранилища.

Внедрение современных систем хранения данных требует значительных финансовых вложений и затрат по времени. При внедрении подобных систем также следует учитывать, что существующая информационная система, возможно, некоторое время будет работать в нештатном режиме, что в свою очередь может привести к перебоям в работе предприятия. Для успешного внедрения следует учитывать не только базовые характеристики СХД, но и полную структуру всей информационной системы, которая, скорее всего, претерпит серьезные изменения в своей организации.

Несмотря на сложности при внедрении, системы хранения данных способны удовлетворить широкий спектр потребностей владельца информационной структуры. При рациональном подходе затраты на внедрение и обслуживание компенсируются достигаемыми результатами за счет преимуществ использования СХД.

Предприятия в стремлении обеспечить выполнение своих бизнес-процессов стараются использовать наиболее актуальные серверные приложения. Современные серверные приложения в свою очередь для выполнения поставленных задач и достижения максимальной эффективности предъявляют высокие требования к информационной структуре предприятия. Эти требования касаются не только аппаратной мощности и производительности вычислительных ресурсов, но и степени отказоустойчивости, а также эффективности распределения вычислительных ресурсов.

Рассмотрим задачи и проблемы, которые в общем случае способно разрешить внедрение. Первым (но не самым важным) преимуществом внедрения СХД является увеличение скорости доступа к данным. Во многом данный пункт зависит от используемых протоколов и физической среды для передачи данных.

Обеспечение доступности данных. Для многих предприятий может быть жизненно-критичной не только потеря данных, но  и ситуация, в которой эти данные оказываются недоступными в течение относительно небольших промежутков времени. Именно поэтому большинство решений по внедрению систем хранения данных на сегодняшний день нацелены на использование инструментов, способных повысить процент аптайма.

 В условиях ограниченности ресурсов и бюджетов при разработке решения следует также стремиться к максимальной эффективности использования вычислительных ресурсов и консолидированности данных. При необходимости решение может отвечать возможности распределения физических емкостей хранилища на виртуальные. Это позволяет обеспечить более гибкое выделение дискового пространства и управление, как  хранилищем, так и всей инфраструктурой.

Также одним из важных преимуществ решения по внедрению системы хранения данных является обеспечение расширяемости структуры. В удовлетворении потребности развития и соответственно расширения предприятия, растет и вычислительный парк. Вместе с ним требуется соответствующее увеличение емкости системы хранения данных. Поэтому эффективность решения определятся также наличием простой и гибкой системы расширяемости СХД.

Несмотря на все  преимущества внедрения сети хранения данных, оно сопровождается значительными затратами, поэтому интеграция подобной системы должна сопровождаться тщательным анализом уже имеющейся инфраструктуры и потребностей заказчика. В процессе создания СХД должно достигаться оптимальное соотношение трех важнейших показателей: максимальная доступность, максимальная производительность, минимальная совокупная стоимость.

Рассмотрим наиболее распространенные типы сетевого хранилища данных. Сетевое хранилище может быть основано на NAS хранилище (Network Attached Storage).  В данном случае сетевое хранилище может быть интегрировано непосредственно в существующую локальную сеть. Хранилища, организованные с помощью данной технологии позволяют создавать легко масштабируемые и простые в управлении системы хранения. Использование NAS позволяет использовать совместный доступ, политики доступа к данным.

Применение подобных систем позволяет значительно усилить позиции решения с точки зрения его бюджетности, что, несомненно, делает его привлекательным. Однако такой подход имеет также ряд недостатков. Применение подобной системы может оказаться недостаточно гибким. Например, такой полезный функционал, как выделение логических разделов оказывается недоступным. Стоит также помнить что хранилище, построенное на NAS, при передаче данных использует сетевые протоколы, что накладывает соответствующие издержки.

Обратившись к протоколу iSCSI (Internet Small Computer System Interface), мы увидим, что это протокол, изначально предназначенный для организации взаимодействия между объектами (таргеты и инициаторы) в сетях передачи данных. В данном контексте под таргетами понимаются блочные устройства СХД, а под инициаторами – серверы, обращающиеся к данным. Также как и в NAS оболочкой для пакетов данных служит стек сетевых протоколов.

iSCSI дает значительное преимущество при работе в связке с инициаторами, основанными на виртуальной платформе. Поддерживается выделение LUNов (виртуальных логических дисков), что означает возможность более гибкого выделения емкостей и использование отдельной файловой системы на каждом из них.  В целом сети хранения данных, основанные на блочном доступе iSCSI являются более производительными, чем с использованием NAS хранилища с файловым доступом.

Fiber Channel является на сегодняшний день самым быстрым при организации СХД. Протокол Fiber Channel избавлен от недостатков традиционных сетевых протоколов, которым присуща потеря пакетов данных, непоследовательность их передачи и заголовки излишней длины. К тому же специализированные адаптеры HBA (Host Bus Adapter) берут на себя аппаратную нагрузку на формирование этих заголовков. Поэтому, на фоне всех положительных сторон, применение FC сопровождается значительными финансовыми затратами. Это обуславливается стоимостью оборудования, используемого при построении подобных систем: сетевые адаптеры (HBA), оптическая среда, соответствующие коммутаторы и маршрутизаторы.

FCoE (Fibre Channel over Ethernet) – это протокол, который является комбинацией Fiber Channel и протокола Ethernet. Совмещение происходит за счет инкапсуляции пакетов блочного доступа Fiber Channel в  сетевые пакеты Ethernet. Наравне с iSCSI данное решение позволяет сократить совокупную стоимость оборудования путем использования уже существующего сетевого оборудования, которое значительно дешевле, чем применяемое в сети хранения данных, основанной на Fiber Channel. При этом доступность данных сокращается за счет уменьшения задержек благодаря технологии lossless Ethternet. Определить нишу данной технологии – сложная задача, так как он является достаточно новой. Тем не менее, в силу упрощения инфраструктуры в целом, при создании ее с нуля имеет смысл воспользоваться данной конвергентной технологией для достижения баланса между стоимостью и производительностью решения.

Разделим условно типы предприятий и развернутых в них инфраструктур на следующие типы: малые, средние и большие, распределенные и охарактеризуем каждую из них. При этом будем помнить, что ключевой задачей при внедрении является достижения баланса между максимальной доступностью, максимальной производительностью и минимальной стоимостью решения.

В данном контексте малое предприятие характеризуется небольшой информационной структурой с малым числом пользователей (до 100 чел.) В общем случае универсальным рецептом может послужить применение файлового хранилища, доступ к которому осуществляется посредством файлового доступа. Подобное решение не потребует внесения серьезных изменений в инфраструктуру и окажется максимально эффективным с точки зрения соотношения стоимости и удовлетворения потребностей предприятия.

Инфраструктура более крупного масштаба предполагает использование более консолидированных аппаратных ресурсов и соответствующих решений. Для более эффективной работы в них рекомендуется использовать iSCSI или Fiber Channel решения. Далее выбор зависит от критичности доступа к ним и выделяемого бюджета на реализацию.

В случае распределенной информационной структуры выбор несомненно должен падать на Fiber Channel сети хранения данных. Также физической средой передачи данных должна выступать оптическая сеть, позволяющая соединять распределенные ЦОДы (центр обработки данных) на максимальных скоростях и обеспечить высокий уровень доступности. Поскольку такие структуры используются зачастую крупными предприятиями, то данные факторы в данном случае являются наиболее критичными. Также, бюджет, затраченный на внедрение такой системы, окажется наиболее оправданным.

Таким образом, были рассмотрены и классифицированы различные способы организации систем хранения данных и протоколы доступа к ним. В соответствии с типом доступа и способом организации сети хранения данных были сформированы критерии выбора применительно к масштабам предприятия. В дальнейших публикациях планируется обзор количественных методов оценки производительности и прочих характеристик сетей передачи данных.

Библиографический список:

1. CITForum [Электронный ресурс]: Методы построения систем хранения данных, А.К. Лобанов, Эксперт департамента системных решений, Компания IBS Jet Info Online №7, 2003 – Режим доступа: http://citforum.ru/hardware/data/db/
2. Паклин Н. Б., Орешков В. И.: Бизнес-аналитика: от данных к знаниям – С. П.: – Питер, 2013, 706 с. – ISBN: 978-5-459-00717-6.
3. Руденко А. – Бюджетная виртуализация. NFS vs ISCSI, что выбрать? // Системный администратор (№5, 2013) – Режим доступа: http://ivirt-it.ru/2013/06/nfs_vs_iscsi/




Рецензии:

2.11.2013, 6:11 Назарова Ольга Петровна
Рецензия: Рекомендуется к печати



Комментарии пользователей:

5.11.2013, 22:03 Назарова Ольга Петровна
Отзыв:  Рекомендуется к печати


Оставить комментарий


 
 

Вверх