Аппаратные средства хранения больших объёмов данных
Аннотация
Одной из важнейших проблем, возникающих при хранении больших объёмов данных, является рациональный выбор носителей информации. В работе проведена оценка возможности применения магнитной ленты, CD, DVD, Blu-ray дисков, накопителей на жёстких магнитных дисках, накопителей на флэш-памяти (твердотельные накопители) для хранения больших объёмов данных с учетом надёжности, скоростных характеристик и стоимости хранения данных. Анализ показал, что твердотельные накопители могут применяться в случае необходимости обеспечения сверхбыстрого доступа к оперативным данным. Накопители на жёстких магнитных дисках могут использоваться как основные носители для хранения оперативных данных. DVD и Blu-ray библиотеки могут использоваться для архивного хранения данных средних объёмов (десятки терабайт). Ленточные библиотеки могут использоваться для хранения сверхбольших объёмов данных (сотни терабайт и более). Наименьшая стоимость хранения 1 Гб информации составляет 0,03$ при использовании ленточных библиотек. Наиболее дорого обходится хранение 1 Гб на твердотельных накопителях (0,85$).
Ключевые слова: устройства хранения, хранение данных, носители информации
05.13.01 - Системный анализ, управление и обработка информации (по отраслям)
Введение
Одной из важнейших проблем, возникающих при хранении больших объёмов данных, является рациональный выбор носителей информации. Среди них можно выделить: магнитную ленту, CD, DVD Blu-ray диски, накопители на жёстких магнитных дисках, накопители на флэш-памяти (твердотельные накопители). Каждый из этих носителей имеет свои особенности, преимущества и недостатки.
Цель исследования — оценить возможности применения каждого вида носителей в цифровых хранилищах больших объёмов данных с учетом надёжности, скоростных характеристик и стоимости хранения.
Накопители на магнитной ленте
Накопители на магнитной ленте — запоминающие устройства, основанные на принципе магнитной записи на ленточных носителях, осуществляющие последовательный доступ к данным.
Магнитная лента — один из старейших носителей информации, применяемых в компьютерной технике. Основная область применения — долговременное хранение резервных копий и больших архивов информации.
Основные достоинства накопителей на магнитной ленте (стримеров): низкая стоимость данных, способность хранить большие объёмы данных, высокая стабильность работы, надёжность, неприхотливость к условиям хранения носителей, невысокое потребление энергии. К недостаткам стоит отнести низкую скорость доступа к произвольным данным и высокую стоимость накопителей.
В настоящее время для построения накопителей на магнитных лентах используются несколько стандартов. Один из них — стандарт LTO (Linear Tape-Open), разработанный в 1998 году компаниями IBM, Hewlett-Packard и Seagate Technology. Для записи данных в стандарте LTO используется формат Ultrium, оптимизированный под наиболее производительную запись данных. В современных накопителях используется LTO пятого поколения (получивший название LTO-5). LTO-5 позволяет записывать на 1 картридж до 1,5 Тб данных (3 Тб при использовании аппаратного сжатия). Картриджи LTO обеспечивают срок хранения от 15 до 30 лет, поддерживают около 260 полных записей ленты и около 5000 загрузок/выгрузок в накопитель. Скорость доступа к данным в LTO-5 достигает 180 Мб/с. Применение интерфейса SAS позволяет передавать информацию со скоростью 3 или 6 Гбит/с. При стоимости картриджа ёмкостью 1,5 Тб (3 Тб в сжатом виде) в 50$, хранение 1 Гб информации обходится в 0,033 $ (без учета стоимости оборудования, техобслуживания и расхода электроэнергии).
Компания IBM использует для производства ленточных накопителей свой закрытый стандарт IBM 3592 [1]. Стандарт ориентирован не только на резервное копирование больших объёмов данных, но и на быстрый произвольный доступ к данным. В стандарте IBM 3592 используется оптимизация производительности в старт-стопном режиме записи за счёт кэширования данных и многоскоростного движения ленты (до 7 скоростей). Накопители, построенные на основе стандарта, позволяют работать с картриджами ёмкостью в 4 Тб несжатых данных и обеспечивают скорость передачи до 250 Мб/с. При стоимости картриджа в 240$ хранение 1 Гб информации обходится в 0,06 $.
На базе накопителей на магнитной ленте строятся так называемые ленточные библиотеки [2]. Такие системы могут использовать сотни, а иногда и тысячи картриджей, автоматически загружаемых в устройства чтения/записи с помощью роботов (называемых автозагрузчиками). Картриджи снабжаются специальными штрих-кодами, по которым их и идентифицирует робот. Ленточные библиотеки могут работать сразу с несколькими накопителями, что ускоряет процесс работы с магнитными лентами. По сравнению с другими системами, ленточные библиотеки способны хранить огромные массивы данных с наименьшими затратами. По исследованиям аналитиков, при объёме данных в несколько петабайт, их хранение с использованием ленточных библиотек обходится в 23 раза дешевле, чем при использовании дисковых массивов. Потребление электроэнергии ленточных библиотек при этом меньше в 290 раз [3]!
Одна из последних разработок компании Oracle StorageTek SL8500 Modular Library System способна использовать до 100000 картриджей и хранить до 1эксабайта (1000 петабайт) данных (при использовании аппаратного сжатия). Эта ленточная библиотека может включать в себя до 640 устройств чтения/записи.
Таким образом, ленточные накопители могут с успехом использоваться для хранения архивных копий данных [4]. Ленточные библиотеки являются неплохими кандидатами для использования в многоуровневых цифровых хранилищах в качестве нижнего уровня (обеспечивающего долговременное хранение больших массивов данных и не критичного к скорости доступа).
Оптические накопители
Компакт-диск (Compact Disc, CD) — оптический носитель информации в виде пластикового диска с отверстием в центре, процесс записи и считывания информации которого осуществляется при помощи лазера.
Компакт-диски имеют ёмкость 650 или 700 Мб. Единица скорости чтения/записи CD (1x) равна 150 Кб/с. При скорости 52х накопитель CD обеспечивает скорость передачи информации в 7,62 Мб/с. При использовании бюджетных дисков за 0,17$ стоимость хранения 1 Гб составляет 0,24$. Стоимость хранения на перезаписываемых дисках несколько выше: при цене в 0,6$ за диск, хранение 1 Гб информации будет стоить в 0,8$.
К сожалению, ёмкость CD в настоящее время недостаточна для хранения более или менее больших объёмов информации.
DVD (Digital Versatile Disc — цифровой многоцелевой диск) — носитель информации, выполненный в форме диска с размерами компакт-диска, имеющий более плотную структуру рабочей поверхности, позволяющую хранить больший объём информации. DVD накопители позволяют обеспечивать произвольный доступ к данным.
Единица скорости чтения/записи DVD (1x) равна 1,32 Мб/с. При скорости 16х накопитель DVD обеспечивает скорость передачи информации в 21,12 Мб/с, а при скорости 24х — 31,7 Мб/c. При использовании бюджетных дисков за 0,30$ стоимость хранения 1 Гб составляет 0,063$.
Существуют так называемые DVD библиотеки, позволяющие работать с тысячами дисков, автоматически загружаемых в накопители (аналогично ленточным библиотекам). Общий объём данных, хранимых подобными библиотеками может достигать нескольких десятков терабайт. Например, DVD библиотека Kubota SA 2154-4 позволяет работать с 2154 дисками, автоматически загружаемыми в 4 накопителя. К сожалению, в современной ситуации такие объёмы являются недостаточными, и рассматривать вопросы применение DVD библиотек в современных цифровых хранилищах данных не следует. Производительность подобных систем также достаточно невелика и прямо пропорциональна числу используемых накопителей.
Blu-ray Disc (BD) — новый формат оптических носителей, используемый для записи данных с повышенной плотностью. Blu-ray использует диски того же размера, что и CD/DVD. В дисках Blu-ray может использоваться несколько слоёв для хранения информации (известны прототипы с несколькими десятками слоёв). Фактически получили распространение однослойные диски ёмкостью 25 Гб, двухслойные диски ёмкостью 50 Гб, трехслойные ёмкостью 100 Гб и четырехслойные ёмкостью 128 Гб. Единица скорости чтения/записи Blu-ray (1x) равна 4,5 Мб/с. При скорости 12х накопитель Blu-ray обеспечивает скорость передачи информации в 54 Мб/c.
При цене 2$ за Blu-ray диск ёмкостью в 25 Гб, стоимость хранения 1 Гб информации (без учета стоимости оборудования) составляет около 0,08$. При использовании дисков емкостью 50 Гб с ценой в 7$, стоимость хранения 1 Гб составляет 0,14$.
В настоящее время в продажу стали поступать Blu-ray библиотеки. Они позволяют работать с сотнями Blu-ray дисков ёмкостью до 128 Гб, автоматически загружаемых в накопители с помощью робота. Аппаратно они похожи на DVD библиотеки с замененными на Blu-ray накопителями и носителями информации. Часто Blu-ray библиотеки позволяют одновременно работать не только с Blu-ray дисками разной ёмкости, но и с CD и DVD носителями.
Одна из таких библиотек, DISC/NSM BD-7000 Blu-ray Library, позволяет хранить до 690 дисков различного типа, использовать одновременно до 14 накопителей. Суммарный объём хранимых данных может достигать 69 Тб (при использовании Blu-ray дисков ёмкостью 100 Гб). Blu-ray библиотеки могут служить неплохой альтернативой ленточным библиотекам в организациях, оперирующих данными в несколько десятков терабайт.
Дисковые накопители
Накопитель на жёстких магнитных дисках (Hard Disk Drive, HDD) — устройство хранения информации, основанное на принципе магнитной записи. Благодаря своей надёжности и высокой скорости работы, накопители на жёстких дисках стали основными устройствами хранения информации в компьютерах.
К достоинствам накопителей на жёстких магнитных дисках относятся: высокая скорость доступа к данным, большая ёмкость носителей, небольшая удельная стоимость хранения информации.
К недостаткам накопителей на жёстких магнитных дисках можно отнести: чувствительность к механическим воздействиям, перегрев носителей, достаточно высокое энергопотребление, снижение производительности по мере использования накопителей вследствие дефрагментации данных.
При стоимости бюджетного накопителя на жёстких магнитных дисках ёмкостью 2 Тб в 110$, стоимость хранения 1 Гб информации составляет 0,055$ (без учета стоимости дополнительного оборудования и расходов на электроэнергию). Стоимость серверных накопителей несколько выше. Так Hitachi Ultrastar 15K600 ёмкостью в 600 Гб, имеющий интерфейс SAS 2.0 и скорость вращения шпинделя 15000 оборотов в минуту, стоит 300$. Стоимость хранения 1 Гб информации при этом составляет 0,5$.
Накопители на жёстких магнитных дисках используются в различных видах систем хранения информации: RAID массивах, сетевых системах хранения данных, сетях хранения данных.
В многоуровневых цифровых хранилищах накопители на жёстких магнитных дисках могут использоваться на различных уровнях [5]: от самых верхних (быстрых) до нижних (архивных), в зависимости от конкретных задач.
Твердотельный накопитель (SSD, solid-state drive) — запоминающее устройство с функциями жёсткого диска, не содержащее движущихся элементов. В качестве запоминающих устройств в таких накопителях чаще всего используется энергонезависимая флэш-память (существуют накопители на основе энергозависимой памяти).
К достоинствам твердотельных накопителей относятся: высокая скорость доступа к данным, нечувствительность к механическим воздействиям (вследствие отсутствия движущихся частей), малое потребление энергии, бесшумная работа, высокая стабильность работы даже при большой дефрагментации данных, широкий диапазон рабочих температур.
Недостатками твердотельных накопителей являются: ограниченное число циклов перезаписи информации (десятки тысяч циклов), высокая стоимость хранения информации, небольшая ёмкость по сравнению с накопителями на жёстких магнитных дисках.
Время доступа к данным в твердотельных накопителях составляет около 0,1 мс, что существенно ниже аналогичных показателей накопителей на жёстких магнитных дисках.
При стоимости бюджетного SSD накопителя ёмкостью 480 Гб в 410$, стоимость хранения 1 Гб информации составляет 0,854$. В связи с тем, что твердотельные накопители являются достаточно новой ветвью в хранении данных, можно ожидать совершенствования технологии и постепенного снижения стоимости подобных устройств.
Несмотря на высокую стоимость, твердотельные накопители можно использовать для хранения часто запрашиваемых данных, критичных ко времени доступа. В многоуровневых цифровых хранилищах твердотельные накопители лучше всего подходят для организации самого верхнего уровня, отвечающего за оперативный доступ к актуальным данным [6].
Выводы
Анализ показал, что существующие на сегодняшний день носители существенно отличаются друг от друга, как по стоимости хранения информации, так и по времени доступа к ней (см. таблицу 1).
Таблица № 1
Сравнение носителей информации
Носитель |
Стоимость хранения 1 Гб |
Скорость передачи данных |
Магнитная лента LTO-5 |
0,033$ |
180 Мб/с |
Магнитная лента IBM 3592 |
0,06$ |
250 Мб/с |
CD-R |
0,24$ |
7,62 Мб/с |
DVD-R |
0,063$ |
31,7 Мб/c |
Blu-ray |
0,08$ |
54 Мб/c |
HDD |
0,055$ |
200 Мб/c* |
SSD |
0,854$ |
1000 Мб/c* |
* Ориентировочная достигаемая скорость передачи данных
По итогам анализа можно предложить следующие варианты использования носителей информации по уровням хранения в цифровых хранилищах (см. рис. 1):
- Твердотельные накопители могут применяться на самом верхнем уровне хранения в случае необходимости обеспечения сверхбыстрого доступа к оперативным данным.
- Накопители на жёстких магнитных дисках могут использоваться как основные носители для хранения оперативных данных. В зависимости от конкретных задач они могут образовывать несколько подуровней: современные быстрые накопители со скоростными интерфейсами SAS, SCSI и Fibre Channel; бюджетные накопители с интерфейсами SATA и ATA; устаревшие накопители.
- DVD и Blu-ray библиотеки могут образовывать нижний уровень для архивного хранения данных средних объёмов (десятки терабайт).
- Ленточные библиотеки могут использоваться в качестве нижнего уровня для хранения сверхбольших объёмов данных (сотни терабайт и более).
Рис. 1. – Применение носителей информации на различных уровнях.
Можно заметить, что по мере перехода от верхних уровней к нижним, скорость доступа к хранимым данным снижается, а объёмы данных растут. Стоимость хранения также снижается, достигая 0,03$ на нижнем уровне.
Литература:
1.Kadleck B., Coutts C. IBM TotalStorage Enterprise Tape 3592: Presentation Guide (February 2004) [Текст]. — 26 p.
2.Osuna A., Sharma R., Silvestri M., Wiedemann S. IBM System Storage Tape Library Guide for Open Systems. Eighth Edition (June 2011) SG24-5946-07 [Текст] — Vervante, 2011. — 566 p.
3.Reine D., Kahn M. Disk and Tape Square Off Again — Tape Remains King of the Hill with LTO-4 [Текст] // Clipper Notes, Report #TCG2008009LL, 13.02.2008. — 13 p.
4. Шарапов Р.В. Вопросы применения ленточных библиотек в многоуровневых системах хранения экологических данных [Текст] // Машиностроение и безопасность жизнедеятельности, 2011. № 2. С.33-36.
5. Шарапов Р.В. Аппаратные средства организации верхнего уровня оперативного хранения часто используемых экологических данных в многоуровневых системах хранения [Текст] // Машиностроение и безопасность жизнедеятельности, 2011. № 3. С.28-33.
6.Шарапов Р.В. Некоторые вопросы использования многоуровневых систем хранения изображений в задачах мониторинга окружающей среды [Текст] // Современные наукоемкие технологии, 2011. — № 2. — С. 50-52.