1548
SSD: підвиди та перспективи
Кожен запам'ятовує, як з'явився перший воістину масивний SSD-продукти. Enthusiasm, зростання продуктивності, красиві десятки тисяч продуктивності IOPS. Майже ідилліч.
Природно, для сервера (встановлення комп'ютерів ми не розглядаємо) ринку, це був величезний крок вперед, тому що магнітні засоби давно стали пляшечкою для побудови високопродуктивного розчину. Норма вважається кількома шафами з дисками, які в загальному вигляді замішували дві до трьох тисяч ІОПС, і тут така можливість збільшити продуктивність в сто або більше разів від одного приводу (зварений до САС 15К).
Вже було море оптимізму, але реальність не була настільки гладкою.
Виникає проблеми сумісності та ресурсні проблеми, коли сервер кладе все з найдешевших ліній, а також проблеми деградації продуктивності – все ще піднімає питання підтримки TRIM в RAID контролерах.
Поступово поступається розробка технології SSD. В першу чергу, кожен працював на швидкості лінійних операцій для досягнення ліміту інтерфейсу. З SATA II це сталося практично відразу, запрошуючи SATA III. Наступним кроком було збільшення продуктивності випадкових операцій доступу, де ми також змогли досягти гідного зростання.
Наступне, що я помітив стабільність продуктивності:
Taken from Anandtech огляд
В середньому, це, звичайно, багато, але стрибок від 30K до значень в пари десятків іопів сильний, шпиндель дає свою продуктивність послідовно.
Перш за все, щоб зробити цю громадську спільноту Intel з її лінією DC S3700.
Taken from Anandtech огляд
Якщо ви збільшилися в правій частині графіка, то поширення буде на 20%. Чому це важливо?
- Поведінка диска в масиві RAID набагато більш передбачувана, контролер набагато простіше працювати, коли всі учасники в масиві мають приблизно однакову продуктивність. В той же час, і масив SSD з поширенням миттєвої продуктивності є сотні разів гірше.
- Застосування, які повинні отримувати або писати дані випадковим чином і швидко будуть виконувати більш передбачувані.
На SLC з’явилась довгоочікувана пам’ять SAS з космічною вартістю та майже необмеженим ресурсом. Природно, вони були призначені для роботи в складі системи зберігання - є двосторонній доступ - передумова для приводу. З часом з'явився більш доступний продукт на eMLC пам'яті. Ресурс, звичайно, знизився, але все ще залишається досить вражаючим завдяки великому об'єму резервної копії недоступної пам'яті для користувача.
Приклад сучасного SAS SSD диска
З тих пір, як вони були призначені для роботи в системах підприємства, стабільність продуктивності була досить високою. Оскільки підходи жорстких дисків до тестів на продуктивність SSD не застосовні, промислова асоціація мереж зберігання консорціуму (SNIA) розробила спеціальну техніку SNIA Solid State Storage Performance Test. Головною особливістю техніки є те, що диск першим «підготовлений», метою підготовки є забити всю наявну пам'ять, адже особливо смарт-контролер пише дані не тільки на виділеній дисковій ємності, він змащує дані по всій наявній пам'яті. Для отримання результату диска в реальному середовищі після тривалої безперервної роботи в синтетичному тесті необхідно позбавити доступ до пам'яті «свіження», де не було даних. Після цього починається реальне тестування:
р.
Випадкове читання
Випадковий запис
У випадковому записі є суттєва перевага від 12G SAS, але навантаження процесора для обробки потоку збільшує два або більше разів.
Поточна позиція на ринку SSD SAS / SATA
Диски діляться на кілька груп, кожен з яких успішно використовується для певних завдань.
- Побутові диски для задач читання. Широко популярний варіант серед російських інтернет- холдингів, які використовують програмні масиви. У тій же групі є диски, такі як Toshiba HG5d, які позиціонуються для робочих наборів підприємств початкового рівня (розширювальний для установки ОС або завдань з первинним читанням). Життя під такими навантаженнями надовго, вартість мало, що ще потрібно для щастя?
- Корпоративні диски з 1-3 повного перезапису на добу. Призначений для зберігання з невеликим відсотком письмового, інтенсивного читання або для кешування читання. Вони добре працюють з RAID контролерами, деякі зроблені для зберігання і мають інтерфейс SAS, кеш диска обов'язково захищений конденсаторами. Не значно дорожче першої групи.
- Диски з 10 повними резитами на добу. Універсальна робоча форма в обох серверах (в основному використовується SATA-накопичувачі) і зберіганні. Недорогий дорожче першої групи.
- Диски з 25 повними резитами на добу. Найдорожчі і найшвидші, купіль пам'яті під заказником встановлює високу ціну тегу за гігабайт наявної ємності.
Тепер ми будемо говорити про SSD в незвичайному дизайні, тому що флеш (немові магнітні пластини) можна розмістити як вам подобається.
SATA SSD у форматі DIMM
У зв'язку з зростанням модулів пам'яті та зусиллями Intel/AMD для збільшення кількості підтримуваних пам'яток на процесорі, кілька серверів використовують всі слоти на дошці.
У нашому досвіді навіть 16 пам'яток на сервері не дуже поширені, а моделі RS130/230 G4 пропонують 24 слоти в системі.
Лоти спогадів.
Коли ця частина можливостей платформи є свічкою, вона глибоко пошкоджена і дратівлива.
Що робити про це?
Empty слоти можуть бути зайняті SSD-накопичувачами!
Наприклад:
SSD у форматі DIMM
Тепер ми ввійшли кілька таких дисків, ємність яких досягає 200 Гб на пам'ять SLC і 480 Гб на MLC/eMLC.
Технічно це звичайний SSD на основі контролера SandForce SF-2281, знайомий з багатьох 2,5 дисків і дуже популярний в недорогих дисках для зчитування завдань (від першої групи). Інтерфейс є стандартним SATA, тільки живлення від слота пам'яті. Toshiba flash (MLC NAND Toggle Mode 2.0, 19nm) TH58TEG8DDJBA8C, 3K P / E цикли, з загальним об'ємом 256 гігабайтів. Обіцяний курс Bit (БЕР) менше 1 в 10^17 біт читати (що це дає - обговорювався в попередньому матеріалі на жорстких дисках).
р.
Перегляд контролера
Установка в сервері проста і зручна - просто вставляємо в слот пам'яті (потужність береться з неї) і простягаємо кабель до порту:
Перегляд сервера
Оригінальні рішення
Поточні SSD-накопичувачі використовують звичайний роз'єм SATA, який не знайдено на всіх платах. Наприклад, наш RS130 G4 має лише два такі роз'єми. Якщо необхідно, ви можете зробити кабель, який поєднує в собі чотири SSD на міні-SAS або mini-SAS HD.
міні-SAS кабель
Використовуючи цей варіант, ви можете зробити різні цікаві продукти, наприклад:
32 SSD у корпусі 1U
Про SSD з стандартними інтерфейсами SAS / SATA, можливо, все. У наступній статті ми обговорюємо SSD PCIe і їх майбутнє, і зараз трохи про метод визначення SSD ресурсу для написання.
Реєстраційний ресурс
За допомогою домашнього використання кілька людей, які піклуються про життя запису диска, в той час як для більш серйозних завдань, це значення може бути критичним. Традиційно став індикатором кількості перезаписів диска на день Диску Записи на день (DWPD), що визначено як загальна кількість даних, записаних на прикладі Total Terabyte, розділених на період експлуатації (зазвичай 5 років). Кращий SATA диски мають рахунок 10 DWPD, кращий SAS SSD досягає 45 DWPD.
Як це магічна метрика вимірюється? Поглиблення в теорію флеш-пам'яті.
Основна особливість спалаху полягає в тому, що для запису (програми) дані, клітинка повинна спочатку бути вилучена (зараз). На жаль, ви не можете просто викорінити клітинку, такі операції проводяться на блоках (блокування запобіжника), мінімальна кількість пам'яті для видалення, що складається з декількох сторінок. Сторінка є мінімальною зоною пам'яті, яка може бути написана або записана в одній операції читання/запису.
Це те, як визначається цикл програмування / оновлення. Написати дані на одну або більше сторінок в блокі і стирайте блок, в будь-якому порядку.
Написати фактор посилення (WAF) є фактором посилення запису. Кількість даних, написаних на диск, розділених на кількість даних, відправлених системою для запису.
Що впливає на WAF?
Природа навантаження:
- спадкові або випадковості;
- великі або невеликі блоки;
- чи є вирівнювання даних за розмірами блоків;
- Тип даних (особливо для компресійних вбудованих SSD-накопичувачів).
Наприклад, якщо система надсилає 4KB для запису та 16KB (один блок) записано на флешку, потім WAF = 4.
р.
Один блок флеш пам'яті
Ось єдиний блок NAND, що складається з 64 сторінок. Припустимо, що кожна сторінка має розмір 2KB (чотирьох секторів), що призводить до 256 секторів в блокі. Всі сторінки блоку зайняті корисними даними. Припустимо, система перезаписує лише кілька секторів в блокі.
Рерайтинг сторінки
Для запису 8 секторів нам необхідно:
- Читати весь блок до оперативної пам'яті.
- Зміна даних на сторінках 1, 2 та 3.
- Змішайте блок з NAND.
- Запис блоку з оперативної пам'яті.
В цілому 256 секторів було вилучено і реписано на користь змін тільки 8, WAF вже 32. Але це все жахи маленьких блоків і неоптимізованих алгоритмів для роботи з спалахом, коли написання великих блоків, WAF буде дорівнює одному.
JEDEC (Індустріальний консорціум для всіх Мікроелектроніків) визначило пучк факторів, які впливають на життєвий цикл SSD-дисків і отримано функцію залежностей як f(TBW) = (TBW × 2 × WAF) / C, де C є ємність диска і мультиплеер 2 вводиться для запобігання ефекту зносу спалаху на надійності зберігання.
Разом, TBW Флеш-ємність*PE цикли/2*WA
В результаті виживання кожного SSD визначається типом навантаження, яка повинна бути визначена вручну. У випадку лінійного запису є найпростішим, для випадкових операцій все ще буде сильно впливати заповідник пам'яті NAND, який не використовується користувачем.
Якщо ви берете диск з циклами 3K P / E на клітинку пам'яті, то на лінійному письмовому TBW = 384 або приблизно 1 DWPD для ємності 256 ГБ протягом 5 років.
Робоче навантаження підприємства, відповідно до JEDEC, дає WA приблизно рівні 5, або приблизно 0,2 DWPD протягом 5 років.
Джерело: habrahabr.ru/company/etegro/blog/217735/