Tech OnTap של NetApp הלוגו של NetApp
Tech OnTap של NetApp
     
מבט אל נבכי אחסון הנתונים הקומפקטי המוטבע של NetApp
Skip Shapiro
Skip Shapiro‏
מנהל שיווק טכני, All Flash FAS ו-ONTAP Flash‏
NetApp

ב-ONTAP® 9‎ של NetApp®‎‏, הוספנו תכונת יעילות אחסון חדשה שנקראת אחסון נתונים קומפקטי מוטבע. מאחר שזהו מושג חדש שרוב האנשים אינם מכירים, חשבתי שכדאי להקדיש חלק ממאמר זה להסבר על אופן הפעולה של האחסון הקומפקטי ועל דרכי האינטראקציה שלו עם יתר תכונות יעילות האחסון שלנו.

אחסון נתונים קומפקטי מוטבע מטפל בנתונים לפי סדר כרונולוגי, כלומר, לפי סדר הגעתם לבקר האחסון. בזמן שהנתונים שוכנים עדיין בזיכרון הבקר, אנו מזהים ערכות נתונים שכל אחת מהן צורכת בדרך כלל בלוק ‎4KB שלם באחסון הפיזי והופכים אותן לערכות נתונים קומפקטיות. האחסון הקומפקטי מאפשר לשכן כמה ערכות נתונים יחד בבלוק ‎4KB בודד. הדבר דומה לתכנון האריזה של מזוודה, של משאית או של תרמיל גב. יש לנו יכולת לזהות בלוקי קלט/פלט שוודאי מכילים כמות גדולה של אפסים מיותרים או של שטח ריק, מסירים את השטח הריק ומנצלים אותו. כך פועל האחסון הקומפקטי.

אחסון נתונים קומפקטי מתרחש במהלך תהליך היצירה של כתיבת נקודת העקביות (CP) של ONTAP‏. הדבר דומה לתהליך פירוק, חלק מפעולת הטטריס: יש לי בלוקי קלט/פלט קטנים. האם אני יכול לאחד שניים או יותר מבלוקי הקלט/פלט האלו וליצור מהם יחידה פיזית אחת שאותה אשמור לאחר מכן במדיית האחסון? עד היום הגשנו כמה בקשות לרישום תכונות אחסון הנתונים הקומפקטי שלנו כפטנטים מוכרים. אנו משתמשים בשיטה חדשנית. כברירת מחדל, אחסון נתונים קומפקטי נתמך במערכות All Flash FAS של NetApp, והוא קיים כתכונה אופציונלית שניתן להפעיל גם במערכות FAS בעלות צבירות המבוססות על כוננים קשיחים בלבד או בעלות צבירות המבוססות על Flash Pool‎ של NetApp‏. בכל מקרה, אחסון הנתונים הקומפקטי אינו כרוך בעלות נוספת, אלא הוא מוטבע בליבת ONTAP, בדיוק כמו דחיסה וכמו ביטול כפילויות.

אחסון נתונים קומפקטי הוא רכיב המתווסף למכלול התכונות של יעילות האחסון. הוא פועל במקביל לביטול הכפילויות ובמידה רבה הוא משמש כתוספת משלימה לדחיסה האדפטיבית המוטבעת. באמצעות הדחיסה האדפטיבית המוטבעת אנו יוצרים קבוצות דחיסה, בתנאי שיותר ממחצית הנתונים ניתנים לדחיסה. לאחר דחיסת הנתונים, אנו מחפשים מקרים שבהם ניתן לקבץ יחד כמה ערכות קטנות או כמה ערכות גדולות המכילות ערכות קטנות וליצור מהן בלוק נתונים פיזי אחד, כדי לאחסן את הנתונים הדחוסים במבנה קומפקטי יותר. מאחר שהאחסון הקומפקטי מתרחש כחלק מתהליך ה-CP, הוא צורך תקורת CPU קטנה מאוד, 1% עד 2% לכל היותר. המערכת שלכם לא אמורה להגיע למצב שבו אינה יכולה לעמוד בנטל של 1% עד 2% נוספים בצריכת ה-CPU של הבקר. במקרה כזה, המערכת מלכתחילה נמצאת במצב של עומס יתר.

על אף שדחיסה ואחסון קומפקטי פועלים היטב זה לצד זה, אין הכרח שיפעלו בו זמנית. לדוגמה, אמצעי אחסון המכיל קבצים קטנים רבים מתאים לאחסון קומפקטי, לעומת זאת, דחיסה לא תועיל לו רבות.

לפי סדר לוגי, כאשר נתונים נכנסים לבקר האחסון, תהליך יעילות האחסון פועל באופן הבא (בהנחה שכל תכונות היעילות פועלות):

  1. תחילה אנו מזהים בלוקים המכילים אפסים בלבד. פעולת הכתיבה מדלגת עליהם ורק המטה-נתונים מתעדכנים. למעשה הבלוקים האלו משמשים לספירת סימוכין בלבד.
  2. לאחר מכן, אנו מבצעים דחיסה אדפטיבית מוטבעת. תהליך זה קובע ביעילות רבה אם ניתן לדחוס 50% לפחות מהבלוק. איננו מבזבזים מחזורי CPU בניסיון לדחוס פריטים בשיעור קטן מ-‏‎49%‎‏ (שלא ניתן להפיק מהם חיסכון באמצעות אחסון קומפקטי).
  3. לאחר מכן מתרחש ביטול כפילויות מוטבע. תכונה זו הושקה במהדורת ONTAP 8.3.2‎‏, שבה פעולות ההשוואה וביטול הכפילויות יושמו באופן מוטבע רק בנתונים השמורים בזיכרון. ב-ONTAP 9.0‎‏, הרחבנו את גודל מאגר ה-Hash של טביעות האצבע וכעת הוא כולל גם נתונים שנכתבו לאחרונה במדיית אחסון. אם תרצו להפיק חיסכון מרבי מתהליך ביטול הכפילויות, שיטת העבודה המומלצת שלנו היא לבצע גם ביטול כפילויות ברקע (אחרי העיבוד) לפי לוח זמנים מוגדר.
  4. השלב האחרון הוא אחסון נתונים קומפקטי. נתונים שנדחסו באמצעות הדחיסה האדפטיבית, או שלא נבדקה התאמתם לדחיסה, מתאימים לאחסון נתונים קומפקטי. הפריטים המתאימים אם כן הם קבצים קטנים ללא דחיסה או נתונים שהדחיסה האדפטיבית המוטבעת דחסה בשיעור של כ-‏‎75%‎‏ ומעלה. תהליך אחסון הנתונים הקומפקטי מקבץ יחד שתי ערכות נתונים כאלו או יותר בתוך בלוק ‎4KB פיזי אחד ולאחר מכן שולח אותו לאחסון. ככל ששיעור הדחיסה גבוה יותר וככל שהקבצים קטנים יותר, כך גדל שיעור האחסון הקומפקטי. אם כן, ניתן לקבל חיסכון כפול ומכופל כאשר משלבים בלוקים קטנים, דחיסה ואחסון קומפקטי.

קרוב לוודאי שלא תדעו להעריך את גודל החיסכון שיניב האחסון הקומפקטי עד שתתחילו להשתמש בו. אחסון קומפקטי מוטבע הוא שלב היוריסטי בתוך תהליך ה-CP‏. הוא דוגם את 100 בלוקי הקלט/פלט הראשונים שנכנסים כדי לבדוק מהו שיעור האחסון הקומפקטי שלהם ולאחר מכן הוא מיישם שיעור זה על 100 הבלוקים הבאים שנכנסים. אם שיעור האחסון הקומפקטי עולה, התהליך אומר "בסדר, מעתה והלאה אניח ששיעור האחסון הקומפקטי גבוה יותר". אם מתקבל שיעור אחסון קומפקטי נמוך יותר, הוא משתמש בשיעור נמוך יותר. באירוע ה-CP הבא, התהליך יתחיל מהתחלה. זהו תהליך חוזר ונשנה המבקש למזער את ניצול ה-CPU, אך שואף לשיעור אחסון קומפקטי גבוה ככל האפשר.

איור 1) תכונות יעילות האחסון המוטבעות של NetApp מיושמות כאשר נתונים נעים ממקום למקום בערימת ONTAP‏.

מקור: ‏NetApp‏, 2016

אם תרצו, תוכלו להשתמש באחסון נתונים קומפקטי מוטבע בלבד (ללא דחיסה וללא ביטול כפילויות). נניח שיש לכם סביבה המכילה נתונים קטנים בלבד, כלומר קבצים בגודל ‎2KB ומטה. הקבצים הקטנים אינם מתאימים לדחיסה וסביר להניח שלא ניתן להפיק חיסכון רב מביטול כפילויות במקרה זה. לעומת זאת, אחסון נתונים קומפקטי יניב חיסכון בשטח בזמן שתוכלו לאחסן שני קבצים או יותר בבלוק פיזי בגודל ‎4KB‏.

לגבי שכפול נתונים לוגיים, אם באמצעי האחסון של המקור ושל היעד מוחלת מדיניות יעילות זהה, החיסכון בשטח נשמר, ולא מתבזבז מקום אחסון. קחו לדוגמה מערכת All Flash FAS המבוססת על תצורת ברירת המחדל שבה מופעלים כל כללי המדיניות של יעילות האחסון. נניח שמערכת זו מבצעת שכפול למערכת FAS המשמשת כיעד SnapVault®‎ של NetApp‏. אם תרצו לשמר את החיסכון בשטח שהתקבל מביטול הכפילויות, מהדחיסה האדפטיבית ומאחסון הנתונים הקומפקטי המוטבע, תצטרכו להפעיל את כל כללי המדיניות האלו גם במערכת היעד.

לעומת זאת, אם במערכת ה-FAS לא מופעל אף אחד מכללי החיסכון בשטח ואתם משכפלים ממערכת All Flash FAS הפועלת עם ONTAP 9‎‏, כמות הנתונים גדלה בעת כתיבתם ביעד. במקרה כזה אין בלוקים דחוסים, אין בלוקים עם ביטול כפילויות וגם אין נתונים באחסון קומפקטי. לכן אם ברצונכם לשמר את החיסכון בשטח, עליכם להגדיר כללי מדיניות זהים של יעילות האחסון הן באמצעי האחסון הן של המקור והן באמצעי האחסון של היעד. דרך אגב, שיטת העבודה המומלצת שלנו היא להפעיל את כל כללי המדיניות של יעילות האחסון באמצעי האחסון של היעד כאשר מבצעים שכפול ממערכת מקור מסוג All Flash FAS‏. כך תוכלו לשמר את החיסכון בשטח ביעד.

לסיכום, אחסון נתונים קומפקטי אינו עושה כל שינוי בנתונים הלוגיים, אלא מוצא דרכים לאחסן אותם במבנה חסכוני יותר. אם הסביבה שלכם אינה מורכבת כולה מקבצים קטנים בלבד, הדרך הטובה ביותר לתאר את פעולת האחסון הקומפקטי היא מכפלה הפועלת על הדחיסה האדפטיבית המוטבעת. אם יש לכם בלוקי קלט/פלט שאינם מנוצלים במלואם, אחסון קומפקטי יכול לסייע. הודות לתקורת CPU נמוכה ולשטח פנוי רב יותר לאחסון נתונים, ניתן לבצע בקלי קלות את תהליך אחסון הנתונים הקומפקטי המוטבע במערכות All Flash FAS‏.

Skip Shapiro הוא מהנדס שיווק טכני ב-NetApp האחראי על טכנולוגיות All Flash FAS‏, ‏Flash Pool ו-Flash Cache‎ של NetApp‏. Skip ינחה שני מפגשים טכניים בכנס NetApp Insight®‎ בלאס וגאס ובברלין. לפרטים נוספים, בקרו בקישורים הבאים:

כנס NetApp Insight בלאס וגאס (26–29 בספטמבר):
‏ONTAP 9‎ של NetApp‏: ביצועים צפויים מראש בסביבות עסקיות המבוססות על הסכמי רמת שירות
סקירה טכנית מעמיקה של All Flash FAS‏

כנס NetApp Insight בברלין (14-17 בנובמבר):
‏ONTAP 9‎ של NetApp‏: ביצועים צפויים מראש בסביבות עסקיות המבוססות על הסכמי רמת שירות
סקירה טכנית מעמיקה של All Flash FAS‏

באוקטובר 2016

 
צרו קשר   |   כיצד לרכוש   |   משוב   |   משרות  |   מינויים   |   מדיניות פרטיות   |   © 2016 NetApp