האם בפייסבוק יש מרכזי נתונים משלה
האם בפייסבוק יש מרכזי נתונים משלה?
סיכום:
למטא (לשעבר פייסבוק) יש כיום 47 מרכזי נתונים שנמצאים בבנייה, עם תוכניות ליותר מ- 70 בניינים בעתיד הקרוב. זה משקף את הרחבת התשתית הגלובלית של החברה, כאשר 18 קמפוסים של מרכז נתונים ברחבי העולם בסך הכל 40 מיליון רגל רבוע. למרות האתגרים שמציבים שיבושים במגיפה ושרשרת האספקה, מטא מצפה להשקיע בין 29 מיליארד ל -34 מיליארד דולר בהוצאות הון בשנת 2022.
נקודות מפתח:
- למטא 47 מרכזי נתונים שנמצאים בבנייה ותוכניות ליותר מ -70 בניינים בעתיד הקרוב.
- לחברה 18 קמפוסים של מרכז נתונים ברחבי העולם.
- ההתרחבות במהלך ההפרעות במגפה ושרשרת האספקה היא מאתגרת.
- מטה מצפה להשקיע בין 29 מיליארד דולר ל -34 מיליארד דולר בהוצאות הון בשנת 2022.
- מפעילי Hyperscale כמו Meta ומיקרוסופט שופכים מיליארדים להרחיב את תשתית מרכז הנתונים שלהם.
- פרויקט Compute Open, שנוסד על ידי פייסבוק, מניע חדשנות בחומרה.
- בניית מרכז נתונים מחייבת תהליכי בחירת אתרים ותהליכי בנייה גמישים.
- מטה נראית לספקים וקבלנים כשותפים לנהיגה בשיטות עבודה מומלצות ושיפור מתמיד.
- מטא ומפעילי היפר -סולם אחרים הם חלוצי אסטרטגיות חדשות כדי לספק קנה מידה ומהירות.
- קנה המידה והאתגר של תוכנית מרכז הנתונים הוא כוח מניע למטא.
שאלות:
- מה המצב הנוכחי של בניית מרכז הנתונים של מטא?
- כמה קמפוסים של מרכז נתונים יש למטא ברחבי העולם?
- עם אילו אתגרים מתמודד מטא בהרחבת מרכז הנתונים?
- כמה מתכנן מטא להשקיע בהוצאות הון בשנת 2022?
- אילו חברות משקיעות גם בהרחבת תשתיות מרכז נתונים?
- מה תפקיד פרויקט המחשוב הפתוח?
- אילו גורמים חשובים בבניית מרכז הנתונים?
- איך מטא צופה בספקים וקבלנים?
- אילו אסטרטגיות הן מטא ומפעילי היפר -סולם אחרים חלוצים?
- מה מניע את תוכנית מרכז הנתונים של מטא?
מטא יש כיום 47 מרכזי נתונים שנמצאים בבנייה, עם תוכניות ליותר מ -70 בניינים בעתיד הקרוב.
למטא 18 קמפוסים של מרכז נתונים ברחבי העולם.
התרחבות מרכז הנתונים במהלך ההפרעות בשרשרת המגיפה ושרשרת האספקה מהווה אתגרים למטא.
מטה מצפה להשקיע בין 29 מיליארד דולר ל -34 מיליארד דולר בהוצאות הון בשנת 2022.
מפעילי Hyperscale כמו מיקרוסופט משקיעים גם מיליארדים בהרחבת תשתית מרכז הנתונים שלהם.
פרויקט המחשב הפתוח, שנוסד על ידי פייסבוק, מניע חדשנות בחומרה.
בניית מרכז נתונים מחייבת תהליכי בחירת אתרים ותהליכי בנייה גמישים.
מטא רואה בספקים ולקבלנים שותפים לנהיגה בשיטות עבודה מומלצות ושיפור מתמיד.
מטא ומפעילי היפר -סולם אחרים הם חלוצי אסטרטגיות חדשות כדי לספק קנה מידה ומהירות.
קנה המידה והאתגר של תוכנית מרכז הנתונים הוא כוח מניע למטא.
האם בפייסבוק יש מרכזי נתונים משלה
מה עוד פייסבוק מתפשטת? פרנקובסקי אמר כי “הרבה לוחות אם היום מגיעים עם הרבה Goop Management. זה המונח הטכני שאני אוהב להשתמש בו.”GOOP זה יכול להיות מנוע ניהול מחזור החיים המשולב של HP או כלי ניהול שרתים מרחוק של Dell.
בפייסבוק יש 47 מרכזי נתונים שנמצאים בבנייה
מטא מונה כיום 47 מרכזי נתונים שנמצאים בבנייה, כך נמסר מהחברה השבוע, ומשקפת את ההיקף יוצא הדופן של ההתרחבות המתמשכת של העולם’תשתית דיגיטלית.
זה’הצהרה קצרה, עמוק בתוך סקירה ארוכה של חדשנות בפייסבוק’תשתית דיגיטלית. אבל לכל מי שמכיר את ענף מרכז הנתונים, זה’זה פותח עיניים אמיתי.
“כמו שאני’M כותב את זה, יש לנו 48 בניינים פעילים ועוד 47 בניינים שנמצאים בבנייה,” אמר טום פורונג, נשיא תשתיות, מרכזי נתונים במטא (לשעבר פייסבוק). “אז אנחנו’מחדש יהיו יותר מ -70 בניינים בעתיד הקרוב.”
ההצהרה משקפת את היקף המטא יוצא הדופן’הרחבת התשתית הגלובלית. לחברה 18 קמפוסים של מרכז נתונים ברחבי העולם, אשר עם השלמתו ישתרעו על שטח של 40 מיליון רגל מרובע של שטח מרכז נתונים.
קיום 47 בניינים שנמצאים בבנייה יהיה אתגר בכל מקרה. זה’זה לא קל, או זול. מטא אומר כי היא מצפה להשקיע בין 29 מיליארד דולר ל -34 מיליארד דולר בהוצאות הון בשנת 2022, לעומת 19 מיליארד דולר בשנה שעברה.
זה’לא לבד, מכיוון שמפעילי היפר -סולם הגדולים ביותר שופכים מיליארדי דולרים להרחבת תשתית מרכז הנתונים שלהם כדי לענות על הביקוש לשירותים הדיגיטליים שלהם. הוצאות ההון של Hyperscale עלו ב -30 אחוז במחצית הראשונה של 2021, על פי ניתוח של קבוצת Synergy Research, העוקבת אחר 19 ספקי סולם יתר שהוציאו כ 83 מיליארד דולר בתקופה של שישה חודשים.
רמות ההוצאות הללו עלולות לעלות בקלות, לאור הפייסבוק’תחזיות S על הוצאות CAPEX עתידיות ומיקרוסופט’S מתכנן לבנות 50 עד 100 מרכזי נתונים בשנה.
חדשנות תשתיתית בקנה מידה אפי
פרלונג’פוסט בבלוג על מטא’מסע מרכז הנתונים של SATAS כדאי לקרוא, וכך גם פוסט נלווה שמביט לאחור על התקדמות פרויקט המחשב הפתוח, יוזמת החומרה הפתוחה שהוקמה על ידי פייסבוק בשנת 2011.
“חומרה פתוחה מניעה חדשנות, ועבודה עם יותר ספקים פירושה הזדמנות רבה יותר לפתח חומרה מהדור הבא לתמיכה בתכונות עכשוויות ומתעוררות על פני מטא’משפחת הטכנולוגיות.,” פרלונג כותב.
הצורך לחדש בקנה מידה כולל גם בניית מרכז נתונים.
“יש כיום פעילות רבה במרכז הנתונים ותעשיות הבנייה כיום, מה שמפעיל עלינו לחץ למצוא את האתרים והשותפים הנכונים,” אמר פרלונג. “זה גם אומר שאנחנו צריכים ליצור תהליכי בחירת אתרים ובנייה גמישים יותר. כל המאמץ הזה כרוך גם בהתבוננות בספקים והקבלנים שלנו יותר כשותפים בכל זה. אנחנו יכולים’לא פשוט תעשה את זה על דולרים. עלינו לעשות את זה לגבי ביצועים. עלינו לעשות זאת בנוגע לנהיגה בשיטות עבודה מומלצות ושיפור מתמיד.
“אבל זה’זה לא הדרך בה ענף הבנייה בדרך כלל עובד,” הוא המשיך. “אז אנחנו’היה צריך להביא הרבה רעיונות משלנו לגבי הפעלת פעולות ולבצע שיפורים ולהרשים אותם על החברות שאיתן אנו עובדים.”
התשתית הדיגיטלית הופכת חשובה יותר מדי יום, ומטא ומקביליה היפר -סולם הם חלוצים אסטרטגיות חדשות כדי לספק את הסולם והמהירות שהם צריכים. זה’זה תהליך מתמשך, כפי שפורטל משקף.
“המעבר לזירה של מרכז הנתונים לעולם לא היה קל להיות קל,” הוא כותב. “אבל אני חושב שאנחנו’בסופו של דבר סיים תוכנית מדהימה בקנה מידה שלעולם לא הייתי מדמיין. ואנחנו’תמיד מתבקש לעשות יותר. זֶה’זה האתגר העסקי, וזה’כנראה שאחד הדברים העיקריים שמאפשרים לי ולצוות שלי נכנסים לעבוד כל יום. יש לנו את האתגר העצום הזה לפנינו לעשות משהו שהוא מסיבי להפליא בקנה מידה.”
האם בפייסבוק יש מרכזי נתונים משלה
חזרה לבית הבלוג
20 2016
תשתית פייסבוק: אסטרטגיה ופיתוח של מרכז נתונים בתוך נתונים
מאת מטא קריירה
רייצ’ל פיטרסון מובילה את צוות האסטרטגיה של מרכז התשתית של פייסבוק. הצוות שלה מנהל את תיק המרכז לנתונים של פייסבוק ומספק תמיכה אסטרטגית לזיהוי הזדמנויות לקיימות תשתית נוספת, יעילות ואמינות תשתיות נוספות. התבונן בחוויה שלה בפייסבוק, ואיך הצוות שלה פועל לחיבור העולם.
מה סיפור הפייסבוק שלך?
הצטרפתי לפייסבוק חזרה בשנת 2009 כאשר החברה בדיוק עברה להשיק את מרכז הנתונים הראשון שלה בפרינוויל, אורגון. באותה תקופה צוות מרכז הנתונים כלול פחות מ -30 חברי צוות ופייסבוק כבשה שתי עקבות קטנות במיקום משותף בארה”ב. הצטרפתי לעזור לבנות את תוכנית בחירת האתר למרכזי הנתונים בבעלות פייסבוק. כיום הצוות שלנו כולל למעלה ממאה אנשים במקומות מרובים ברחבי העולם.
מהיר קדימה להיום, פייסבוק מחזיקה כעת ומפעילה תיק גדול של מרכזי נתונים, המשתרעת על ארה”ב, אירופה ואסיה. תוכנית בחירת האתר השיקה בהצלחה חמישה עשר מרכזי נתונים מאסיביים, ואנחנו מחויבים להפעיל מרכזי נתונים אלה עם 100% אנרגיה מתחדשת. בשנת 2012, קבענו את היעד הראשון שלנו של 25% אנרגיה נקייה ומתחדשת בתמהיל אספקת החשמל שלנו בשנת 2015 עבור כל מרכזי הנתונים. בשנת 2017 עברנו על 50% אנרגיה נקייה ומתחדשת לכל פעולות הפייסבוק. בשנת 2018 קבענו את היעד האגרסיבי הבא שלנו – במטרה לעמוד באנרגיה נקייה ומתחדשת של 100% לכל הפעולות הגוברות של פייסבוק בסוף 2020.
היה ממש מרגש להיות בחזית הצמיחה הזו, ולבנות את הקבוצה שמילאה תפקיד קריטי בגידול התשתית של פייסבוק. מעולם לא היה רגע משעמם במסע המדהים הזה! הצמיחה של פייסבוק הפכה אותה למאתגרת וגם מהנה, ואני לא חושבת שיום עבר לאן שלא למדתי. אני אוהב את מה שאני עושה, ואני באמת בר מזל לעבוד עם צוות כל כך מדהים, מהנה. התרבות של פייסבוק מאפשרת לצוות שלי להשפיע מרחיקת לכת, וביחד אנו הופכים את העולם ליותר נפתח ומחובר. מרכז נתונים אחד בכל פעם.
המשימה של פייסבוק היא להפוך את העולם ליותר פתוח ומחובר, איזה תפקיד יש לצוות שלך בזה?
מוביל את אסטרטגיית המיקום הגלובלית של פייסבוק ומאמצי בחירת האתר על בסיס מספר קריטריוני מיקום קריטיים, כולל אנרגיה מתחדשת חדשה לתמיכה באתרים.
מנהל את תוכניות הציות הסביבתי הגלובלי של פייסבוק, החל מבחירת אתרים לאורך כל הפעולות, כולל תאימות אוויר ומים.
מוביל את תוכניות האנרגיה הגלובליות של פייסבוק, החל בחירת אתרים לאורך כל הפעולות, ומיטב את אספקת האנרגיה לאנרגיה מתחדשת של 100%, תוך הבטחת אחריות פיסקלית ואמינות.
מוביל את התכנון האסטרטגי, המאפשר ומעקב אחר מפת הדרכים של מרכז הנתונים הגלובלי.
מספק תמיכה במדעי הנתונים כדי לאפשר החלטות אסטרטגיות ואופטימיזציה של ביצועים בכל מחזור החיים של מרכז הנתונים.
מוביל את עבודת המעורבות בקהילה שלנו במיקומים שבהם יש לנו מרכזי נתונים.
מפתחת ומנהלת אסטרטגיות מדיניות והפחתת סיכונים כדי לאפשר התרחבות גלובלית של פייסבוק’טביעת רגל תשתית.
פייסבוק מחויבת להיות כוח לטוב בכל מקום בו אנו עובדים על ידי מתן משרות, צמיחת הכלכלה ותוכניות תומכות המועילות לקהילות בהן אנו חיים.
צוות הקיימות שלנו’המשימה היא לתמוך בפייסבוק’היכולת לפעול ולצמוח ביעילות ובאחריות ולהעצים אנשים לבנות קהילות בר -קיימא.
מוביל אסטרטגיה כוללת של החברה בהנעת מצוינות תפעולית מתכנון, בנייה ותפעול של העסק שלנו. אנו מתעדפים יעילות, שימור מים ומצוינות בשרשרת האספקה ונגשים לומר שהמתקנים שלנו הם בין המים והאנרגיה ביותר בעולם.
אנו מחויבים להילחם בשינויי אקלים וקבענו יעד מבוסס מדע להפחתת הפליטות שלנו ב -75 אחוזים עד 2020.
ערכי הליבה של פייסבוק עוברים במהירות, מתמקדים בהשפעה, לבנות ערך חברתי, היו פתוחים, היו מודגשים. איזה ערך באמת מהדהד עם הצוות שלך?
התמקדו בהשפעה. הצוות שלנו יחסית רזה ובכל זאת יש לנו את היכולת לספק יוזמות רבות להשפעה גבוהה עבור החברה.
מה זה משהו שרוב האנשים לא יודעים על הצוות שלך?
יש לנו צוות מגוון מאוד המורכב מעורכי דין, מנהלי מדיניות ציבורית, אנליסטים פיננסיים, מנהלי תכניות, מדעני נתונים, אנשי אנרגיה, מהנדסים ומומחי תהליכים עסקיים.
אתה יכול לשתף על היותך מובילה בתעשיית הטכנולוגיה וחשיבות המגוון בפייסבוק ובטכנולוגיה בכלל?
אחת הסיבות לכך שאני אוהבת לעבוד בפייסבוק היא המחויבות שלנו לגיוון. גיוון אינו פעילות חוץ -לימודית בפייסבוק, אלא משהו שאנו שואפים ליישם בכל רמות החברה. למרות שיש לנו, ותעשיית הטכנולוגיה בכללותה, יש כאן יותר עבודה, אנו מחזקים ללא הרף את המחויבות הזו באמצעות התרבות שלנו, המוצרים שלנו וסדרי העדיפויות שלנו לשכירות.
כאישה בתחום הטכנולוגיה, אני יודע ממקור ראשון עד כמה גיוון חשוב לתעשייה שלנו וכיצד נקודות מבט מגוונות מניעות תוצאות טובות יותר. חשוב מאוד שנעשה הכל כדי לשפר את שכירתם של מועמדים מגוונים ולעודד נשים להצטרף למגזרים שנשלטים בדרך כלל על גברים. מצאתי את הקריירה שלי קוראת לבחירת אתרי נדל”ן, תעשייה שנשלטת על ידי גברים באופן מסורתי, ומצאתי את ההשראה שלי דרך הנשים המוכשרות הרבות שהעניקו לי השראה וחונכו אותי בדרך. כיום, כמובילה אישה בתחום הטכנולוגיה, חובתי והזכות שלי להיות מנטורית לנשים, ולעשות את מה שאני יכול כדי לתמוך באופן פעיל בצמיחה ובקידום של נשים בענף זה.
העצה שלי לנשים? מצא את התשוקות שלך ועקוב אחריהם, גם אם בסופו של דבר אתה נמצא באזור בו אתה’בדרך כלל האישה היחידה בחדר. נקודות החוזק שלך יתפתחו דרך היצרים שלך, ואתה’תעבוד קשה יותר על המלאכה שלך. הקריירה שלך תמצא מסלול משלה. והכי חשוב, הרשו לעצמכם מקום להיכשל, ותקבלו מיד אם אתם מעדים בדרך.
האם בפייסבוק יש מרכזי נתונים משלה
פייסבוק’שירותי S מסתמכים על ציי שרתים במרכזי נתונים בכל רחבי העולם – כולם מפעילים יישומים ומספקים את הביצועים שהשירותים שלנו זקוקים להם. זו הסיבה שאנחנו צריכים לוודא שחומרת השרת שלנו אמינה וכי אנו יכולים לנהל כישלונות של חומרת שרת בסולם שלנו עם כמה שפחות השירותים שלנו.
רכיבי חומרה עצמם יכולים להיכשל מכל מספר סיבות, כולל השפלה חומרית (ה.ז., הרכיבים המכניים של כונן דיסק קשיח מסתובב), מכשיר המשמש מעבר לרמת הסיבולת שלו (e.ז., מכשירי פלאש של NAND), השפעות סביבתיות (ה.ז., קורוזיה עקב לחות), ופגמים בייצור.
באופן כללי, אנו תמיד מצפים למידה מסוימת של כישלון חומרה במרכזי הנתונים שלנו, וזו הסיבה שאנו מיישמים מערכות כמו מערכת ניהול האשכולות שלנו כדי למזער את הפרעות השירות. במאמר זה אנו’מחיר מחדש ארבע מתודולוגיות חשובות שעוזרות לנו לשמור על מידה גבוהה של זמינות חומרה. בנינו מערכות שיכולות לאתר ולתקן בעיות . אנו עוקבים ומתקנים אירועי חומרה מבלי להשפיע לרעה על ביצועי היישום . אנו מאמצים גישות פרואקטיביות לתיקוני חומרה ומשתמשים במתודולוגיית חיזוי לצורך תמציות . ואנחנו מפעילים אוטומציה של ניתוח שורש לניתוח חומרה וכישלונות מערכת בקנה מידה כדי להגיע לתחתית הנושאים במהירות.
כיצד אנו מטפלים בתיקון חומרה
אנו מריצים מדי פעם כלי בשם MachineChecker בכל שרת כדי לאתר חומרה וכישלונות קישוריות. ברגע ש- MachineChecker יוצר התראה במערכת טיפול מרכזי בראשות, כלי בשם Remediation Auto Auto (FBAR) ואז מרים את ההתראה ומבצע תמציות הניתנות להתאמה אישית כדי לתקן את השגיאה. להבטיח שם’S עדיין מספיק יכולת לפייסבוק’S שירותים, אנו יכולים גם לקבוע מגבלות תעריפים כדי להגביל את כמה השרתים מתוקנים בכל עת.
אם FBAR יכול’לא להחזיר שרת למצב בריא, הכישלון מועבר לכלי שנקרא סייבורג. סייבורג יכול לבצע תמציות ברמה נמוכה יותר כמו שדרוגי קושחה או גרעינים, ולהחזיר מחדש. אם הבעיה דורשת תיקון ידני מטכנאי, המערכת יוצרת כרטיס במערכת הכרטיסים לתיקון שלנו.
אנו מתעמקים בתהליך זה בעיתון שלנו “תיקון חומרה בקנה מידה.”
כיצד אנו ממזערים את ההשפעה השלילית של דיווח שגיאות על ביצועי השרת
MachineChecker מגלה כשלים בחומרה על ידי בדיקת יומני שרת שונים עבור דוחות השגיאה. בדרך כלל, כאשר מתרחשת שגיאת חומרה, היא תתגלה על ידי המערכת (e.ז., כישלון בדיקת זוגיות), ואות הפרעה יישלח למעבד לטיפול ורישום השגיאה.
מכיוון שאותות ההפרעה הללו נחשבים לאותות בעלות עדיפות גבוהה, המעבד יפסיק את פעולתו הרגילה ויקדיש את תשומת ליבו לטיפול בשגיאה. אבל יש לכך השפעה על ביצועים שליליים על השרת. לקבלת שגיאות זיכרון ניתנות לתיקון, למשל, הפרעה של ניהול מערכות הפרעות מסורתיות (SMI) תעכב את כל ליבות ה- CPU, בעוד שההפרעה של בדיקת המכונה הניתנת לתיקון (CMCI) הייתה מעכבת רק אחת מליבות ה- CPU, ותשאיר את שאר ליבות ה- CPU הזמינות להפעלה רגילה.
למרות שדוכני ה- CPU בדרך כלל נמשכים רק כמה מאות אלפיות השנייה, הם עדיין יכולים לשבש את השירותים הרגישים לחביון. בקנה מידה זה אומר שהפרעות על כמה מכונות יכולות להשפיע לרעה על הביצועים ברמת השירות.
כדי למזער את השפעת הביצועים שנגרמה על ידי דיווח שגיאות, יישמנו מנגנון היברידי לדיווח על שגיאות זיכרון המשתמש הן ב- CMCI והן ב- SMI מבלי לאבד את הדיוק מבחינת מספר שגיאות הזיכרון הניתנות לתיקון.
כיצד אנו ממנפים למידת מכונה כדי לחזות תיקונים
מכיוון שאנו מציגים לעיתים קרובות תצורות חומרה ותוכנה חדשות למרכזי הנתונים שלנו, עלינו גם ליצור כללים חדשים למערכת ההתרגלות האוטומטית שלנו.
כאשר המערכת האוטומטית אינה יכולה לתקן כשל בחומרה, לבעיה מוקצה כרטיס לתיקון ידני. חומרה ותוכנה חדשים פירושם סוגים חדשים של כשלים פוטנציאליים שיש להתייחס אליהם. אבל יכול להיות פער בין חומרה או תוכנה חדשים מיושמים וכאשר אנו מסוגלים לשלב כללי תיקון חדשים. במהלך פער זה, כמה כרטיסי תיקון עשויים להיות מסווגים כ- “לא מאובחן,” כלומר המערכת לא’T הציע פעולת תיקון, או “מאובחן שגוי,” כלומר, פעולת התיקון המוצעת היא’לא יעיל. המשמעות היא שיותר עבודה ומערכת זמן השבתה ואילו טכנאים צריכים לאבחן את הנושא עצמם.
כדי לסגור את הפער, בנינו מסגרת למידת מכונה שלומדת מאיך כישלונות תוקנו בעבר ומנסה לחזות אילו תיקונים יהיו נחוצים לכרטיסי תיקון לא מאובחנים ומאובחנים באופן שגוי. בהתבסס על העלות והתועלת מהתחזיות השגויות והנכונות, אנו מקצים סף על אמון החיזוי לכל פעולת תיקון ומייעל את סדר פעולות התיקון. לדוגמה, במקרים מסוימים היינו מעדיפים לנסות אתחול מחדש או לשדרג תחילה כי סוגים אלה של תיקונים לא’t לדרוש כל תיקון חומרה פיזית ולקח פחות זמן לסיים, ולכן האלגוריתם צריך להמליץ תחילה על פעולה מסוג זה. באופן פשוט, למידת מכונות מאפשרת לנו לא רק לחזות כיצד לתקן סוגיה לא מאובחנת או מאובחנת באופן שגוי, אלא גם לתעדף את החשובים ביותר.
איך אנחנו’ניתוח סיבת שורש אוטומטית ברמת הצי
בנוסף ליומני שרתים שמקליטים אתחול מחדש, גרעינים נבהלים מהזכר וכו ‘., יש גם יומני תוכנה וכלים במערכת הייצור שלנו. אבל ההיקף והמורכבות של כל אלה פירושו’קשה לבחון את כל היומנים במשותף כדי למצוא מתאם ביניהם.
יישמנו כלי מדרג-סיבוב-ניתוח-ניתוח (RCA) הממיין דרך מיליוני ערכי יומן (כל אחד מהם שתואר על ידי מאות עמודות) כדי למצוא מתאם קל להבנה וניתן לפעולה.
עם נתונים שקדמו לנתונים באמצעות SCUBA, מסד נתונים בזיכרון בזמן אמת, שיפרנו משמעותית את המדרגיות של אלגוריתם כריית תבניות מסורתי, צמיחת FP, למציאת מתאם במסגרת RCA זו. הוספנו גם קבוצה של פילטרים על המתאם המדווח כדי לשפר את הפרשנות של התוצאה. פרשנו את המנתח הזה באופן נרחב בפייסבוק עבור RCA בקצב כישלון רכיב חומרה, אתחול שרת בלתי צפוי וכישלונות תוכנה.
מי צריך את HP ו- Dell? פייסבוק מעצבת כעת את כל השרתים שלה
למרכז הנתונים החדש ביותר של פייסבוק לא יהיה שרתי OEM.
ג’ון ברודקין – 14 בפברואר 2013 10:35 UTC
הערות קוראים
לפני כמעט שנתיים, פייסבוק חשפה את מה שכונה פרויקט המחשב הפתוח. הרעיון היה לשתף עיצובים עבור חומרת מרכז נתונים כמו שרתים, אחסון ומתלים, כך שחברות יוכלו לבנות ציוד משלהן במקום להסתמך על האפשרויות הצרות המסופקות על ידי ספקי חומרה.
בעוד שמישהו יכול להפיק תועלת, פייסבוק הובילה את הדרך בפריסת החומרה המותאמת אישית במרכזי נתונים משלה. הפרויקט התקדם כעת עד כדי כך שכל השרתים החדשים שפרסו על ידי פייסבוק תוכננו על ידי פייסבוק עצמה או תוכננו על ידי אחרים למפרט התובעני של פייסבוק. ציוד מותאם אישית היום תופס יותר ממחצית מהציוד במרכזי נתונים בפייסבוק. בשלב הבא, פייסבוק תפתח מרכז נתונים בגודל 290,000 מ”ר בשוודיה מלאה עם שרתים בעיצוב משלה, ראשונה לחברה.
פרנק פרנקובסקי, סמנכ”ל עיצוב חומרה ופעולות שרשרת אספקה בפייסבוק, אמר ל- ARS בראיון טלפוני השבוע כי “זה הראשון בו עומדים להיות לנו 100 אחוז שרתי מחשוב פתוחים בפנים.”.
בדומה למרכזי הנתונים הקיימים של פייסבוק בצפון קרוליינה ובאורגון, זה שיגיע לרשת בקיץ הזה בלולה, שבדיה יהיו בעשר עשרות אלפי שרתים. פייסבוק גם מציבה את ציודו במרחב של מרכז נתונים מושכרים כדי לשמור על נוכחות בקרבת משתמשים ברחבי העולם, כולל ב -11 אתרי קולוקציה בארה”ב. גורמים שונים תורמים לבחירת המיקומים: מיסים, עבודה טכנית זמינה, מקור ועלות הכוח והאקלים. פייסבוק לא משתמשת במיזוג אוויר מסורתי, במקום זאת מסתמכת לחלוטין על “אוויר חיצוני ומערכת קירור אידוי ייחודית כדי לשמור על השרתים שלנו פשוט קרירים מספיק”, אמר פרנקובסקי.
חוסך כסף על ידי הפשטת מה שאתה לא’צורך
בסדר גודל של פייסבוק, זול יותר לשמור על מרכזי נתונים משלה מאשר לסמוך על ספקי שירותי ענן, הוא ציין. יתר על כן, זה גם זול יותר לפייסבוק להימנע מספקי שרת מסורתיים.
בדומה לגוגל, פייסבוק מתכננת שרתים משלה ומגבירה אותם בנויים על ידי ODMS (יצרני עיצוב מקוריים) בטייוואן ובסין, ולא יצרני ציוד מקורי (יצרני ציוד מקורי) כמו HP או Dell. על ידי גלגול משלה, פייסבוק מבטלת את מה שפרנקובסקי מכנה “בידול מיותר”, תכונות חומרה שהופכות את השרתים למיוחדים אך אל תועיל לפייסבוק.
זה יכול להיות פשוט כמו לוחית הפלסטיק בשרת עם לוגו מותג, מכיוון שהחומר הנוסף הזה מאלץ את האוהדים לעבוד קשה יותר. פרנקובסקי אמר כי מחקר הראה שרת OEM סטנדרטי בגודל 1U “השתמש ב 28 וואט של כוח מאוורר כדי למשוך אוויר דרך העכבה שנגרמה על ידי אותו לוח פלסטיק”, ואילו שרת המחשוב הפתוח המקביל השתמש רק בשלושה וואט למטרה זו.
מה עוד פייסבוק מתפשטת? פרנקובסקי אמר כי “הרבה לוחות אם היום מגיעים עם הרבה Goop Management. זה המונח הטכני שאני אוהב להשתמש בו.”GOOP זה יכול להיות מנוע ניהול מחזור החיים המשולב של HP או כלי ניהול שרתים מרחוק של Dell.
תכונות אלה יכולות בהחלט להועיל ללקוחות רבים, במיוחד אם הם סטנדרטיים על ספק אחד. אבל בגודל של פייסבוק, זה לא הגיוני להסתמך על ספק אחד בלבד, מכיוון ש”התקלה בעיצוב עשויה להוריד חלק גדול מהצי שלך או מכיוון שמחסור בחלק יכול להכות את היכולת שלך לספק מוצר למרכזי הנתונים שלך.”
בפייסבוק יש כלי ניהול מרכז נתונים משלה, כך שהדברים ש- HP או Dell מייצרת מיותרים. מוצר ספק “מגיע עם קבוצה משלו של ממשקי משתמשים, קבוצת ממשקי API ו- GUI למדי שיספרו לך כמה מהר המעריצים מסתובבים וכמה דברים שבאופן כללי רוב הלקוחות מפרסים את הדברים האלה ב- Scale View כהבחנה מיותרת”, אמר פרנקובסקי. “זה שונה באופן שלא משנה לי. מכשיר נוסף זה בלוח האם, לא רק שעולה כסף לרכוש אותו מנקודת מבט של חומרים, אלא שהוא גם גורם למורכבות בפעולות.”
נתיב ל- HP ו- Dell: הסתגל לחישוב פתוח
זה לא אומר שפייסבוק נשבע את HP ו- Dell Forever. “רוב הציוד החדש שלנו בנוי על ידי ODMs כמו Quanta”, אמרה החברה בתגובה בדואר אלקטרוני לאחת משאלות המעקב שלנו. “We do multi-source all our gear, and if an OEM can build to our standards and bring it in within 5 percent, then they are usually in those multi-source discussions.”
HP ו- Dell החלו לייצר עיצובים התואמים את מפרטי המחשוב לפתוח, ופייסבוק אמרה שהיא בודקת אחת מ- HP כדי לראות אם זה יכול לבצע את החיתוך. עם זאת, החברה אישרה כי מרכז הנתונים החדש שלה בשבדיה לא יכלול שרתי OEM כלשהי בעת פתיחת.
בפייסבוק אומרים כי היא מקבלת 24 אחוז חיסכון כספי מלהיות תשתית בעלות נמוכה יותר, והיא חוסכת 38 אחוזים בעלויות תפעול מתמשכות כתוצאה מבניית דברים משלה. השרתים המעוצבים בהתאמה אישית של פייסבוק אינם מריצים עומסי עבודה שונים מכפי שכל שרת אחר עשוי-הם פשוט מריצים אותם בצורה יעילה יותר.
פרנקובסקי אמר כי “שרת HP או Dell, או Server Compute, הם יכולים בדרך כלל להריץ את אותם עומסי עבודה”, אמר פרנקובסקי. “זה רק עניין של כמה עבודה אתה עושה לכל וואט לדולר.”
פייסבוק לא וירטואליזציה של השרתים שלה, מכיוון שהתוכנה שלה כבר צורכת את כל משאבי החומרה, כלומר וירטואליזציה תביא לעונש ביצועים ללא רווח ביעילות.
ענקית המדיה החברתית פרסמה את העיצובים והמפרט של שרתים, לוחות אם וציוד אחר משלה. לדוגמה, לוח האם “טחנת הרוח” משתמש בשני מעבדי אינטל Xeon E5-2600, עם עד שמונה ליבות לכל מעבד.
גיליון המפרט של פייסבוק מפרק אותה:
- 2 מעבדי סדרה של Intel® Xeon® E5-2600 (LGA2011) עד 115W
- 2 Intel QuickPath Interpaty Interpath (QPI) מקשר עד 8 GT/S/כיוון
- עד 8 ליבות למעבד (עד 16 חוטים עם טכנולוגיית הברגה יתר)
- מטמון של עד 20 מגה -בייט
- מצב מעבד יחיד
- DDR3 תמיכה בזיכרון מצורף ישיר ב- CPU0 ו- CPU1 עם:
- 4 ערוץ DDR3 ממשק זיכרון רשום במעבדים 0 ו- 1
- 2 משבצות DDR3 לערוץ למעבד (בסך הכל 16 DIMMs בלוח האם)
- Rdimm/lv-rdimm (1.5V/1.35V), LRDIMM ו- ECC UDIMM/LV-UDIMM (1.5V/1.35V)
- דרגת דרגות יחידה, כפולה ורביעית
- מהירויות DDR3 של 800/1066/1333/1600 מגה הרץ
- עד לזיכרון מקסימלי של 512 ג’יגה -בייט עם DIMMs של 32 ג’יגה -בייט
ועכשיו תרשים של לוח האם:
מפרטי לוח האם האלה פורסמו לפני כמעט שנה, אך הם עדיין הסטנדרטיים. שרת מסד נתונים חדש שעוצב לאחרונה “Dragonstone” ושרת האינטרנט “Winterfell” מסתמכים על לוח האם של טחנת הרוח, אם כי מעבדי אינטל חדשים יותר עשויים לפגוע בהפקה בפייסבוק בהמשך השנה.
עיצובי השרת של פייסבוק מותאמים למשימות שונות. כפי שדווח בחודש שעבר את טימוטי פריקט מורגן של הפנקס, פונקציות מסד נתונים מסוימות בפייסבוק דורשות ספקי כוח מיותרים, ואילו משימות אחרות יכולות להיות מטופלות על ידי שרתים עם מספר צמתי מחשוב חולקים אספקת חשמל יחידה.
מרכזי נתונים משתמשים בתערובת של אחסון פלאש ודיסקים מסתובבים מסורתיים, כאשר פלאש מגיש פונקציונליות בפייסבוק הדורשת את המהירויות המהירות ביותר הזמינות. שרתי מסד נתונים משתמשים בכל הפלאש. לשרתי אינטרנט בדרך כלל יש מעבדים מהירים באמת, עם כמויות אחסון נמוכות יחסית ו- RAM. 16GB הוא כמות טיפוסית של RAM, אמר פרנקובסקי. לאינטל ולצ’יפס AMD שניהם נוכחות בציוד הפייסבוק.
ופייסבוק עמוסה בהרבה “אחסון קר”, דברים שנכתבו פעם לעיתים רחוקות שוב. אפילו שם, פרנקובסקי רוצה להשתמש יותר ויותר בפלאש בגלל שיעור הכישלון של דיסקים מסתובבים. עם עשרות אלפי מכשירים המפעילים, “אנחנו לא רוצים שטכנאים מתרוצצים להחליף כוננים קשיחים”, אמר.
פלאש ברמה של מרכז נתונים הוא בדרך כלל יקר בהרבה מאשר דיסקים מסתובבים, אך פרנקובסקי אומר שאולי יש דרך להפוך את זה לשווה את זה. “אם אתה משתמש בכיתה של NAND [Flash] בכונני אגודל, שנחשבת בדרך כלל לטאטא או לגרוטות, ואתה משתמש בסוג מגניב באמת של אלגוריתם בקר כדי לאפיין אילו תאים טובים ואילו תאים לא, אתה יכול לבנות פיתרון אחסון קר בעל ביצועים גבוהים באמת בעלות נמוכה מאוד,” הוא אמר, הוא אמר.
לקיחת גמישות של מרכז נתונים עד קיצוני
פרנקובסקי רוצה עיצובים כל כך גמישים עד שניתן להחליף רכיבים בודדים בתגובה לשינוי הביקוש. מאמץ אחד לאורך הקו הזה הוא המפרט החדש של “חיבוק קבוצתי” של פייסבוק ללוחות אם, שיכול להכיל מעבדים מספקים רבים. AMD ו- Intel, כמו גם ספקי שבבי ARM הוחלו במיקרו וקלקסדה, כבר התחייבו לתמוך בלוחות אלה עם מוצרי SOC (System On ChIP) חדשים.
זה היה אחד מכמה פריטי חדשות שיצאו מפסגת המחשוב הפתוחה בחודש שעבר בסנטה קלרה, קליפורניה. בסך הכל, ההודעות מצביעות על עתיד בו הלקוחות יכולים “לשדרג דרך דורות מרובים של מעבדים מבלי שיצטרכו להחליף את לוחות האם או את הרשתות הנמצאות”, ציין פרנקובסקי בפוסט בבלוג.
קלקסדה העלתה לוח שרת מבוסס זרוע שיכול להחליק למערכת האחסון של הכספת הפתוחה של פייסבוק, ששמו “נוקס.”” זה הופך את מכשיר האחסון לשרת אחסון ומבטל את הצורך בשרת נפרד כדי לשלוט בכונן הקשיח, “אמר פרנקובסקי. (פייסבוק לא משתמשת בשרתי ARM כיום מכיוון שהיא דורשת תמיכה של 64 סיביות, אך פרנקובסקי אומר “הדברים נעשים מעניינים” בטכנולוגיית ARM.)
אינטל תרמה גם עיצובים לטכנולוגיית פוטוניקה של סיליקון הקרובה שתאפשר חיבורים של 100 ג’יגה -ביט לשנייה, פי 10 מהר יותר מכפי ש- Ethernet Connections משתמשים בהם במרכזי הנתונים שלה כיום. עם החביון הנמוך שמאפשר מהירות מסוג זה, הלקוחות עשויים להיות מסוגלים להפריד בין מעבדים, דרמה ואחסון לחלקים שונים של המתלה ופשוט להוסיף או לחסר רכיבים במקום שרתים שלמים בעת הצורך, אמר פרנקובסקי. בתרחיש זה, מארחים מרובים יכולים לשתף מערכת פלאש, ולשפר את היעילות.
למרות כל העיצובים המותאמים אישית הללו שמגיעים מחוץ לעולם ה- OEM, HP ו- Dell לא נותרים מאחור לחלוטין. הם הסתגלו לנסות ללכוד כמה לקוחות שרוצים את הגמישות של עיצובים מחשוב פתוחים. מנהלת Dell העבירה את אחד המפתח במפתח בפסגת המחשוב הפתוחה השנה, וגם HP וגם Dell בשנה שעברה הודיעו על “שרת גיליונות נקייה ואחסון” התואמים למפרט “המתלה הפתוח” של פרויקט Open Compute “.
בנוסף להיות טוב לפייסבוק, פרנקובסקי מקווה שהמחשוב הפתוח יועיל ללקוחות השרת באופן כללי. Fidelity ו- Goldman Sachs הם בין אלה שמשתמשים בעיצובים מותאמים אישית המותאמים לעומסי העבודה שלהם כתוצאה ממחשוב פתוח. לקוחות קטנים יותר עשויים להיות מסוגלים להפיק תועלת, גם אם הם שוכרים מקום ממרכז נתונים בו הם לא יכולים לשנות את העיצוב של השרת או המתלה, הוא אמר. הם יכולים “לקחת אבני בניין [של מחשוב פתוח] ולבנות אותם מחדש לעיצובים פיזיים המשתלבים בחריצי השרת שלהם”, אמר פרנקובסקי.
“התעשייה משתנה ומשתנה בצורה טובה, לטובת הצרכנים, בגלל מחשוב פתוח”, אמר.