ساخت یک شبکه نوری انعطاف پذیر برای خوشه های قدرت محاسباتی هوش مصنوعی

Apr 08, 2026

پیام بگذارید

مسیریابی انعطاف‌پذیر فیزیکی بر اساس Shuffle قطعی

همانطور که خوشه‌های هوش مصنوعی به مقیاس‌پذیری ادامه می‌دهند و مراکز داده با سرعتی سریع گسترش می‌یابند، معماری شبکه به طور طبیعی از طرح‌های سنتی فراتر رفته است. توپولوژی های Leaf-Spine و Dragonfly در حال تبدیل شدن به یک هنجار هستند. روی کاغذ، آنها کارآمد و مدرن به نظر می رسند. با این حال، در عمل، تیم‌های عملیات اغلب با واقعیت متفاوتی مواجه می‌شوند{4}}چیزی که واقعاً باعث ایجاد مشکل می‌شود، خود توپولوژی نیست، بلکه حجم زیاد پچ‌کوردها است. هنگامی که با هزاران اتصال سر و کار دارید، مدیریت به سرعت ناکارآمد می شود. و زمانی که یک نقطه از کار بیفتد، می تواند کل پیوند را از بین ببرد. نادیده گرفتن چنین خطری سخت است.

 

اینجاست که ایده پشت Infinity Shuffle OXC شروع به درک می کند. به‌جای پیروی از مدل معمولی-به-نقطه-که در آن یک مسیر همه چیز را حمل می‌کند{4}}کانال‌های پر سرعت-را از هم جدا می‌کند و آنها را در چندین مسیر Spine در لایه فیزیکی توزیع می‌کند. به عبارت ساده، از قرار دادن تمام تخم مرغ ها در یک سبد جلوگیری می کند. هنگامی که یک شکست رخ می دهد، سیستم به طور کامل فرو نمی ریزد. به سادگی با ظرفیت کمی کاهش یافته کار می کند و خدمات به کار خود ادامه می دهند.

 

به عنوان مثال اتصال 1.6T را در نظر بگیرید. این کانال به هشت کانال 200G مستقل تقسیم شده است که هر کدام از مسیرهای متفاوتی عبور می کنند. اگر یک ماژول یا فیبر از کار بیفتد، تنها کسری از پهنای باند-حدود 12.5٪- تحت تأثیر قرار می‌گیرد. برای بارهای آموزشی هوش مصنوعی، این نوع تخریب معمولاً قابل مدیریت است. کاهش جزئی سرعت نسبت به قطع کامل ارجحیت دارد.

 

از منظر عملیات، این نیز ریتم تعمیر و نگهداری را تغییر می دهد. اجزای معیوب دیگر نیازی به مداخله فوری یک شبه ندارند. آنها را می‌توان در طول پنجره‌های نگهداری برنامه‌ریزی‌شده، که در محیط‌های-در مقیاس بزرگ پایدارتر است، مدیریت کرد. در عین حال، کاهش ماژول های نوری سیستم کلی را ساده می کند و به جای پیچیده کردن آن، ثبات را بهبود می بخشد. از بسیاری جهات، این رویکرد توزیع‌شده به منطق مهندسی واقعی-جهان نزدیک‌تر است تا به کمال نظری.

 

در لایه فیزیکی، راه حل از یک طراحی ترکیبی فیبر از قبل خاتمه یافته{{1} و با چگالی بالا استفاده می کند، که افت درج را تا حدود 0.05 دسی بل حفظ می کند. این سیستم برای پشتیبانی از شبکه های 400G، 800G و 1.6T با بودجه نوری کافی طراحی شده است، در حالی که انحراف کانال و ایزوله را مطابق با استانداردهای IEEE 802.3 حفظ می کند. هیچ چیز بیش از حد پر زرق و برقی در مورد آن وجود ندارد-اما عملی، سازگار، و ساخته شده است تا در مقیاس پایین باقی بماند.

 

چهار بعد هسته ای طراحی شده برای نیازمندی های هوش مصنوعی Hyperscale

1. یکپارچه سازی اکوسیستم بدون درز و توپولوژی های استقرار انعطاف پذیر

640 640 1

Infinity Shuffle OXC مستقیماً با فریم‌های توزیع سری GPX (GPX51، GPX58، GPX59، GPX61، GPX62، GPX70) بدون نیاز به جعبه‌های آداپتور شخص ثالث ادغام می‌شود. به طور بومی از اتصالات MPO/MTP®، MMC، SN{8}}MT، و همچنین اتصال مستقیم فیبر برهنه پشتیبانی می‌کند.

دو توپولوژی استقرار در دسترس است:

درون خطی Shuffle: اتصالات ستون فقرات از پشت وارد می‌شوند (معمولاً با سوئیچ‌های ستون فقرات بالای--همتراز هستند)، در حالی که اتصالات برگ از جلو خارج می‌شوند. این پیکربندی هم از طرح‌های کاست مدولار-و هم از قالب‌های پانل کامل 1RU/2RU پشتیبانی می‌کند. این جداسازی راهروهای گرم/سرد را روشن می کند و مسیریابی قطعی کابل عقب-به-را تضمین می کند.

در کنار هم--در کنار هم قرار گرفتن: تمام اتصالات سوئیچ ستون فقرات در سمت چپ شاسی یا پانل یکپارچه شده اند، در حالی که اتصالات سوئیچ برگ از سمت راست خارج می شوند. این طرح به ویژه برای قاب های توزیع فیبر متمرکز (FDF) مناسب است، جایی که مدیریت کابل افقی بین مناطق ستون فقرات و برگ باید به حداقل برسد.

هر دو توپولوژی از اتصالات سریال دسترسی به عقب و اتصالات موازی دسترسی از جلو پشتیبانی می‌کنند که به طور قابل توجهی استفاده از فضای رک را بهبود می‌بخشد و با معماری‌های کابل‌کشی مراکز داده متنوع سازگار می‌شود.

 

2. بهینه سازی هزینه و کاهش ریسک

از منظر اقتصادی، ادغام در سطوح 400G، 800G و 1.6T تعداد سوئیچ های مورد نیاز را از 24 به 8 و ماژول های نوری را از 1280 به 320 کاهش می دهد. این به طور مستقیم مصرف برق و هزینه سرمایه را کاهش می دهد و در کل صرفه جویی در هزینه تا 40٪ می رسد.

از نقطه نظر ریسک، سیستم‌های فیبر بسته‌بندی شده سنتی نقطه‌های شکست را معرفی می‌کنند-به عنوان مثال، آسیب به یک MPO{10}}16 می‌تواند بلافاصله منجر به از دست دادن یک پیوند کامل 1.6T شود. در مقابل، معماری Shuffle همان ظرفیت 1.6T را در هشت مسیر فیزیکی مستقل توزیع می کند. از نظر آماری، خرابی‌ها به کانال‌های جداگانه جدا می‌شوند و تأثیر را به 1/8 پهنای باند کل محدود می‌کنند. خوشه‌های آموزشی هوش مصنوعی می‌توانند در حالی که اتصال RDMA را حفظ می‌کنند و از رویدادهای همگرایی مجدد شبکه در مقیاس بزرگ جلوگیری می‌کنند، با حدود 87.5 درصد ظرفیت به کار خود ادامه دهند.

 

3. صنعتی-ساخت دقیق

هر واحد OXC بر روی خطوط تولید خودکار تولید می شود که شامل برش بستر (0.5± میلی متر)، مسیریابی فیبر بیونیک (± 0.1 میلی متر) و توزیع دقیق (±0.5 میلی متر) است.

طراحی مسیریابی بیونیک، جداسازی فیزیکی دقیق کانال را تضمین می‌کند-از تداخل بین هشت کانال 200G در یک پیوند 1.6T جلوگیری می‌کند-در حالی که طول فیبر برابر را برای حذف انحراف سیگنال حفظ می‌کند. همه واحدها قبل از تحویل تحت اعتبارسنجی نوری جامعی قرار می‌گیرند، خطر خطاهای خاتمه میدان را از بین می‌برد و از مشکلات عدم تعادل کانال مرتبط با سیگنال‌دهی PAM4 با سرعت بالا جلوگیری می‌کند.

 

4. مطابقت با استانداردهای بین المللی

Infinity Shuffle OXC با استانداردهای بین المللی اصلی، از جمله Telcordia GR-63، GR-1435 (MPO)، IEC 61300، IEC 61753-1، و IEC 61754-7 / TIA-604-5 مطابقت دارد.

مدار نوری منعطف از یک لایه لایه پلی‌آمید با پوشش محافظ منسجم استفاده می‌کند که حداکثر ابعاد تا 1000 × 800 میلی‌متر را پشتیبانی می‌کند. یک طرح تک لایه می‌تواند بیش از 1200 هسته فیبر را در خود جای دهد، که نیازهای چگالی در استقرارهای فوق مقیاس را برآورده می‌کند.

 

5. یکپارچگی سیگنال چند کانالی

این زیرلایه از فیبر روبانی 250 میکرومتر، فیبر تک حالته 200 میکرومتری (G657.A1/A2) و نسل بعدی فیبر 180 میکرومتری پشتیبانی می‌کند.

عملکرد نوری به شدت کنترل می‌شود، با تلفات ورودی کمتر یا مساوی 0.12 دسی‌بل (-کیفیت بالا UPC/APC)، تطبیق تصادفی 97 درصد کمتر یا مساوی 0.25 دسی‌بل، و تلفات برگشتی بیشتر یا مساوی 65 دسی‌بل (APC برابر با 0) و بزرگ‌تر از 0. این امر توزیع یکنواخت تلفات را در تمام هشت کانال در یک پیوند 1.6T تضمین می‌کند، نیازهای کالیبراسیون KP4 FEC را برآورده می‌کند و بازده انرژی را در مقیاس حفظ می‌کند.

شما کلمات Humanizer کافی ندارید. برنامه Surfer خود را ارتقا دهید.

 

دقیقاً با سه سناریو اصلی برنامه هماهنگ شده است

640

1. بهینه سازی برگ- ستون فقرات با قابلیت اطمینان تقویت شده ستون فقرات

در خوشه‌های آموزشی هوش مصنوعی، Infinity Shuffle OXC مسیریابی متقابل قطعی- بین لایه‌های ستون فقرات و برگ را ممکن می‌سازد. هنگامی که در یک پیکربندی Inline Shuffle مستقر می شود-اتصالات ستون فقرات که از عقب وارد می شوند و اتصالات برگ از جلو خارج می شوند-یک ساختار راهرو گرم/سرد تمیز و یک طرح کابل کشی قابل پیش بینی ایجاد می کند.

این طراحی به طور طبیعی با معماری های ناب ستون فقرات هماهنگ است. یک پیوند 1.6T به صورت فیزیکی بین هشت سوئیچ Spine توزیع شده است. اگر یک سوئیچ Spine{3}}به عنوان مثال، Spine #3-نیاز به تعمیر و نگهداری دارد، تنها یک کانال 200G (12.5٪ از کل پهنای باند) از طریق ECMP به یک مسیر معادل هدایت می شود. ظرفیت باقیمانده به کار خود ادامه می دهد و به بارهای آموزشی اجازه می دهد تا تقریباً 1.4T توان عملیاتی را بدون اختلال حفظ کنند. تعمیر و نگهداری می تواند بدون تأثیر بر خدمات اصلی ادامه یابد.

 

2. ساده‌سازی توپولوژی‌های سنجاقک از طریق توزیع فیزیکی{1}}

در محیط‌های محاسباتی با کارایی بالا (HPC) با ده‌ها هزار گره، توپولوژی‌های سنتی پر-مشبک Dragonfly به کابل‌کشی پیچیده درون گروهی- نیاز دارند. با Infinity Shuffle OXC، درهم‌آمیزی بین گروهی در سطح کارخانه تکمیل می‌شود و پیچیدگی سایت را به میزان قابل توجهی کاهش می‌دهد.

هنگامی که در یک قاب توزیع فیبر متمرکز با استفاده از توپولوژی Shuffle موازی مستقر می شود، اتصالات ستون فقرات در سمت چپ تحکیم می شوند در حالی که اتصالات برگ از سمت راست هدایت می شوند. این باعث ایجاد جدایی فیزیکی واضح بین لایه های شبکه می شود. مسیریابی قطعی تضمین می‌کند که در یک پیوند 1.6T، هر هشت کانال 200G مسیرهای فیزیکی مستقل-در میان سوئیچ‌ها، فیبرها و کانکتورهای مختلف-را دنبال می‌کنند و به طور موثر خطرات خرابی مرتبط با پیوندهای ترانک همراه را حذف می‌کنند.

 

3. آینده{1}}آماده برای 800G و فراتر از آن

همانطور که پهنای باند شبکه به سمت 1.6T و 3.2T (8 × 200G یا 8 × 400G) تکامل می یابد، ارزش انعطاف پذیری معماری های Shuffle حتی بیشتر می شود. در استقرار 3.2T توزیع شده در سراسر سوئیچ های Spine (16 × 200G)، یک شکست کانال تنها منجر به کاهش 6.25٪ پهنای باند می شود.

هنگامی که زیرساخت نوری Shuffle مستقر شد، ارتقاهای آینده فقط نیاز به جایگزینی ماژول نوری دارند، بدون تغییر در لایه فیزیکی. زیرلایه به طور طبیعی از الیاف-180 میکرومتر{3} بسیار ظریف نسل بعدی پشتیبانی می‌کند و از سازگاری با همه{4}}تکنولوژی‌های نوری آینده اطمینان می‌دهد. طبق-نرخ داده‌های کانال افزایش می‌یابد-همراه با مصرف انرژی و احتمال خرابی-این معماری پایه‌ای پایدار را فراهم می‌کند و به طور موثر ریسک بالاتر مرتبط با 800G و فراتر از آن را جذب می‌کند و در عین حال سرویس بدون وقفه را حفظ می‌کند.

 

از پیچیدگی دستی تا قابلیت اطمینان قطعی

مفهوم "Shuffle" در مورد تصادفی نیست. این یک توزیع قطعی از کانال‌های پر سرعت-در سراسر اتصالات ستون فقرات مستقل از لحاظ فیزیکی است. عملیات سنتی متکی به مدیریت دستی هزاران پیوند فیبر است-رویکردی که هم ناکارآمد و هم مستعد خطا-است. در مقابل، این معماری اتصال را در لایه فیزیکی بازسازی می کند و وضوح عملیاتی و قابلیت اطمینان سیستم را بهبود می بخشد.

با توزیع یکنواخت هشت کانال 200G در هشت سوئیچ Spine، سیستم تضمین می‌کند که خرابی‌ها-چه در ماژول‌های نوری، فیبرها یا سوئیچ‌ها{2}}به‌جای قطعی‌های سیستمیک، رویدادهای ایزوله باقی بمانند. این امر اساساً از اختلالات{4}}در مقیاس بزرگ در شبکه‌های نوری مبتنی بر هوش مصنوعی- جلوگیری می‌کند.

 

Infinity Shuffle OXC چه بهینه‌سازی معماری‌های Leaf-با لایه ستون فقرات باریک‌تر، ساده‌سازی استقرار Dragonfly از طریق کابل‌کشی ساختاریافته، یا آماده‌سازی برای مقیاس‌بندی 1.6T/3.2T در آینده با-تحمل خطا داخلی، Infinity Shuffle OXC-بازدهی{5} و{4}بالایی{5} و بازدهی بالا ارائه می‌دهد. مقرون به صرفه-پایه کابل کشی موثر برای مراکز داده فوق مقیاس-با اطمینان از اینکه بارهای کاری محاسبه شده توسط محدودیت های زیرساخت نوری بدون وقفه باقی می مانند.

 

ارسال درخواست