Rețele de cabluri de fibră optică pentru centrele de date AI: un ghid de-optimizare de înaltă performanță

Apr 24, 2026

Lăsaţi un mesaj


1. De ce cablul de fibră optică este baza potrivită pentru centrele de date AI

 

În contextul infrastructurii moderne de inteligență artificială, cablul de fibră optică a devenit mijlocul de interconectare de bază pentru centrele de date la scară largă-{1}} nu pentru că alternativele de cupru au dispărut, ci pentru că cerințele cumulate de lățime de bandă, acoperire, stabilitate latenței și imunitate EMI creează un caz tehnic compus pe care cuprul nu îl poate aborda la scara clusterului AI.

Sarcinile de lucru de antrenament AI, în special modelele de limbaj mari, distribuie calculul pe mii de GPU-uri care trebuie să facă schimb de parametri de gradient la fiecare pas de antrenament. O estimare larg citată din industrie sugerează că latența rețelei poate reprezenta aproximativ 20-30% din timpul total de antrenament al ceasului de perete-în curse mari distribuite.¹ Cu o singură campanie de antrenament care costă milioane de dolari, chiar și 50 ns de latență evitabilă - echivalent cu aproximativ 10 m de greutate financiară măsurabilă - transportată de fibră în exces. Transmisia de cupru nu poate egala lățimea de bandă, acoperirea sau scalabilitatea pe care aceste medii le cer.

 

1.1 Patru proprietăți care conduc la primul design optic-

Proprietate De ce contează pentru AI Fabrics Echivalent cupru
Densitatea lățimii de bandă Fibra cu un singur{0}mod transportă 100G–1,6T per pereche de fibre; trunchiurile MPO paralele măresc liniar densitatea portului fără re-conducte Depășește ~400G pe distanțe foarte scurte
Stabilitatea latenței GPU all-reduce operațiunile se desincronizează atunci când latența per-link variază pe un pod; traseele fibrelor pot fi potrivite cu lungimea-la nivelul contorului Ansamblurile DAC au lungimi mici fixe, greu de asortat într-o cameră mare
Imunitatea EMI Rack-urile de-densitate mare (30–100 kW) generează zgomot electromagnetic semnificativ care corupă semnalele de cupru la scară de mai multe-rack-uri Necesită ecranare, crește diametrul și greutatea cablului
Putere pe bit Un singur transceiver multimod OSFP 800G consumă în mod obișnuit cu 1–2 W mai puțin decât echivalentul său cu un singur-mod [2]; la 768 de transceiver per cluster de referință, economiile ajung la aproximativ 1,5 kW continuu DAC sau AOC activ la 800G utilizează o putere comparabilă fără avantaj de acoperire

2. Alegerea tipului potrivit de fibră: OM3, OM4, OM5 și OS2 în comparație

 

Decizia tipului de fibră stabilește plafonul pentru fiecare îmbunătățire a vitezei în următorii 15-20 de ani. Sticla durează mult mai mult decât transceiver-urile sau comutatoarele; a alege nota greșită astăzi înseamnă o re-tragere atunci când viteza crește. Iată cadrul complet de decizie.

NoastreGama de produse pentru cablu fibră optică pentru interioracoperă opțiunile OM4, OM5 și OS2. Criteriile de selecție de mai jos se aplică indiferent de furnizor.

 

2.1 Matricea de comparație completă

Fibră Miez Sacou 400G de acoperire 800G de acoperire Cel mai bun caz de utilizare
OM3 50 µm Aqua ~70 m (SR8) Nerecomandat Moștenirea numai - evitată în versiunile noi
OM4 50 µm Aqua ~100 m (SR8) ~60 m (SR8) GPU intra-rând-la-frunză; cel mai rentabil-pentru<100 m
OM5 50 µm Verde lime ~150 m ~100 m Multimod{0}}dozat de viitor; acceptă multiplexarea lungimii de undă SWDM pentru 1.6T
OS2 (SM) 9 µm Galben 2 km+ (FR4) 2 km+ (2xFR4) Spine links, inter-building, DCI - anywhere >100 m

Nota de cost:Fibra OS2 costă aproximativ la fel pe metru ca OM4 -, diferența de costuri trăiește în întregime în transceiver. Modul unic- necesită lasere DFB; multimodul utilizează VCSEL cu costuri mai mici-. Pentru GPU-pentru-rulări sub 100 m, multimodul câștigă pe $/port în aproape fiecare scenariu.

 

2.2 Regula de selecție a fibrelor în 30 de secunde

Scenariu Fibre recomandate Motivație
< 100 m, high density, cost-sensitive Optică paralelă OM4 + MPO-12/16 Cel mai bun $/port; acoperă majoritatea rulărilor de GPU-la-la început
< 150 m, planning beyond 800G OM5 (plătiți 15–25% primă o dată) Acceptă SWDM pentru viitorul 1.6T fără a re-trag de cablu
>150 m, orice coloană vertebrală sau legătură între clădire OS2 cu LC duplex sau MPO-12 Modul unic-este singura opțiune viabilă la aceste distanțe
În-rack, < 5 m DAC cupru Cele mai mici latențe și costuri; rezerva fibre pentru cursele unde cuprul nu poate ajunge

Pentru specificația OM5 cu bandă largă multimod, veziANSI/TIA-568.3-E(OM5 este definit oficial ca WBMMF în clauza 5).


3. Conectori și polaritate: MPO-12, MPO-16, MTP și obținerea corectă a tipului B față de tipul C

 

Odată ce vitezele conexiunii depășesc 400G, aproape fiecare conexiune este paralelă - mai multe benzi de fibră transportă fracțiuni din semnalul total. În acest moment, conectorii și polaritatea devin cauza principală a defecțiunilor de câmp, înaintea problemelor legate de calitatea fibrei sau de lungimea rutei.

 

3.1 MPO vs. MTP - Distincția practică

MPO (Multi-fibre Push-On) este standardul IEC 61754-7/TIA de bază pentru conectorii cu mai multe-fibre. MTP® este implementarea proiectată de US Conec - toleranțe mecanice mai strânse, o virolă plutitoare și, de obicei, pierderi de inserție mai mici. Fiecare conector MTP este compatibil-MPO; nu fiecare conector MPO îndeplinește specificațiile MTP. Pentru 400G și mai sus, specificați -pierdere MTP Elite redusă (sau echivalent) - ținta de pierdere de inserție este Mai mică sau egală cu 0,35 dB per pereche cuplată. Detaliile complete ale produsului MTP sunt disponibile pe pagina de produse US Conec MTP.

Glory Optics furnizează o gamă de ansambluri MTP/MPO și trunchiuri calificate la Mai puțin sau egal cu 0,35 dB per pereche cuplată pentru aplicații 400G și 800G.

MPO To MPO Fiber Cable

3.2 Numărul de fibre - MPO-8, MPO-12, MPO-16, MPO-24

 

Conector Benzile active Viteze comune Note cheie
MPO-8 4 Tx + 4 Rx 100G-SR4, 400G-DR4 Simplu; susținut pe scară largă; fara fibre de rezerva
MPO-12 8 active + 4 neutilizate 100G / 200G / 400G (SR8, DR4) Conector workhorse pentru majoritatea implementărilor actuale
MPO-16 8 Tx + 8 Rx (toate active) 800G-SR8 / DR8 Standardul de-de facto 800G - utilizează toate cele 16 fibre în mod activ
MPO-24 24 Trunchi / evaziune Trunchiuri de migrare cu densitate mare{0}; erupe la 2× MPO-12 sau 3× MPO-8

 

3.3 Managementul polarității: principala cauză a eșecurilor conexiunii

 

Nepotrivirile de polaritate sunt cauza principală a„linkul nu va apărea”bilete pe țesături AI. Trei metode de polaritate sunt definite de TIA-568.3-E:

Tip de polaritate Mecanism Utilizare recomandată
Tastați A (direct-) Fibra 1 la un capăt se conectează la fibra 1 la celălalt capăt Foarte rar folosit în construcții noi; numai moștenire
Tip B (perechi inversate) Tasta-până la cheie-împerecherea; perechile sunt schimbate de la un capăt la altul Alegere dominantă pentru implementările 40G până la 400G
Tip C (perechi răsturnate + rotirea tastelor) Tasta-sus la tastă-jos; utilizat cu modulele de schimb de perechi duplex- A apărut ca standard pentru optica paralelă 800G (SR8, DR8)

 

3.4 APC vs. UPC End-Față - De ce contează pentru pregătirea 1.6T

 

Conexiunile monomod-800G necesită din ce în ce mai mult conectori APC (contact fizic unghiular de 8 grade) pentru a suprima reflecția înapoi-sub pragul care degradează stabilitatea laserului DFB. Conectorii UPC funcționează pentru conexiuni multimodale și rulări mai scurte-mod unic, dar pentru modulele OSFP 2xFR4 - și orice vizează 1,6T - APC este specificația corectă.Critic: nu conectați niciodată conectorii APC la UPC.Acest lucru provoacă zdrobire optică și introduce 6–10 dB de pierdere de inserție - suficientă pentru a elimina orice legătură.


4. Arhitectura de rețea: Frontend vs. Backend, Leaf-Spine și DGX Reference Design

 

Fiecare centru de date AI operează două rețele distincte din punct de vedere logic, cu modele de trafic și cerințe de performanță fundamental diferite.

Construcțiile de clustere AI din -generația timpurie (2022-2023) au subestimat frecvent această distincție, direcționând traficul colectiv GPU prin infrastructura frontală{-generală -, un model care a dus în mod constant la degradarea performanței antrenamentului și a lățimii de bandă. Menținerea unei separări logice și fizice stricte este o cerință standard de proiectare în implementările din era 2026.

 

4.1 Frontend vs. Backend dintr-o privire

Atribut Rețeaua Frontend Backend AI Fabric
Model de trafic Nord-sud: trafic API utilizator, stocare, gestionare Est-vest: toate-reducerea, sincronizarea gradientului, comunicațiile colective
Topologie Ethernet cu 3-niveluri sau coloană de frunză coloană-optimizată a frunzei-; adesea InfiniBand NDR/XDR
Vitezele conexiunii (2026) 25G – 400G 400G – 800G acum; Implementări 1.6T începând cu 2026-2027
Densitatea fibrelor față de DC tradițional 1x linia de bază 4–5x (Wesco, 2024) până la 10x (Corning, 2024) [3]
Stilul de cablare Cablare structurată cu conexiuni încrucișate Adesea direcționează GPU-la-frunză MPO pre-terminat; conexiuni-încrucișate minime

 

4.2 Arhitectura feroviară-Frunză optimizată-coloana vertebrală

Designul de referință DGX al NVIDIA alocă fiecare GPU dintr-un server unuia dedicat"sină"- GPU 0 pe toate serverele dintr-un pod se conectează la același comutator frunză; GPU 1 la următoarea frunză și așa mai departe. Acest model menține traficul colectiv-de comunicații fierbinte (tot-reduce) pe o singură pagină și reduce numărul de hop pentru operațiunile care domină timpul de antrenament AI. Pentru cablare, aceasta înseamnă că opt GPU-uri într-un singur server DGX se distribuie la opt comutatoare diferite - planul de trunchi MPO trebuie să reflecte exact acea topologie. Detaliile complete ale arhitecturii de referință sunt disponibile înGhid de arhitectură a sistemului NVIDIA DGX H100.

 

4.3 De ce cablarea structurată încă câștigă la scară

Atașarea directă-cordajelor de corecție între serverele GPU și comutatoarele de tip frunză minimizează latența hop, dar devin operațional negestionabile dincolo de câteva sute de GPU. Pentru orice cluster care depășește ~1.000 de GPU, trunchiurile MTP pre-terminate cu panouri de corecție bazate pe casete-în carcase 1U sunt singura arhitectură care acceptă mutari, adăugări și modificări fără toate eforturile de-noapte de re-cablare. Sistemele create special-cum ar fi Corning EDGE, Leviton e2XHD și CommScope HD8 sunt platforme-dovedite pentru acest model.

Noastrepanou de corecție cu fibră opticăGama este proiectată pentru medii de-centre de date cu densitate mare și acceptă terminarea MTP/MPO pe casete-.


5. Matematică buget de pierdere: de ce 0,5 dB poate pune capăt unei alergări de antrenament

 

Fiecare legătură optică operează într-un buget de putere finit stabilit de specificația transceiver-ului. Pierderea prin inserție din fibră, conectori și îmbinări consumă bugetul respectiv. Când pierderea acumulată depășește bugetul, legătura fie nu reușește să se antreneze, fie funcționează în modul FEC intens - care maschează erorile, dar consumă energie și căldură suplimentară a transceiver-ului.

 

5.1 Bugetele de pierdere de referință pentru 400G și 800G

Modul Acoperire maximă Buget total Pierdere tipică de canal (2 MTP + fibră) Marja disponibilă
400G-SR8 (OM4) 100 m ~1,9 dB Fibră de 0,3 dB + 2 × 0,35 dB MTP=1.0 dB ~0,9 dB
400G-DR4 (OS2) 500 m ~3,0 dB Fibră de 0,2 dB + 2 × 0,35 dB MTP=0.9 dB ~2,1 dB
800G-SR8 (OM4) 60–100 m ~1,6 dB Fibră de 0,25 dB + 2 × 0,35 dB MTP=0.95 dB ~0,65 dB - foarte strâns
800G-DR8 (OS2) 500 m ~2,7 dB Fibră de 0,2 dB + 2 × 0,35 dB APC-MPO=0.9 dB ~1,8 dB

Perspectiva cheie:la 800G-SR8, o singură față murdară-(care poate adăuga 0,3–0,5 dB) consumă 46–77% din marja disponibilă. În practică, chiar și un conector contaminat la un panou de corecție a comutatorului cu frunze poate reduce în mod măsurabil debitul total de instruire înainte ca inspecția sistematică să izoleze defecțiunea -, motiv pentru care operatorii de top tratează acum inspecția la capăt-față ca un pas de acceptare în punere în funcțiune, nu o verificare opțională a calității.

 

5.2 Șablon de calcul al bugetului de pierdere

Utilizați următoarea structură pentru a vă documenta bugetul de pierdere a canalului înainte de semnarea-instalării:

Element de pierdere Valoare (dB) Note
Atenuarea fibrei (OM4) 0,003 × lungime în metri de exemplu, 100 m=0.3 dB
Conector MTP (fiecare pereche cuplată) 0,35 dB max Specificați MTP Elite pentru 800G; MPO standard poate fi de 0,5–0,75 dB
Numărul de perechi de conectori în canal De obicei 2-4 Numărați toate conexiunile panoului de corecție și casetelor
Pierdere prin îmbinare (dacă este cazul) 0,1 dB per îmbinare Numai pentru rulări OSP; evitați îmbinările în cablarea structurată
Pierderea totală a canalului Suma de mai sus Comparați cu specificațiile transceiver; marjă vizată de 15–20%.
Ținta de proiectare (800G-SR8) Mai mic sau egal cu 1,3 dB Lasă spațiu liber pentru uzura conectorului și variația de temperatură

6. Managementul cablurilor, implementarea și testarea

 

6.1 Pre-Terminat vs. Field-Terminat - Când fiecare este justificat

Factor Trunk-uri MTP pre-terminate Îmbinarea câmpului
Viteza de instalare Substanțial mai rapid în medii controlate; Documentația sistemului Corning EDGE menționează o reducere de 40-70% a timpului de instalare [3] Mai lent; fiecare încetare necesită forță de muncă calificată și timp de vindecare
Pierderea consistenței la inserție Lustruit din fabrică{0}; documentate si certificate pe ansamblu variabilă; depinde de aptitudinile tehnicianului și de mediu
Cel mai bun caz de utilizare Toate porțiunile GPU-la-frunze și frunze-la-coloană unde sunt cunoscute lungimile traseului OSP inter-clădire rulează acolo unde lungimile exacte nu pot fi pre-determinate
Considerarea costurilor Cost mai mare al componentelor; costul forței de muncă mai mic la scară Cost mai mic al componentelor; cost mai mare cu forța de muncă și risc de reluare

Pentru orice cluster GPU de scară semnificativă, ansamblurile pre-terminate sunt implicite. Îmbinarea câmpului supraviețuiește numai în exteriorul-plantelor.

 

6.2 Managementul cablurilor la densitatea fibrelor de 10x

Mențineți raza minimă de curbură:10× diametrul cablului sub sarcină, 20× în timpul instalării. Fibra insensibilă la îndoire-(BIF) tolerează viraje mai strânse, dar nu este o licență pentru colțurile ascuțite la panourile de corecție.

Separați culoarea caldă și cea rece:Pachetele de portbagaj deasupra capului nu trebuie să obstrucționeze fluxul de aer de retur de la coridoarele fierbinți către unitățile CRAH - acesta este un mod obișnuit de eroare a managementului termic la densități mari de rack GPU.

Etichetați fiecare capăt înainte de instalare:o rulare a fibrei fără etichetă la ambele capete este o problemă viitoare de depanare în curs.

Cod-culoare după șină și pod:astfel încât verificarea vizuală a mișcărilor poate fi finalizată fără referire la documentație în timpul-incidentelor de presiune.

 

6.3 Protocolul de testare cu patru-niveluri

Testarea sistematică de acceptare nu este opțională - omiterea acesteia trece în mod constant-depistarea erorilor în producție, unde costul perioadei de nefuncționare depășește cu mult costul testului în sine.

Nivelul Tip de testare Metodă / Standard Ce prinde
Nivelul 1 Inspecție vizuală/față-finală Domeniul de aplicare al fibrei conform IEC 61300-3-35; curățați și reinspectați dacă este necesar Contaminare, zgârieturi, așchii - sursa #1 a pierderii marjei
Nivelul 2 Pierdere de inserție + polaritate OLTS cu flux{0}}încercuit conform IEC 61280-4-1; VFL pentru verificarea polarității Depășiri de pierderi, nepotriviri de polaritate, direcționare greșită a cablurilor
Nivelul 3 OTDR (numai erori-) Fluke OptiFiber Pro sau Viavi T-BERD atunci când pierderea este în afara specificațiilor Identifică locația defecțiunii: conector, îmbinare, macrobend sau rupere
Nivelul 4 Validarea traficului live NCCL all-reduce benchmarks (nccl-teste) pe un pod de referință Validează stratul fizic oferă linia de bază a lățimii de bandă{0}}la nivel de aplicație

Metodologia de testare OTDR pentru centrele de date este detaliată în IEC 61280-4-4. Documentația de referință NCCL este păstrată laNVIDIA NCCL testează GitHub.


7. Manualul de migrare de la 400G la 800G

 

Majoritatea operatorilor nu sunt greenfield. Ei rulează astăzi 400G, se confruntă cu presiunea de a implementa generații de GPU 800G și au nevoie de o cale de migrare care să păstreze instalația de fibră existentă. Următoarea abordare în etape reflectă modelele de implementare observate în mai multe proiecte de migrare-la scară largă.

 

7.1 Cronologia migrației în etape de șase-luni

Fază Sincronizare Activități cheie Măsura de control al riscului
1. Audit și planificare Luna 1 Inventarierea fabricii existente OM4/OS2; identificați golurile MPO-12 față de MPO-16; comanda 20% inventar de portbagaj de rezervă; înghețați arhitectura înainte de achiziționarea opticii Înghețați arhitectura înainte de a comanda optica - modificările după comandă implică penalizări de 4-8 săptămâni
2. Lab Interop Luna 2 Testează interoperabilitatea toate combinațiile optice/comutatoare; validați setările PFC și ECN; NCCL de bază toate-reduc pe podul de referință Cost de remediere în laborator ≈ 10% din costul de remediere în producție - această fază se plătește singură
3. Upgrade-ul coloanei vertebrale Luna 2-3 Actualizați mai întâi comutatoarele coloanei vertebrale; rulați inițial în modul de compatibilitate 400G; utilizați cabluri de deconectare 800G→2×400G pentru a conecta întrerupătoarele vechi de frunze Cablurile de rupere reduc CAPEX cu ~40% în timpul ferestrei de migrare; păstrează rollback
4. Migrația frunzelor Luna 4-5 împrospătare comutator frunze; upgrade server NIC; schimbați MPO-12 trunchiuri la MPO-16 acolo unde este cerut de porturile 800G-SR8 Păstrați calea de retragere 400G timp de 30 de zile după-migrare per pod
5. Reducerea producției Luna 6 Întoarceți toate legăturile la viteza maximă de 800G; re-NCCL de bază toate-reduce; reglați FEC/PFC pentru viteze noi Lansare-live numai după semnarea de acceptare a nivelului 1 și a nivelului 2-pentru întreaga fabrică

8. Pregătirea pentru 1.6T: Arhitectură, Fibră și Cronologie

 

1.6T Ethernet nu este un element teoretic de foaie de parcurs.IEEE 802.3dj- standardul care guvernează 1.6T peste fibra multimod și unic-mod- progresează spre ratificare și se așteaptă, în general, să ajungă la aprobarea finală în 2026. Primele mostre de transceiver 1,6T de la furnizori importanți sunt deja în evaluarea clienților. Această secțiune acoperă ceea ce trebuie să decideți acum, înainte de următoarea versiune.

 

8.1 Formatele transceiver și atingerea țintelor

Formatul modulului Tipul fibrei Acoperire țintă Structura benzii Dependența cheie
1.6T-SR16 OM4 sau OM5 50–100 m 16 benzi VCSEL 100G (MPO-32) OM5 foarte preferat; Atingerea OM4 poate fi limitată la 50 m
1,6T-DR16 OS2 500 m 16 benzi SMF de 100G Necesită conectori APC; SerDes 200G-la comutatorul ASIC
1.6T prin WDM (OM5) OM5 100–150 m 4 lungimi de undă × 400G SWDM OM5 este singura fibră multimodală care acceptă SWDM la această densitate
CPO (Co-Packaged Optics) OS2 sau OM5 Rack-la-rack Fibră direct pentru a comuta pachetul de silicon Necesită o cale de fibre dedicată la fața frontală a comutatorului; nici un transceiver conectabil

 

8.2 Patru decizii de infrastructură de luat astăzi pentru pregătirea 1.6T

Comutați selecția ASIC:Alegeți ASIC-uri cu capacitate SerDes de 200G-lane SerDes. 100G-ASIC-urile (care alimentează majoritatea platformelor 400G/800G actuale) nu pot suporta 1.6T fără un schimb complet de siliciu. Aceasta este decizia cu cel mai mare-cost pe care trebuie să o anulați ulterior.

Instalația de fibre - merge OM5 sau OS2:OM4 nu va suporta formatele dominante de transceiver multimod 1.6T (variante SR16, SWDM) la raza standard. Dacă luați o nouă fibră astăzi pentru un rack care va fi modernizat în 24–36 de luni, costul incremental al OM5 față de OM4 este de obicei de 15–25% din elementul rând de fibră - o fracțiune din viitoarea re-retragere.

Planificarea conectorului - MPO-32 pentru SR16:1.6T-SR16 necesită MPO-32 de conectori, care nu sunt compatibile cu MPO-12 sau MPO-16 la nivel fizic. Planificați calea și densitatea panourilor în consecință. Breakout-ul de la MPO-32 la 2×MPO-16 va fi cablul de tranziție de migrare dominant.

Rezervare cale CPO:Optica co-ambalată elimină transceiver-urile conectabile și direcționează fibra direct către pachetul ASIC de comutare. Rezervați 200–400 mm de spațiu orizontal neobstrucționat pe fața frontală a comutatorului în modelele de rack destinate platformelor 2027+. Crearea retroactivă a acestui spațiu într-un pod dens este costisitoare din punct de vedere operațional.

 

8.3 1.6T Listă de verificare a pregătirii

Element de infrastructură 1.6T gata? Acțiune dacă nu este gata
Tip de fibră: OM5 sau OS2 Da Nu este necesară nicio acțiune
Tip fibră: OM4 Parţial Planificați re-tragere pentru cursele SR16; SWDM nu va fi acceptat
Tip de fibră: OM3 Nu Înlocuiți înainte de următorul ciclu de actualizare
Comutare ASIC: 200G-bandă SerDes Da Nu este necesară nicio acțiune
Comutare ASIC: 100G-bandă SerDes Nu Planificați reîmprospătarea ASIC; nu se poate face upgrade în software
Portbagaje MPO-16 instalate Parţial Poduri la 1.6T prin breakout 2×MPO-16; acceptabil pentru o fereastră de 12-24 de luni
Calea MPO-32 planificată Da Nu este necesară nicio acțiune
Conectorii APC pe OS2 rulează Da Nu este necesară nicio acțiune
Capacitatea portului de rezervă Mai mare sau egală cu 20% la frunză/coloana vertebrală Da Nu este necesară nicio acțiune; Creșterea clusterului AI este ne-liniară
Spațiu pentru calea CPO rezervat pe fața comutatorului Da Nu este necesară nicio acțiune

9. ROI și TCO: Making the Fiber Investment Case

 

Proiectele de infrastructură de fibră sunt uneori blocate în etapa de aprobare a CAPEX, deoarece elementul rând este vizibil, iar costurile evitate nu. O viziune completă a TCO inversează în mod constant această concluzie.

 

9.1 Cele cinci elemente rând TCO

Categoria TCO Șofer Ordinul de mărime
CAPEX - fibră + conectori o dată{0}; scale cu numărul de porturi și complexitatea rutei De obicei, < 5% din costul total de construire a clusterului
optica CAPEX - factor de cost dominant; Optica OSFP 800G este material mai mare decât 400G Planificați bugetul separat pe-port; prețurile au scăzut la o rată semnificativă de la un an-peste-an (verificați prețurile actuale cu LightCounting sau Cignal AI)
Putere OPEX - (transceiver) Multimodul economisește 1–2 W per transceiver față de echivalentul cu un singur-mod [2] ~1,5 kW continuu per cluster de referință cu 768 de porturi; ~130 MWh/an
Răcire OPEX - Direct proporțional cu puterea delta a transceiver-ului ~1,3× economii de energie ale transceiverului (factor de eficiență PUE)
OPEX - evitarea perioadelor de nefuncționare Casetele pre-terminate + modulare reduc MTTR în mod măsurabil Cablajul structurat modular demonstrează în mod constant timpi mai mici de-rezolvare a erorilor față de implementările directe-patch-urilor în evaluările post-de implementare; Cifrele specifice-proiectului ar trebui să fie comparate cu propriile date MTTR

 

9.2 Șablon de calcul al ROI de referință

Următoarea structură oferă un cadru de pornire pentru construirea propriului caz TCO. Valorile reale depind de dimensiunea clusterului, costul local al energiei și structura SLA.

Variabilă Exemplu de valoare Valoarea ta
Număr total de porturi transceiver 10.000 de porturi  
Economie de energie per port (MM vs. SM) 1.5 W  
Economie totală de energie (continuă) 15.000 W=15 kW  
Costul anual de energie (@ 0,08 USD/kWh) 15 kW × 8.760 ore × $0.08=$10.512/an  
Multiplicator de răcire (PUE ~1,3) 10.512 USD × 1.3=13.666 USD/an cost total evitat  
CAPEX incremental (optimizat față de construcția minim-viabilă) variază; de obicei, interval de 150.000 – 500.000 USD pentru construirea de porturi de 10.000-  
Perioada de rambursare estimată 14–20 de luni (interval observat, proiecte 2023–2025 - verificați în funcție de ipotezele dvs. privind costurile pentru energie și optică)  
Credite SLA evitate (estimare) Specific-proiectului; 1 a evitat întrerupere majoră ≈ 50.000 – 500.000 USD  

Pentru valorile de referință actuale ale prețurilor transceiverului, consultațiCercetare de piață LightCountingsauRapoarte Cignal AI componente optice. Acestea sunt actualizate trimestrial și reprezintă sursele standard-industriei pentru modelarea optică a costurilor totale de proprietate.


10. Standarde de referință în cererile de propuneri și documentele de proiectare

 

Citarea standardelor corecte în documentele de achiziție nu este o taxă birocratică generală -, ci este mecanismul care asigură că trimiterile furnizorilor sunt comparabile și că instalația livrată poate fi verificată în funcție de criterii obiective.

Standard Domeniul de aplicare Funcția RFP Legătură
TIA-942-C Infrastructura de telecomunicații pentru centre de date; Nivele de la 1 la 4 Stabilește nivelul de fiabilitate de bază și cerințele pentru calea de cablare TIA-942-C
ANSI/TIA-568.3-E Cablări și componente din fibră optică; Definiții OM4/OM5/OS2 Definește performanța minimă a conectorului și criteriile de acceptare a testului TIA-568.3-E
ISO/IEC 11801-5 Cablare generică pentru centre de date (echivalent internațional cu anexa de cablare TIA-942) Necesar pentru achiziții din afara-SUA; se aliniază cu standardele de reglementare EMEA ISO/IEC 11801-5
IEEE 802.3df (2024) Ethernet 200G/400G/800G prin fibră multimod și unic-mod Citare pentru cerințele de interoperabilitate transceiver; guvernează specificațiile optice SR8/DR8 IEEE 802.3df
IEEE 802.3dj (2026, în curs) Ethernet 1.6T, inclusiv profile FEC și specificații de putere pentru fabricile AI Citați ca cerință de avans pentru livrabile de infrastructură gata de 1,6 T- IEEE 802.3dj
IEC 61300-3-35 La capătul-fibrei se confruntă cu criteriile de acceptare a inspecției vizuale Referință obligatorie pentru testarea de acceptare Tier 1; specifică zonele de trecere/eșec IEC 61300-3-35
IEC 61280-4-1 Metodologia de măsurare a pierderilor de inserție pentru legăturile de fibră instalate Metodologia de testare necesară pentru acceptarea OLTS Tier 2; asigură conformitatea-fluxului înconjurat IEC 61280-4-1

Acreditările de proiectant de specificat în cererile de propuneri: BICSI RCDD(Registered Communications Distribution Designer) este acreditarea de-de facto pentru proiectarea cablajului în America de Nord. BICSI DCDC adaugă specificitatea centrului de date. Pentru EMEA, CNet CDCP / CDCS / CDCE este calea de certificare progresivă recunoscută.


11. Întrebări frecvente

 

Întrebări tehnice

Î: Care este diferența dintre conectorii MPO și MTP?

R: MPO este standardul IEC/TIA pentru conectori multi-fibre push-on (IEC 61754-7). MTP® este implementarea proiectată de US Conec, cu toleranțe mai strânse, o virolă plutitoare și pierderi de inserție mai mici. Fiecare MTP este compatibil MPO-; nu fiecare MPO îndeplinește specificațiile MTP. Pentru 400G și mai sus, specificați pierderea -MTP Elite redusă (mai mică sau egală cu 0,35 dB per pereche cuplată) pentru a păstra marja la 800G în cazul în care bugetele sunt la fel de strânse ca 1,6 dB de la un capăt la altul{13}}.

Î: Ce tip de polaritate ar trebui să folosesc pentru 800G?

R: Tipul-B a fost alegerea dominantă prin 400G. Pentru modulele optice paralele 800G (SR8, DR8), Tipul-C apare ca standard, deoarece gestionează corect inversiunea duplex-perechilor cerute de acele arhitecturi de transceiver. Documentați tipul de polaritate în BOM, pe etichetele panoului de corecție-și în lista dvs. de verificare de acceptare{10}}testare - nepotrivirile de polaritate sunt recuperabile, dar consumă 4-8 ore de timp de depanare atunci când sunt întâlnite în producție.

Î: Care este distanța maximă pentru fibra OM4 la 400G și 800G?

R: Pentru optica paralelă 400G-SR8, OM4 acceptă până la 100 m. Pentru 800G-SR8, acoperirea OM4 scade la 60–100 m, în funcție de implementarea specifică a transceiver-ului și de bugetul de pierdere a canalului. Dacă proiectați pentru 800G de la început, luați în considerare un buget de pierdere mai restrâns și specificați conectorii MTP Elite pentru a păstra marja de ~0,65 dB disponibilă pe un canal 800G-SR8/OM4.

Î: Când ar trebui să folosesc DAC, AOC sau transceiver plus fibra structurată?

R: DAC (cupru cu atașare direct-): se utilizează pentru rulări în-rack sub 5 m. Cel mai mic cost, cea mai mică latență, nu este necesară optica. AOC (cablu optic activ): potrivit pentru circuite intra-de 5–30 m, unde simplitatea plug-and-play contează mai mult decât posibilitatea de actualizare. Transceiver + fibră structurată: Folosiți peste tot. Este singura soluție care acceptă distanțe semnificative, permite upgrade-uri ale opticii fără a re-să trageți cablul și se scalează operațional peste câteva sute de porturi.

Î: Care este pierderea de inserție acceptabilă pentru o legătură 800G?

R: Pentru 800G-SR8 pe OM4, bugetul canalului-la-terminal este de aproximativ 1,6 dB. Proiectați la o țintă de 1,3 dB sau mai mică - un spațiu liber de 15–20% care ține cont de uzura conectorului, deviația de temperatură și degradarea curățării pe durata de viață a instalației. Validați întotdeauna cu un OLTS conform metodologiei IEC 61280-4-1 înainte de a accepta orice legătură.

Î: Centrele de date AI folosesc InfiniBand sau Ethernet?

R: Ambele sunt în uz activ de producție. Materialul backend de referință NVIDIA utilizează InfiniBand NDR (400G) sau XDR (800G). Mulți hyperscalere rulează RoCEv2 bazat pe Ethernet-la viteze comparabile cu reglajul Priority Flow Control (PFC) și Explicit Congestion Notification (ECN). InfiniBand oferă în mod obișnuit o latență mai mică din cutie. Ethernet costă cu aproximativ 30–50% mai puțin și interoperează cu ecosistemul mai larg al centrului de date. Răspunsul corect depinde de stiva dvs. de software - atât NCCL (NVIDIA) cât și OpenMPI acceptă ambele fabrici.

Întrebări comerciale și de planificare

 

Î: Cât costă cablul de fibră pentru un centru de date AI?

R: Fibra și hardware-ul conectorului reprezintă de obicei mai puțin de 5% din costul total de construire a clusterului AI - factorul de cost dominant este transceiverele, care poate fi de 10-20 ori mai mare decât costul fibrei la prețurile actuale de 800G OSFP. O estimare aproximativă de planificare pentru un pod de 1.000-GPU cu cablare complet structurată (trunchiuri MTP pre-terminate, panouri de corecție, casete) este de 150.000 – 350.000 USD pentru stratul fizic, excluzând transceiverele, comutatoarele și serverele. Numai costurile transceiver-ului la 800G pot adăuga 1 milion – 4 milioane USD la același pod, în funcție de tipul de optică și de furnizor.

Î: Cât durează o plantă de fibre și când ar trebui înlocuită?

R: Fibra de sticlă instalată și întreținută corespunzător durează 15-25 de ani cu o degradare minimă a semnalului - consultați documentația Corning de testare a duratei de viață a fibrei pentru date de referință. Presiunea ciclului de viață din centrele de date AI vine de la transceiver și comutatoare, nu de la fibră. Acesta este argumentul economic de bază pentru investiția în OM5 sau OS2 astăzi: fibra va rezista la două sau trei generații de hardware GPU, iar costul de actualizare este determinat de optică și siliciu - nu re-cablu de tragere.

Î: Cât durează o migrare de la 400G la 800G și cât costă?

R: O migrare structurată pentru un cluster de 1.000–4.000 de GPU durează de obicei 4–6 luni de la audit până la trecerea producției, din care 2 luni în interoperarea și planificarea laboratorului. Costul dominant este înlocuirea transceiverului; strategiile de cablu de întrerupere pot reduce CAPEX cu aproximativ 40 %-la mijlocul migrației. Bugetul de 20% din inventarul portbagajului de rezervă pentru auditul fabricii de cabluri - golurile descoperite la momentul instalării implică penalizări de 4-8 săptămâni.


Referințe

[1] Latența rețelei ca proporție a timpului de antrenament distribuit: această estimare circulă pe scară largă în discuțiile privind infrastructura AI și este în concordanță direcțională cu benchmark-urile publicate de Google Brain, Meta AI și NVIDIA privind eficiența antrenamentului model mare-. Pentru un tratament tehnic recent, a se vedea Rajbhandari et al., „ZeRO: Memory Optimizations Toward Training Trillion Parameter Models”, SC '20; și documentația de performanță NCCL a NVIDIA. Valorile specifice variază substanțial în funcție de dimensiunea clusterului, topologie și tipul de operație colectivă.

[2] Comparația consumului de energie între emițătoarele-receptoare cu multimod 800G OSFP (SR8 bazat pe VCSEL-) și modul-unic (DR8/FR8 cu laser-DFB). Specificații reprezentative publicate: Fișă de date Coerent 800G OSFP-DD SR8 (putere tipică: ~14 W); Fișă tehnică coerentă 800G OSFP-DD DR8 (putere tipică: ~15–16 W). Valorile variază în funcție de producător și de condițiile de operare. Verificați cu SKU-urile specifice ale transceiver-ului din lista de materiale înainte de a utiliza în modelele financiare.

[3] Estimări ale densității fibrelor: (a) Corning Incorporated,Infrastructură de cablare pentru centrele de date AI(Corning White Paper, 2024) - citează o creștere de 10 ori a densității fibrelor față de centrele de date tradiționale ale întreprinderilor; (b) Wesco International, AI Data Center Infrastructure Market Analysis (2024) - citează o densitate estimată de 4-5x. Cifra de reducere a timpului de instalare (40–70%) la care se face referire din documentația tehnică a sistemului Corning EDGE™. Contactați Corning (www.corning.com/optical-comunicații) sau Wesco (www.wesco.com) direct pentru acces la publicația curentă.


Despre Glory Optics

Ningbo Glory Optical Communication Co., Ltd.este un producător de infrastructură de fibră optică fondat în 2009, care furnizează componente de cablare pentru centre de date, conectori de fibră optică, cabluri de corecție, splitere și carcase clienților din peste 40 de țări. Noastregama de produse pentru cablarea centrelor de dateinclude ansambluri MTP/MPO, panouri de corecție cu fibră optică și componente de cablare structurată concepute pentru implementări 400G și 800G.

Pentru întrebări despre produse sau consultanță tehnică:sales@gloryoptic.com | Solicitați o cotație

Trimite anchetă