Trong các cụm AI/ML hiện đại, vấn đề độ trễ thấp và tránh nghẽn mạng là yếu tố cơ bản thiết yếu. Nếu packet bị rớt, training job có thể chậm đi hàng giờ. Cisco Nexus 9000 Series Switches kết hợp với Nexus Dashboard Insights (NDI) chính là bộ đôi giúp các kỹ sư mạng theo dõi và tối ưu Lossless Ethernet Fabric cho RoCEv2.
Vì sao cần Visibility? (tÍNH KHẢ KIẾN)
Khác với mạng enterprise thông thường, AI/ML fabric có:
Đây là lúc cần tới congestion visibility.
Cisco Nexus Dashboard Insights làm gì?
NDI thu thập telemetry trực tiếp từ ASIC của switch, bao gồm:
Sau đó, NDI tính toán các chỉ số (score):
Khi có bất thường (anomaly), NDI sẽ cảnh báo ngay để kỹ sư mạng kịp thời xử lý.
Lợi ích thực tế

Content Review
Câu hỏi thường gặp: NDI có thể monitor những score nào?
Đáp án:
-
Latency score 
Góc nhìn thực tế:
Trong hạ tầng AI/ML, “mất một packet” không chỉ là chuyện nhỏ — nó có thể kéo lùi hàng nghìn GPU core. Vì vậy, việc bật telemetry + Nexus Dashboard Insights không còn là tùy chọn, mà là nền tảng để xây dựng AI Fabric chuẩn Lossless Ethernet.