Siri H3C UniServer G6 dan HPE Gen11: Keluaran Utama Pelayan AI oleh Kumpulan H3C

Dengan peningkatan pesat aplikasi AI, diterajui oleh model seperti ChatGPT, permintaan untuk kuasa pengkomputeran telah meroket. Untuk memenuhi permintaan pengiraan yang semakin meningkat pada era AI, Kumpulan H3C, di bawah payung Tsinghua Unigroup, baru-baru ini melancarkan 11 produk baharu dalam siri H3C UniServer G6 dan HPE Gen11 pada Sidang Kemuncak Pemimpin NAVIGATE 2023. Produk pelayan baharu ini mencipta matriks komprehensif untuk AI merentas pelbagai senario, menyediakan platform asas yang berkuasa untuk mengendalikan data besar-besaran dan algoritma model, serta memastikan bekalan sumber pengkomputeran AI yang mencukupi.

Matriks Produk Pelbagai untuk Menangani Pelbagai Keperluan Pengkomputeran AI

Sebagai peneraju dalam pengkomputeran pintar, Kumpulan H3C telah terlibat secara mendalam dalam bidang AI selama bertahun-tahun. Pada tahun 2022, H3C mencapai kadar pertumbuhan tertinggi dalam pasaran pengkomputeran dipercepatkan China dan mengumpulkan sejumlah 132 kedudukan pertama dunia dalam penanda aras AI yang terkenal di peringkat antarabangsa, MLPerf, menunjukkan kepakaran dan keupayaan teknikalnya yang kukuh.

Dengan memanfaatkan seni bina pengkomputeran termaju dan keupayaan pengurusan kuasa pengkomputeran pintar yang dibina di atas asas pengkomputeran pintar, H3C telah membangunkan pengkomputeran pintar perdana H3C UniServer R5500 G6, yang direka khusus untuk latihan model berskala besar. Mereka juga telah memperkenalkan H3C UniServer R5300 G6, enjin pengkomputeran hibrid yang sesuai untuk senario inferens/latihan berskala besar. Produk ini seterusnya memenuhi keperluan pengkomputeran yang pelbagai dalam senario AI yang berbeza, memberikan liputan pengkomputeran AI yang komprehensif.

Keutamaan Pengkomputeran Pintar Direka untuk Latihan Model Berskala Besar

H3C UniServer R5500 G6 menggabungkan kekuatan, penggunaan kuasa yang rendah dan kecerdasan. Berbanding dengan generasi sebelumnya, ia menawarkan tiga kali ganda kuasa pengiraan, mengurangkan masa latihan sebanyak 70% untuk senario latihan model berskala besar GPT-4. Ia boleh digunakan untuk pelbagai senario perniagaan AI, seperti latihan berskala besar, pengecaman pertuturan, klasifikasi imej dan terjemahan mesin.

Kekuatan: R5500 G6 menyokong sehingga 96 teras CPU, memberikan peningkatan 150% dalam prestasi teras. Ia dilengkapi dengan modul NVIDIA HGX H800 8-GPU baharu, menyediakan 32 PFLOPS kuasa pengiraan, menghasilkan peningkatan 9x ganda dalam kelajuan latihan AI model berskala besar dan peningkatan 30x ganda dalam prestasi inferens AI model skala besar. Selain itu, dengan sokongan rangkaian PCIe 5.0 dan 400G, pengguna boleh menggunakan kluster pengkomputeran AI berprestasi tinggi, mempercepatkan penggunaan dan penggunaan AI dalam perusahaan.

Kepintaran: R5500 G6 menyokong dua konfigurasi topologi, menyesuaikan dengan bijak kepada pelbagai senario aplikasi AI dan mempercepatkan pembelajaran mendalam dan aplikasi pengkomputeran saintifik, meningkatkan penggunaan sumber GPU dengan sangat baik. Terima kasih kepada ciri GPU berbilang contoh modul H800, satu H800 boleh dibahagikan kepada 7 tika GPU, dengan kemungkinan sehingga 56 tika GPU, masing-masing mempunyai sumber pengkomputeran dan memori bebas. Ini meningkatkan fleksibiliti sumber AI dengan ketara.

Jejak Karbon Rendah: R5500 G6 menyokong sepenuhnya penyejukan cecair, termasuk penyejukan cecair untuk kedua-dua CPU dan GPU. Dengan PUE (Keberkesanan Penggunaan Kuasa) di bawah 1.1, ia membolehkan "pengkomputeran sejuk" dalam kepanasan lonjakan pengiraan.

Perlu dinyatakan bahawa R5500 G6 telah diiktiraf sebagai salah satu daripada "10 Pelayan Berprestasi Tinggi Cemerlang Terbaik 2023" dalam "Kedudukan Kuasa 2023 untuk Prestasi Pengiraan" selepas dikeluarkan.

Enjin Pengkomputeran Hibrid untuk Pemadanan Fleksibel Latihan dan Permintaan Inferens

H3C UniServer R5300 G6, sebagai pelayan AI generasi akan datang, menawarkan peningkatan ketara dalam spesifikasi CPU dan GPU berbanding pendahulunya. Ia mempunyai prestasi cemerlang, topologi pintar, dan keupayaan pengkomputeran dan storan bersepadu, menjadikannya sesuai untuk latihan model pembelajaran mendalam, inferens pembelajaran mendalam dan senario aplikasi AI yang lain, latihan padanan secara fleksibel dan keperluan pengkomputeran inferens.

Prestasi Cemerlang: R5300 G6 serasi dengan GPU gred perusahaan NVIDIA generasi terkini, memberikan peningkatan prestasi 4.85x berbanding generasi sebelumnya. Ia menyokong pelbagai jenis kad pecutan AI, seperti GPU, DPU dan NPU, untuk memenuhi keperluan kuasa pengkomputeran heterogen AI dalam senario yang berbeza, memperkasakan era kecerdasan.

Topologi Pintar: R5300 G6 menawarkan lima tetapan topologi GPU, termasuk HPC, AI selari, AI bersiri, akses terus 4 kad dan akses terus 8 kad. Fleksibiliti yang tidak pernah berlaku sebelum ini sangat meningkatkan kebolehsuaian kepada senario aplikasi pengguna yang berbeza, memperuntukkan sumber secara bijak dan memacu operasi kuasa pengkomputeran yang cekap.

Pengkomputeran dan Penyimpanan Bersepadu: R5300 G6 secara fleksibel menampung kad pecutan AI dan NIC pintar, menggabungkan keupayaan latihan dan inferens. Ia menyokong sehingga 10 GPU dua lebar dan 24 slot pemacu keras LFF (Faktor Bentuk Besar), membolehkan latihan serentak dan inferens pada pelayan tunggal dan menyediakan enjin pengkomputeran yang menjimatkan kos untuk pembangunan dan persekitaran ujian. Dengan kapasiti storan sehingga 400TB, ia memenuhi sepenuhnya keperluan ruang penyimpanan data AI.

Dengan ledakan AI melonjak ke hadapan, kuasa pengkomputeran sentiasa dibentuk semula dan dicabar. Pelancaran pelayan AI generasi akan datang menandakan satu lagi peristiwa penting dalam komitmen Kumpulan H3C terhadap teknologi "kecerdasan bawaan" dan pemacu berterusannya untuk evolusi pengkomputeran pintar.

Melihat ke masa depan, berpandukan strategi "Cloud-Native Intelligence", Kumpulan H3C mematuhi konsep "pragmatisme yang teliti, memberikan era dengan kecerdasan." Mereka akan terus memupuk tanah subur pengkomputeran pintar, meneroka senario aplikasi AI peringkat dalam, dan mempercepatkan kedatangan dunia pintar dengan kuasa pengkomputeran yang boleh disesuaikan untuk masa hadapan.


Masa siaran: Jul-04-2023