Dalam sistem AI, kita perlu juga membedakan masing-masing dua proses, Â pelatihan dan inferensi.
Misalnya, Ascend 910 terutama ditujukan untuk aplikasi pelatihan AI di cloud, sehingga kinerja chip adalah daya komputasi, yang menjadi fokus pengoptimalannya, sehingga diproduksi menggunakan proses 7nm (nanometer), dan komputasi kekuatan FP16 dapat mencapai 256TFOPS, dan daya komputasi INT8 dapat mencapai 512 TOPS, sambil mendukung decoding video full HD dari 128 saluran.
Performa ini sebenarnya lebih dari GPU pada periode yang sama. Misalnya, Nvidia V100 akan mencapai daya komputasi setinggi itu di masa depan, dan konsumsi daya tertingginya adalah GPU 310 watt, yang pada dasarnya berada di urutan besarnya yang sama.
Sebaliknya, Ascend 310 ditujukan untuk skenario inferensi, terutama di sisi seluler, jadi ini memerlukan keseimbangan tertentu antara kinerja dan konsumsi daya, karena pada dasarnya tidak mungkin menggunakan kamera pintar, kendaraan tak berawak, atau manusia. daya watt di ponsel atau jam tangan kita.
Pada saat yang sama, untuk beberapa skenario edge computing, batasan biaya penggunaan chip, kinerja chip itu sendiri secara real-time, dan keamanan juga menjadi pertimbangan penting.
Oleh karena itu, dikombinasikan dengan persyaratan ini, Ascend 310 diproduksi menggunakan Proses 12nm, yang konsumsi daya terbesar hanya 8 watt.
Dalam hal kinerja, daya komputasi FP16 mencapai 8TFLOPS, dan daya komputasi INT8 dapat mencapai 16 TOPS, dan juga mengintegrasikan saluran dekoder video full HD 16.
Jadi ini adalah daya komputasi yang sangat tinggi di bidang edge computing.
Saat ini, banyak chip struktur sebenarnya dirancang dan dikembangkan dalam bentuk sistem pada sebuah chip.
Mengambil kue sebagai contoh adalah memasukkan banyak kue kecil yang berbeda ke dalam kotak daripada langsung membuat kue yang sangat besar.
Misalnya, jika setiap kue kecil bisa dibuat terpisah, dan juga bisa dibuat dengan rasa dan ukuran yang berbeda, pada akhirnya semuanya bisa dibuat bersama. Ini tidak hanya menghemat waktu produksi tetapi juga mengurangi risiko dan biaya produksi.