不同品牌的AI处理器架构设计很不同。例如,NVIDIA的GPU(图像处理单元)用于机器学习和深度学习,它支持运算矩阵并行计算,这意味着它可以同时运行多个运算。而像Google的TPU(张量处理器)则采用8位整数运算,这可以显着减少能源消耗。
其次,Intel的GPU及Nervana神经计算引擎则专门用于训练深度学习模型设计,而不是用于推理。此外,AMD在设计Radeon Instinct时重点考虑作为数据中心GPU,这使得它可以利用“异构”或混合计算,从而加快训练过程。
由于处理器设计的差异性,各品牌的AI处理器对功耗和性能的关注点不同。
例如,NVIDIA的GPU尽可能地提高计算性能而不是优化功率消耗。这与手机应用程序中的AI处理器不同,它们需要在功率消耗方面更加注重性能。因此,Apple的A12 Bionic芯片可以在AI处理方面表现出色的同时,功耗却很低。
实时性和精度之间的权衡是AI处理器设计的一个关键因素,进而影响到AI处理器的实际应用。
例如,像人脸识别或语音识别这样的用例需要实时性,而时延必须尽可能短。这是因为当我们使用语音助手或面部解锁移动设备时,我们期望几乎立即得到响应。但是,这意味着准确度可能会下降。例如,用于实时翻译的AI处理器应该压缩语音信号以达到实时性,这可能会影响识别精度。
AI处理器的另一个重要区别是它是否采用同构计算(只能执行同类型功能)或异构计算(支持不同类型的功能)。
像NVIDIA的GPU这样的许多AI处理器是同构的。这意味着它们只能执行某一种类型的计算,而其他类型的计算则需要专用的硬件来执行。另外一些AI处理器(如Google的TPU)则采用异构计算设计。在这种情况下,硬件可以执行不同类型的计算任务,从而实现更高效的处理。