作为人工智能的三驾马车之一,算力是训练AI模型、推理任务的关键。倘若大模型是做一道精致的菜肴,算力就好比一套称手的烹饪工具。如何制造出兼具大算力和高能效的下一代AI芯片,已成为国际前沿热点。清华大学科研团队,首创分布式广度智能光计算架构,研制出全球首款大规模干涉衍射异构集成芯片“太极(Taichi)”,实现了160 TOPS/W的通用智能计算。
“太极”光芯片架构开发的过程中,灵感来自于典籍《周易》,团队成员以“易有太极,是生两仪”为启发,建立了全新的计算模型,实现了光计算强悍性能的释放。
从构思到实验,开辟新赛道、做第一个吃螃蟹的人往往都伴随着巨大的困难与压力。
每一个研究成果的背后,都凝缩了团队每一位成员的心血,是历经无数失败与彻夜难眠后,结出的那颗最耀眼的结晶。但方璐却将这次科研历程比拟为一场浪漫的“双向奔赴”:从算法架构上自顶向下探索,在硬件芯片设计上自底向上推演。
相异于电子神经网络依赖网络深度以实现复杂的计算与功能,“太极”光芯片架构源自光计算独特的‘全连接’与‘高并行’属性,化深度计算为分布式广度计算,为实现规模易扩展、计算高并行、系统强鲁棒的通用智能光计算探索了新路径。
据论文第一作者、电子系博士生徐智昊介绍,在“太极”架构中,自顶向下的编码拆分-解码重构机制,将复杂智能任务化繁为简,拆分为多通道高并行的子任务,构建的分布式‘大感受野’浅层光网络对子任务分而治之,突破物理模拟器件多层深度级联的固有计算误差。
团队以周易典籍‘易有太极,是生两仪’为启发,建立干涉-衍射联合传播模型,融合衍射光计算大规模并行优势与干涉光计算灵活重构特性,将衍射编解码与干涉特征计算进行部分/整体重构复用,以时序复用突破通量瓶颈,自底向上支撑分布式广度光计算架构,为片上大规模通用智能光计算探索了新路径。
通俗来讲,干涉-衍射的组合方式仿佛就是在拼乐高玩具。乐高积木可以通过一个模块凹槽与另一个模块凸起的契合来完成两个组件的拼接。在科研团队眼中,一旦把干涉、衍射变成基础模块,进行重构复用,可以凭借丰富的想象力搭建出变化无穷的造型。
据论文报道:“太极”光芯片具备879 T MACS/mm⟡的面积效率与160 TOPS/W的能量效率,首次赋能光计算实现自然场景千类对象识别、跨模态内容生成等人工智能复杂任务。
“太极”光芯片有望为大模型训练推理、通用人工智能、自主智能无人系统提供算力支撑。
方璐表示,“之所以将光芯片命名为‘太极’,也是希望可以在如今大模型通用人工智能蓬勃发展的时代,以光子之道,为高性能计算探索新灵感、新架构、新路径。”