Noam Shazeer 与支撑大型语言模型的 Transformer 架构 | Koder.ai