当前位置:首页 >> 中医诊断 >> AI开发大一统:谷歌OpenXLALinux,整合所有框架和AI芯片

AI开发大一统:谷歌OpenXLALinux,整合所有框架和AI芯片

发布时间:2024-01-19

些考验。OpenXLA 乡村主干了在 AI 堆栈的多种不同行政级别(从软件系统到Python、runtime 和芯片)上运行的开发计划工具和企业领导者,因此并不适合解决我们在 ML 企业见到的碎片本土化问题。

作为一个自由软件这两项,OpenXLA 遵循此表主张:

平等地位:更进一步无论从属关系如何,都平等地显然贡献。核心技术领导者是那些贡献最多等待时间和精力的人。

负责任文本土化:所有核心成员都应保障这两项价值观和理应,无论他们在乡村中都的职位如何。

可扩展到、高效的治水:小制作团队显然基于共识的决策,具有清晰但仅仅可用的升级轨迹。

透明度:所有决定和理由都应该对市民挺立。

OpenXLA 生态平衡:普遍效率、规模和软件系统能力

OpenXLA 通过模块本土化基本功用肽键抑制了人工神经互联开发计划工具的障碍,它通过国际标准Python接口得到所有压过软件系统的大力支持,充分利用于软件系统的标准本土化建模表示,并给予具有强大的再度目标向和特定应用程序优本土化的特定企业Python。该基本功用肽键以外 XLA、StableHLO 和 IREE,所有这些基本功用都充分利用于 MLIR:一种Python云端,使人工神经互联建模能够在应用程序上一致地表示、优本土化和执行。

OpenXLA 主要亮点

人工神经互联用例的范围

OpenXLA 当前的可用涵盖了 ML 用例的范围,以外在阿里云上对 DeepMind 的 AlphaFold、GPT2 和 Swin Transformer 等建模透过全面培训,以及在 Amazon.com 上透过多模态 LLM 培训。Waymo 等客户充分利用于了 OpenXLA 透过车载实时推理。此外,OpenXLA 还使用优本土化配备 AMD RDNA™ 3 的本地机器上的 Stable Diffusion 增值。

最佳普遍效率,拆开即用

OpenXLA 使开发计划工具无需改写特定于的设备的代码,即可轻松减慢建模普遍效率。它具有整体建模优本土化功用,以外简本土化代数函数、优本土化内核数据布局以及改进型控管以减少峰值内核可用和通信开销。低阶算子糅合和内核分解成有助于提高的设备充分利用于率并降低内核传输速率要求。

轻松扩展到社会乡村活动负载

开发计划高效的充分利用于本土化算法并不耗时并且需资质。充分利用 GSPMD 等功用,开发计划工具只需原文关键张使用量的一个子集,然后Python就可以可用这些子集自动分解成LPC。这抑制了串连多个应用程序DS和快速器对建模透过分组和高效充分利用于本土化所需的大使用量社会乡村活动。

便携普遍性和可选普遍性

OpenXLA 为多种应用程序的设备给予拆开即用的大力支持,以外 AMD 和 NVIDIA GPU、x86 CPU 和 Arm 架构以及 ML 快速器,如 Google TPU、AWS Trainium 和 Inferentia、Graphcore IPU、Cerebras Wafer-Scale Engine 等等。OpenXLA 还通过 StableHLO 大力支持 TensorFlow、PyTorch 和 JAX,StableHLO 是一个用做 OpenXLA 可用格式的软件系统层。

高工作效率

OpenXLA 为服务器给予了手动调整建模热点的高工作效率。自定义调用等扩展到机制可服务器能够用 CUDA、HIP、SYCL、Triton 和其他内核语言改写最深处求学内联,从而能够充分充分利用于应用程序遍性。

StableHLO

StableHLO 是 ML 软件系统和 ML Python相互间的一个软件系统层,是一个大力支持动态、使用量本土化和稀疏普遍性的低阶浮点(HLO)的浮点集。此外,它可以被序列本土化为 MLIR 字节码以给予兼容普遍性保证。所有主要的 ML 软件系统(JAX、PyTorch、TensorFlow)都可以诱发 StableHLO。2023 年,雅虎计划与 PyTorch 制作团队彼此间共同开发计划,实现与 PyTorch 2.0 版本的整合。

参考素材:

新冠拉肚子能用肠炎宁吗
佐米曲普坦片效果好吗
专家建议
江中药业总经理肖文斌
儿童扁桃体炎要吃再林阿莫西林颗粒吗
标签:
友情链接: