比特智路-logo

比特智路

20-99人

公司优势

愿景:我们将人工智能基础设施的规模从现有的数千张GPU扩展至未来的百万级GPU或AI芯片。

使命:解决当前及未来人工智能与云计算基础设施在可扩展性和通信效率上的难题。

过去十年,人工智能迅猛发展,在计算机视觉、机器翻译、自然语言理解和基于生成式预训练模型的通用人工智能等领域实现历史性突破。这些进展得益于人工智能基础设施在算力与通信网络上的支持,同时推动了基础设施的演进。例如,机器学习训练系统从单机单卡、单机多卡扩展到如今需数百台GPU服务器、数千张GPU卡协同完成大规模分布式训练,如训练GPT等生成式人工智能模型。训练大型模型需数千张GPU卡且耗时数月。

展望未来,人工智能模型与训练数据规模将持续扩大,大规模分布式机器学习系统的规模亦将随之增长。然而,目前制约其进一步扩展的关键因素是网络通信能力。当前广泛使用的RDMA(远程直接内存访问)网络通信技术因初始设计局限,难以支撑机器学习基础设施从数千张GPU或AI芯片扩展至数万张乃至更大规模。

比特智路将遵循第一性原理,结合我们在数据中心网络、机器学习系统及芯片与硬件设计领域的专长,以端到端方式解决人工智能基础设施的可扩展性问题。我们的解决方案还可优化云计算基础设施中的TCP协议通信效率。

20,861+ 岗位更新等你来订阅

一键订阅最新的岗位,每周送达

您可以在邮箱中随时取消订阅