在人工智能(AI)技术迅猛发展的今天,技术架构和产业生态正经历着前所未有的变革。作为中国知名的科技创业者和前微软、百度高管,陆奇以其深刻的行业洞察力,指出了人工智能时代一个关键趋势:芯片和底层软件“基本都要重做”。这一论断不仅揭示了技术底层革新的必然性,也为我们理解未来AI基础软件开发的路径提供了重要视角。
从芯片层面来看,传统以CPU为中心的通用计算架构已难以满足AI对大规模并行处理和能效比的极致要求。AI模型,特别是大型深度学习模型,其训练和推理过程涉及海量矩阵运算,这催生了针对AI计算特性专门设计的芯片,如GPU、TPU、NPU以及各类ASIC芯片的兴起。陆奇所强调的“重做”,意味着芯片设计需要从底层开始,围绕AI工作负载进行优化,实现更高的计算密度、更低的功耗和更灵活的可编程性。这不仅是一场硬件性能的竞赛,更是计算范式的根本转变,将推动从云端到边缘的智能算力实现全面升级。
在底层软件层面,传统的操作系统、编译器、驱动程序和运行时环境同样面临重构。AI芯片的多样性和专用性,要求底层软件栈能够高效地管理和调度异构计算资源,将复杂的AI算法高效映射到底层硬件上。这需要开发全新的系统软件,例如针对AI优化的新型操作系统内核、能够跨平台和跨硬件进行高效编译与部署的深度学习编译器(如TVM、MLIR等),以及统一、抽象的硬件加速接口和运行时库。陆奇的观点提示我们,AI基础软件的核心使命是“软化”硬件差异,为上层应用提供稳定、高性能且易用的计算抽象,从而降低AI开发的复杂性和门槛,加速创新应用的落地。
聚焦于“人工智能基础软件开发”,这正是连接底层硬件重构与上层AI应用繁荣的关键桥梁。这一领域的开发涉及多个核心层面:
- 计算框架与编译器:如TensorFlow、PyTorch等深度学习框架需要持续进化,其底层执行引擎和编译器技术需能充分利用新型芯片的算力,实现模型训练和推理的自动优化与加速。
- 系统软件与中间件:包括资源调度与管理、分布式训练框架、模型服务化部署平台等,它们确保AI算力能够被高效、可靠、弹性地供给给大规模应用。
- 开发工具与平台:提供从数据管理、模型构建、训练、评估到部署监控的全生命周期工具链,提升开发者的生产效率。
- 安全与可信软件:随着AI深入核心领域,确保AI系统的安全性、可靠性、可解释性和隐私保护,成为基础软件必须内建的关键能力。
陆奇的判断预示着,在AI时代,芯片、底层软件和基础软件开发将形成一个紧密联动、共同演进的“铁三角”。中国的科技产业在其中拥有巨大的机遇。通过抓住芯片架构变革的窗口期,并行投入底层软件和基础软件生态的建设,有望在人工智能的基础设施层构建起自主可控的核心竞争力。这不仅是技术挑战,更是一场关乎未来产业制高点的战略布局。对于开发者、企业和投资者而言,深入理解并参与这一“重做”进程,将是把握AI时代脉搏、创造长期价值的关键所在。