近年来,人工智能技术迅猛发展,训练深度学习模型的成本也慢慢的变成为行业关注的焦点。最近,蚂蚁集团的一项新技术曝光,这是一项基于国产芯片的训练AI模型方法,声称能将相关成本降低约20%,其效果已接近英伟达的高端芯片。这一技术进步无疑在竞争非常激烈的AI领域投下了一颗重磅炸弹,不仅为中国的AI发展注入了新动力,也为全球芯片市场的动态增添了变数。
根据彭博社的消息,蚂蚁集团在该项目中依赖于阿里巴巴和华为等中国厂商的半导体,采用了一种名为“专家混合”(Mixture of Experts, MoE)的机器学习方法。这种方法通过将计算任务分散到多个“专家”模型上,实现了更高效的训练过程,进而在保证准确性的同时大幅度降低了成本。蚂蚁集团CTO何征宇带领的技术团队还推出了两款开源MoE模型,分别为Ling-Lite和Ling-Plus,前者具有168亿个参数,后者的参数规模则达到2900亿。这样的规模让行业内的专业技术人员感到惊讶,也为整个AI社区注入了新的活力。
特别有必要注意一下的是,尽管蚂蚁集团仍在使用英伟达的芯片进行部分AI开发,但在最新的模型构建中,主要依赖于国产替代品。这一举措不仅反映了中国科技产业的加快速度进行发展,也表明了对自主可控芯片设计能力的自信。此外,公开发表的论文显示,该技术在模型预训练阶段的计算成本达到了508万元人民币/万亿Token,明显低于之前的635万元。这一转变意味着,国产芯片已能够以更低的成本达到国际领先的技术水平,为别的企业的技术投资提供了重要参考。
然而,这项技术的发展并非没有挑战。尽管价格和性能的平衡令人兴奋,蚂蚁集团的研究团队也精确指出,硬件或模型结构的微小改动都可能会引起模型的错误率激增。这一警示为AI研发团队敲响了警钟,确保在技术创新的同时,一定要重视验证和监控环节。未来,随着蚂蚁集团计划将这两款新模型应用于医疗和金融领域,如何在实际应用中保持模型性能的稳定性,将成为其成功落地的关键因素。
展望未来,国产芯片在AI领域的崛起可能会引发一场新的竞争格局。随着慢慢的变多的公司开始重视自主研发和技术创新,预计会涌现出更多具有竞争力的国产半导体产品。此外,这一趋势在推动中国科技自立自强的背景下,也将促进国际科学技术合作的转变。在全球AI行业的蓝图中,如何利用国产芯片的技术优势,加速开发新型AI应用,将成为企业抢占市场的制胜法宝。总之,蚂蚁集团的这一突破不仅为其自身开辟了新的商业机会,也为全球AI发展带来了新的思考和启发。返回搜狐,查看更加多