2024-11-14 16:38:15 来源:互联网
“在Scaling Law失效,真正、彻底的人工智能实现之前,可能仅仅是能源消耗,我们的地球都无法支撑。”袁行远介绍,“优化模型架构,提升大模型的效率,从而有效地降低能耗,就成为必由之路。”
1.7-2倍的性能提升,意味着同样的训练任务,在同等GPU的情况下,效率的同级别提升,之前如果预训练需要消耗100兆瓦时的耗电量,现在仅需要50兆瓦时,成本将大幅缩减。
<p font-size:16px;text-wrap:wrap;background-color:#ffffff;text-indent:2em;"="" style="padding: 0px; margin: 0px 0px 10px; color: rgb(68, 68, 68); line-height: 28.8px;">“将DCFormer架构的模型效率再次提升一倍,是我们接下来一年的目标。”袁行远介绍,“只有模型效率和智能度提升,才能实现真正的AGI。”
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。