拥抱“热力值”飙升的开源,对AI大模型意味着什么?| 原创
拥抱“热力值”飙升的开源,对AI大模型意味着什么?| 原创
2023-12-20 09:47:52 来源:抢沙发
2023-12-20 09:47:52 来源:
摘要:开源推动着生成式AI的崛起,而生成式AI又持续加速着AI大模型的不断升级。
关键词:
开源
AI
大模型
原创专栏
今年以来,ChatGPT热度一路飙升,国内AI大模型市场也持续火热发展,越来越多的创新创业企业也看准时机纷纷入局。在此大背景下,开源大模型正成为AI领域的新潮流,为加速AI大模型厂商商业化进程提供动力。那么,大模型开源意味着什么?未来又将迎来怎样的格局呢?
(图源:ciobulletin)
开源推动生成式AI崛起
据《2022中国开源开发者报告》数据显示,我国开源软件开发者数量已突破800万,居全球第二。目前97%的开发者和99%的企业都在运用开源软件来进行开发协作,开源正在成为驱动全球信息技术产业发展的新引擎。
开源作为一种源自于软件产业的新型协作模式,其对软件技术落地及其商业化方面有着积极影响。
过去的一年里,以ChatGPT为代表的生成式AI,在行业掀起新一轮发展热潮。随着越来越多企业软件及开发者开始入局AI,开源也正在以更受欢迎的方式参与到软件开发迭代的整个过程里。
据Octoverse报告显示,在GitHub上,2023年开发者为其开源项目贡献了3.01亿美元。值得一提的是,生成式AI首次进入GitHub最受欢迎的十大项目,其中不乏从Mastodon到Stable Diffusion、LangChain等热门生成式AI项目。
(图源:github)
商业项目的支持,不断吸引着更多开源项目加入进来。开源可以帮助开发者更快地采用新技术,将其集成到工作流程中并构建下一步。开源也为几乎每一款时下主流软件提供了动力,为数字经济赋能。
开源推动着生成式AI的崛起,而生成式AI又持续加速着AI大模型的不断升级。
AI大模型生态圈,开源大势所趋
所谓AI大模型,是指有着巨大参数规模的AI模型。通过借助机器学习和深度学习技术,模型可以学习和理解庞大的数据量。AI大模型的发展,正不断推动AI领域的快速发展,并不断拓展其应用潜力。
(图源:nfotech)
其实在过去的几年里,AI大模型就已经取得了巨大的进展。其中最著名的就是“顶流”OpenAI开发的GPT系列模型。GPT(Generative Pre-trained Transformer)模型是一种基于Transformer架构的神经网络模型。它使用了大规模的数据集进行预训练,以学习语言的模式和规律。
AI大模型的优势首先看规模,通常通过参数数量来衡量。拥有千亿个参数的模型,通常可处理比普通模型更复杂的任务,并生成更加准确的结果。其次,AI大模型的能力也是衡量其优势的关键点,比如能够理解和处理自然语言,进行文本生成、机器翻译、情感分析等任务,就会比仅支持基本传统算法的模型更具优势。
当然,AI大模型也面临一些现实问题和挑战。首先就是算力资源和存储空间,其次是数据隐私和安全隐患等。即使存在挑战,但AI大模型依旧有着超预期的应用前景,特别是在自动驾驶、智慧医疗等领域,AI大模型都能提供更优秀的帮助。
在AI大模型的生态圈当中,业界根据不同拆分将其分为了几个层面,其中算力层被普遍认为是底层最基础的模型层,目前该层面则正向着面向C端的超大型基础模型以及面向企业的开源模型这两个趋势发展。
大模型开源,或重新划分AI市场格局
所谓开源,即Open source,尽管字面意思是“开放源代码”,但其已远超源代码本身可访问与否的定义,比如它所包含的授权(许可证)、治理等一系列规范机制。开源代码封闭的“诟病”如潜在安全隐患及合规等问题,一直以来都是业界“老生常谈”,因此目前大热的大模型技术,也逐渐开始基于开源的模式进行可持续发展。
众所周知,大模型界“顶流”ChatGPT 在成功迭代之后选择了闭源发展,被业界人士评看似“OpenAI”却并不十分“Open”。因而,在GPT4之前,市面上真正实现100% 开源的大模型,在业界可谓屈指可数。
自今年4月份,国外厂商Databricks 发布了据称是业内首个开源、遵循指令的 LLM——Dolly 2.0模型之后,不少大模型厂商才陆续跟进,不断推出免费开源的模型产品。
国外方面,7月初,Meta宣布发布其首个开源可商用的大语言模型Llama 2,为大模型的开发者们注入了一剂强心针。国内方面,11月份,创新工场董事长兼 CE0 李开复也宣布了旗下大模型公司「零一万物」,并正式推出「Yi」系列开源大模型,给开源大模型社区带来了“一点小小的震撼”。
(图源:baidu)
自此,开源大模型和闭源大模型“抗衡”的局面正式形成,而OpenAI的GPT-4和Meta的Llama则分别成为了大语言模型领域闭源和开源的代表。
大模型开源且支持免费商用,有助于大模型应用企业高质量发展的同时,也更加突显了开源或将重新划分AI市场格局的可能性。
编辑 | MissD
·END·
第三十八届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:zhanghy
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。