2024年生成式AI会有何实质性进展?

作者:

cbinews编辑

责任编辑:

李丽

来源:

电脑商情在线

时间:

2023-12-19 12:03

关键字:

生成式AI 量子计算 戴尔

临近年末,戴尔科技集团全球首席技术官John Roese如期而约与媒体通过线上交流了他对未来一年的新兴科技趋势观察。

戴尔科技集团全球首席技术官John Roes

John Roese认为,AI会继续主导2024年的话题,但这绝不是2024年唯一的重点科技趋势。

在安全方面,零信任基础架构将成为现实并成为各行各业的“必需品”;同时,“边缘平台”方法将变得更加普及,企业和生态系统将提供更加简单且以边缘平台为中心的模式;量子计算和生成式AI将有所结合。

从John Roese对于未来一年趋势的观察和判断中,我们也发现,其实这几大趋势并不是孤立存在的。比如,AI可以通过边缘投入到生产中,但需要依靠零信任保障安全,并最终从量子技术处获取源源不断的动力,实现扩展到全球系统所需的性能和效率。也就是说,AI需要他们协同作用,才能确保愿景与行动一致,从而取得长期成功。

John Roese 也详细谈到,量子计算解决了生成式AI和大多数大规模AI对计算资源需求这一主要问题。他也预计量子计算将带来AI系统能力的巨大飞跃。混合量子系统将成为现代化AI的计算基础,AI工作将被分散于包括量子处理单元在内的一系列不同的计算架构中。

从训练到推理的基础架构转变

2023年,大多数企业并没有打造出真正的生成式AI系统并投入使用。2024年我们会看到真正的转变,大家已经越来越懂得如何让生成式AI系统进入到推理和生产中,也就是从理论阶段进入到业务应用阶段。

对此,John Roese 也建议,由于对系统的训练仅仅是一个起步,无论是GenAI还是GPT4,大语言模型的训练成本非常高昂,对于那些垂直性行业的企业,他们不会直接在企业的应用中采用这些模型。所以,当我们要进一步开发这些模型,并让这些模型投入到垂直行业的生产时,需要向模型输入各种各样的数据,在使用聊天机器人Chatbot或者是代码开发的过程中,能够让这些模型真正产生生产力。

而要做到这一点必须要解决诸多的问题:比如,首先要清楚推理的基础架构是什么,要如何打造一个推理的基础架构;其次,要清楚把推理放在哪里?最后,有了这些能力如何来确保推理基础架构的安全?

我们知道,训练需要大型集群以及加速的计算架构,可能要在一个月内用成千上万的乃至数以万计的加速器来完成任务。但到了推理阶段,我们需要什么样的基础架构,主要取决于有多少用户来使用这样的模型或者是推理能力。如果你有非常成熟的模型但只有很少量的用户,一台服务器可能就足够了。如果你有一个非常简单的模型,但你的客户非常多,有数以百万计的客户要用这个模型,可能需要几十万台服务器来组成这个基础架构。所以,在2024年,很多企业除了需要考虑训练的基础架构,还要考虑如何打造一个推理的基础架构。

推理要放在哪里?训练多是在数据中心完成,因为这里有大量的加速器。但是推理却要放在数据和用户所在的地方,所以,一般来说推理不会被放在数据中心,有可能会放在边缘,这就要求我们必须要接近呼叫中心或者客户所在的位置,而这就是推理能力部署的位置。以前我们要决定的是把训练放在哪儿,现在要搞清楚我们要把推理放在哪儿。

有了这些能力如何来确保推理基础架构的安全?训练基础架构保护好自己的数据中心就够了,但如果把推理的基础架构部署到现实的世界中,离开数据中心到边缘中,来到了工厂、制造中心和客户所在的地方,包括交通运输的网络中,这样的安全保护的模式就很不一样了,有不同类型的风险、不同类型的攻击。

当黑客入侵到边缘基础架构,把已经投入生产阶段的训练模型提取出来做反向工程设计进行模仿,这样的攻击已经实实在在发生了,所以,我们要确保打造出来的AI模型一旦投入到生产环境,仍然要能够确保其安全。

从训练成本到运营成本的转变

2023年,生成式AI激发了无限的创造性,几乎每一个企业、每一个组织机构,每一个职能部门都在思考如何用到生成式AI来改变销售、财务、人力资源管理的方式以及编写代码的方式,大部分企业甚至列出了生成式AI的应用清单。

然而,构建和实施一个真正投入生产的生成式AI的系统,需要投入大量的人力、物力和财力。企业需要认真思考这些项目的价值以及优先级顺序,以避免出现大量的资源浪费。这其中的风险也包括,如果选错方向,甚至会被竞争对手抢占优势。

在此,John Roese 也提醒企业CIO和管理者们,要关注生成式AI的成本管理问题。2024年,生成式AI将会面临从训练成本到运营成本的转变。

有展望,有执行

回到文章的开头所说,要用数据驱动企业的未来,除了AI,我们还应该注重将“零信任”架构落到实处,用零信任来巩固前沿,并采用“边缘平台”让现代化边缘成为多云基础架构的延伸。

戴尔科技如今已经在全线产品研发中广泛融入AI技术,比如,新的服务器已经可以用于推理,存储系统可以用于生产阶段的AI,而不仅仅是理论阶段。在边缘侧,通过更紧密的生态系统合作打造和交付一体化的基础架构,支持企业级生成式AI的应用。


没有执行的展望那是空想,戴尔科技集团的执行既体现在产品的构建,也体现在交付能力上。

ToB最前沿

ToB最前沿抖音号

CBI科技在线

地址:北京市朝阳区北三环东路三元桥曙光西里甲1号第三置业A座1508室 商务内容合作QQ:2291221 电话:13391790444或(010)62178877
版权所有:电脑商情信息服务集团 北京赢邦策略咨询有限责任公司
声明:本媒体部分图片、文章来源于网络,版权归原作者所有,我司致力于保护作者版权,如有侵权,请与我司联系删除
京ICP备:2022009079号-3
京公网安备:11010502051901号
ICP证:京B2-20230255