美国当地时间4月9日,英特尔举办了面向客户和合作伙伴的英特尔on产业创新大会,宣布了英特尔®至强®6处理器的全新品牌,推出英特尔Gaudi 3加速器,以高性能、开放性和灵活性助力企业推进生成式AI创新,并发布了涵盖全新开放、可扩展系统,下一代产品和一系列战略合作的全栈解决方案,以加速生成式AI落地。根据cnvrg.io的调研结果,2023年只有10%的企业成功将其生成式AI项目产品化。英特尔的最新解决方案有望帮助企业应对推广AI项目时所面临的挑战。
“ 创新技术正在以前所未有的速度发展,每家公司都在加速成为AI公司,这一切都需要半导体技术提供支持。从PC到数据中心再到边缘,英特尔正在让AI走进千行百业。英特尔最新的Gaudi、至强和酷睿平台将提供灵活的、可定制化的解决方案,满足客户和合作伙伴不断变化的需求,把握住未来的巨大机遇。”——帕特·基辛格英特尔公司首席执行官
企业希望将生成式AI从试验阶段扩展到应用阶段。因此,他们需要基于诸如英特尔Gaudi 3 AI加速器这样的高性能、经济实用、节能的处理器所打造的可快速部署的解决方案。并且,Gaudi 3还能满足复杂性、成本效益、碎片化、数据可靠性和合规性等需求。
推出用于AI训练和推理的Gaudi 3
英特尔Gaudi 3 AI加速器将为AI系统提供动力,该AI系统可通过以太网的通用标准连接多达数万个加速器。与上一代产品相比,英特尔Gaudi 3将带来4倍的BF16 AI计算能力提升,以及1.5倍的内存带宽提升。该加速器将为寻求大规模部署生成式AI的企业带来AI训练和推理方面的重大飞跃。
英特尔Gaudi 3预计可大幅缩短70亿和130亿参数Llama2模型,以及1750亿参数GPT-3模型的训练时间。此外,在Llama 7B、70B和Falcon 180B大型语言模型(LLM)的推理吞吐量和能效方面也展现了出色性能。
英特尔Gaudi 3提供开放的、基于社区的软件和行业标准以太网网络,允许企业灵活地从单个节点扩展到拥有数千个节点的集群、超级集群和超大集群,支持大规模的推理、微调和训练。英特尔Gaudi 3将于2024年第二季度面向OEM厂商出货。
英特尔AI解决方案为客户创造价值
英特尔概述了面向开放的、可扩展的AI系统的战略,其中包括硬件、软件、框架和工具。英特尔让广泛的AI开放生态系统参与者,如设备制造商、数据库提供商、系统集成商、软件和服务提供商等,能够提供满足企业特定生成式AI需求的解决方案。与此同时,亦让企业与他们已知、信任的生态系统合作伙伴展开合作并采取相应解决方案。
生态系统联合创建开放平台,助力企业AI创新发展
英特尔联合Anyscale、Articul8、DataStax、Domino、Hugging Face、KX Systems、MariaDB、MinIO、Qdrant、RedHat、Redis、SAP、VMware、Yellowbrick和Zilliz共同宣布,将创建一个开放平台助力企业推动AI创新。这一凝结全行业力量的计划旨在开发开放的、多供应商的生成式AI系统,通过RAG(检索增强生成)技术,提供一流的部署便利性、性能和价值。RAG可使企业在标准云基础设施上运行的大量现存专有数据源得到开放大语言模型(LLM)功能的增强,加速生成式AI在企业中的应用。
在该计划的初始阶段,基于安全的至强处理器和Gaudi解决方案,英特尔将面向生成式AI进程(pipelines)推出参考实现,发布技术概念框架,并继续增进英特尔Tiber开发者云平台基础设施的功能,以便为RAG及未来进程的生态系统开发和确认打下基础。英特尔鼓励生态系统进一步参与到这一开放平台的创建中来,以促进企业采用该平台,扩大解决方案的应用范围,并取得业务成果。
英特尔扩展AI路线图和开放生态系统方法
英特尔还分享了企业AI各细分领域的下一代产品和服务的最新信息。
全新英特尔®至强®6处理器:英特尔至强处理器为运行当前的生成式AI解决方案提供了性能高效的解决方案,包括使用专有数据生成特定业务结果的RAG。同时,英特尔还为面向数据中心、云和边缘的下一代处理器进行了品牌焕新,即英特尔至强6。配备能效核(E-cores)的英特尔至强6处理器将于2024年第二季度推出,提供卓越的效率,配备性能核(P-cores)的英特尔至强6处理器将紧随其后推出,带来更高的AI性能。
配备能效核的英特尔至强6处理器(代号为Sierra Forest):
● 与第二代英特尔®至强®处理器相比,每瓦性能提高2.4倍1 ,机架密度提高2.7倍2。
● 客户能以近3:1的比例替换旧系统,大幅降低能耗,帮助其实现可持续发展目标3。
配备性能核的英特尔至强6处理器(代号为Granite Rapids):
● 包含了对MXFP4数据格式的软件支持,与使用FP16的第四代英特尔®至强®处理器相比,可将下一个令牌(token)的延迟时间最多缩短6.5倍,能够运行700亿参数的Llama-2模型4。
客户端、边缘和连接:英特尔分享了客户端产品的发展势头以及诸多边缘和网络互联产品的路线图更新,包括:
英特尔®酷睿™Ultra处理器为生产力、安全性和内容创作提供了全新能力,并为企业焕新其PC设备提供了巨大动力。英特尔预计将于2024年出货4000万台AI PC,以及超过230种的设计,覆盖轻薄PC和游戏掌机设备。
将于2024年推出的下一代英特尔酷睿Ultra客户端处理器家族(代号Lunar Lake),将具备超过100 TOPS平台算力,以及在神经网络处理单元(NPU)上带来超过46 TOPS的算力,从而为下一代AI PC提供强大支持。
英特尔发布了涵盖英特尔酷睿Ultra、英特尔®酷睿™、英特尔凌动®处理器和英特尔锐炫™显卡系列产品在内的全新边缘芯片,主要面向零售、工业制造和医疗等关键领域。英特尔边缘AI产品组合内的所有新品将于本季度上市,并将在今年年内获得英特尔Tiber边缘平台的支持。
通过超以太网联盟(UEC),英特尔正在驱动面向AI高速互联技术(AI Fabrics)的开放式以太网网络创新,并推出一系列针对AI优化的以太网解决方案。这些创新旨在革新可大规模纵向(scale-up)和横向(scale-out)扩展的AI高速互联技术,以支持AI模型的训练和推理,这些模型的规模日益庞大,每一代都会增长一个数量级。英特尔的产品组合包括英特尔AI网络连接卡(AI NIC)、集成到XPU的AI连接芯粒、基于Gaudi加速器的系统,以及一系列面向英特尔代工的AI互联软硬件参考设计。
英特尔Tiber业务解决方案组合
英特尔发布了英特尔Tiber业务解决方案组合,以简化企业软件和服务的部署,包括生成式AI。
这一统一的体验将使企业客户和开发人员能够更轻松地找到适合其需求的解决方案,加快创新并释放价值,同时不牺牲安全性、合规性或性能。客户即日起便可开始探索英特尔Tiber产品组合,今年第三季度这一解决方案将会全面推出。
英特尔始终致力于让AI更易于使用、更开放、更安全,从而满足全球企业的不同需求。通过Intel Vision 2024大会上公布的全新合作和解决方案,英特尔将在AI浪潮中全力引领创新,让AI为各行各业带来前所未有的价值。