华为自2020年开始布局大模型,盘古大模型是由CV(计算机视觉)大模型、科学计算大模型、NLP(自然语言处理)大模型、语音大模型、多模态大模型组成的系列。于2021年4月正式发布,彼时华为便表示盘古NLP大模型是业界首个千亿级生成与理解中文的NLP大模型。
根据华为云官网显示,华为即将上线的“盘古系列AI大模型”分别为NLP大模型、CV大模型、科学计算大模型,都已经被标注为即将上线状态。
据华为介绍,其中NLP大模型在预训练阶段学习了40TB中文文本数据,被认为在最接近人类中文理解能力的AI大模型;CV大模型是业界最大CV大模型、首次实现兼顾图像判别与生成能力、首次实现了模型的按需抽取、在ImageNet上小样本学习能力上的业界第一;科学计算大模型应用于应用于气象、生物医药等领域。
▌基于工业化AI开发模式 侧重B端场景
从技术上看,盘古大模型基于“预训练+下游微调”的工业化AI开发模式,拥有泛化能力强、小样本学习和模型高精度三大特性,一个模型就可适用大量复杂的行业场景,即使少量样本也能达到高精度。
基于此,华为大模型产业化的初衷在于开辟更多B端业务场景,正如田奇此前所说,“将工业化的一面放置在更高的优先级上”。
中信建投研报指出,目前盘古预训练大模型能力已经在包括能源、零售、金融、工业等领域得到验证。同时盘古NLP大模型通过迁移学习实现少样本学习的目标,将P-tuning等最新技术融入到盘古的微调框架中,并通过庞大的行业知识库进行训练,使其更适合在复杂商用场景下的应用能力强于GPT-3。
▌“安卓时代”正拉开帷幕 盘古有何优势?
OpenAI率先推出的GPT大模型开启了通用AI的新时代,此举被誉为AI的“iPhone时刻”,而正如iPhone推出后并没有独霸手机市场,其他派系的手机层出不穷,此后的几十年里iOS、安卓系更是竞相迭代,创造了一个移动互联网盛世。
如今,OpenAI之外,国内外许多企业都在紧锣密鼓研发AI模型,国外代表企业有谷歌、Meta,国内包括华为、百度、阿里、腾讯、商汤、三六零、科大讯飞、拓尔思、昆仑万维、云从科技等,继“iPhone时刻”之后,“安卓时代”正拉开帷幕。
与其他大模型相比,华为的优势或在于拥有完整的产业链和较强的算力调配能力。以“AI底座”算力为例,华为握有鲲鹏和昇腾两张牌。据介绍,在训练千亿参数的盘古大模型时,华为团队调用了超过2000块的昇腾910,进行了超过2个月的训练。
从生产链标的来看,据《科创板日报》不完全梳理。这些公司已宣布与华为就盘古大模型展开合作:
天风证券认为,盘古NLP大模型可以实现一个AI大模型在众多场景通用、泛化和规模化复制,减少对数据标注的依赖,让AI开发由作坊式转变为工业化开发的新模式。其分析师缪欣君预计,未来随着盘古系列AI大模型的上线。将持续赋能金融、电力、交通、气象、物流等行业,华为产业链及下游应用相关公司有望持续受益,建议关注:
东吴证券王紫敬等人在3月27日发布的研报中表示,华为盘古大模型的优势在于人才储备和算力自主可控,有望成为国内领先的大模型,其生态产业链标的有望迎来加速发展。相关标的方面:
数据库:海量数据。