阿里瞄准大模型

2023-05-19 03:43何己派鄢子为
21世纪商业评论 2023年5期
关键词:张勇阿里模态

何己派 鄢子为

“所有产品都值得用大模型重做一遍。”台上的张勇,语气笃定。

4月11日的阿里云峰会,张勇来了,一起亮相的,还有他的新身份。

这是他兼任阿里云智能集团CEO的第15天。

40分钟的演讲,张勇反复提及“人工智能”这个关键词。

他透露,阿里巴巴所有产品未来将接入“通义千问”大模型,进行全面改造。

业务重塑,阿里云打响关键的一枪。

高调参战

人实在太多了。

可容纳几千人的会场,几乎没有空位。张勇演讲的半途,工作人员不得不临时增加了几列座椅。

所有人关注的重头戏,是阿里大模型的进展。

几日前,阿里突然上线“通义千问”,与ChatGPT类似,它是达摩院自研的超大规模语言模型,能回答问题、创作文字,表达观点、撰写代码。

《21CBR》记者使用邀请码,体验了多轮对话。

在功能上,它能生成散文、故事、文案等各种类型文本,做简单的数学题,也能编写代码。此外,对“鸡娃”等中文语境的词句,也有不错的理解。

阿里云智能CTO周靖人特別提到,通义千问还具备多语言能力,可以使用英语、法语等语言进行交流。

不过,它并不支持文生图、图生文等多模态功能。

对记者“是否能生成图像”的提问,通义千问的回答列举了OpenAI的GPT-3、DALL-E等工具,表示自己并不具备这个能力,“只能提供算法和模型,不能直接生成图像”。

不同于百度、360在现场演示对话,通义千问主要以周靖人的PPT展示+三个视频介绍来展现具体功能。

现阶段,该模型主要定向邀请企业用户测试,尚未向公众开放。

一位行业人士向《21CBR》记者分析称,阿里云没有直接推C端产品,而是先从企业级别开始,在于企业更容易接受新技术,且企业级别的应用场景更复杂,需要更高级别的技术支持。

在深度科技研究院院长张孝荣看来,阿里采取了谨慎务实的策略。

“GPT模型最先进,但出现不少bug。阿里云大模型技术完善度有限,面向企业市场测试,在舆论层面比面向大众安全,阿里云也可提早定位潜在客户。”

中间形态

负责研发迭代大模型的,是周靖人团队。

周靖人在微软工作多年,于2016年加入阿里,曾负责阿里云、淘宝和支付宝的搜索、推荐等业务。

周靖人表示,不是来凑热闹。“我们在这方面一直在积累,是国内最早探索大模型方向的公司之一。”

在他眼里,“通义千问”是一个中间态产品。“千问是我们既定路线上的一个节点。”

换言之,在阿里,这是一个承上启下、持续发展的大模型。

要训练出GPT-3.5这样的大模型,至少需要1万张英伟达A100的芯片集群,光硬件投入就需要20亿元。

只有大厂,才拥有这个硬件实力。

近日传出的一份交流纪要里,阿里云AI专家提到,阿里云在云上就有上万片的A100,整体能够达到10万片,集团体量应该是阿里云的5倍。

大规模应用,成本也高。“ChatGPT完成一个推理任务,需要5张A100在2秒钟之内做一次推理。”上述AI专家提道。

数据方面,阿里在电商、搜索、办公领域,有相应积累。算法方面,达摩院在NLP领域深耕多年,较早就确定了多模态方向。

达摩院于2019年启动大模型研发,2021年4月,发布语言大模型“PLUG”;2021年10月,训练出多模态M6大模型,参数规模10万亿。2022年9月,阿里发布“通义”大模型;今年4月,通义千问发布。

国盛证券分析师刘高畅测评后指出,通义千问具备基础常识与初步的逻辑思考能力,有代码书写能力,但在复杂理科计算方面仍有提升空间。

“当前未能达到GPT4的水平,但处于国内领军水平”。他评论道。

周靖人也承认,“GPT4,目前是非常领先的。”

阿里将在多模态大模型的路径上继续探索。

“难的是把各个模态的模型能力融入一个模型,比如怎么把视觉能力融入到语言模型里面。”

周靖人表示,这就像大脑,可以把视觉、语言、听觉等不同形式的输入联合在一起。

他还期待,企业能把通义千问作为底座,在上面进行额外的开发,走进各行各业的场景里去。

走向产业

去年底,张勇亲自接管阿里云。他对大模型的重视,非同一般。

有消息称,张勇尽管忙着重组集团业务部门,但会亲自盯阿里云的AI项目。

他格外关注AI与场景的结合落地。

2月底的财报电话会议上,张勇提到,“最重要的,不是大家拥有了一个对话式的机器人,而是如何将它融合在各自的业务场景中”。

未来,阿里巴巴所有产品都将接入大模型,率先接入测试的钉钉、天猫精灵,将在评估认证后正式发布新功能。

目前,钉钉与大模型融合场景正在测试中,将在相关安全评估完成后上线。4月中旬,钉钉总裁叶军演示了四个场景:群聊、文档、视频会议及应用开发。

以群聊为例,新入群者无需爬楼,在对话框输入钉钉斜杠“/”,即可自动整理群聊要点,快速了解上下文,并生成待办、预约日程;还可以用“/”在群聊中创作文案、表情包等。

“我们也在同步测试钉钉个人版、搜索、邮箱、AI助理、智能客服等产品,让客户和生态基于钉钉PaaS底座的能力,更好地对接大模型。”叶军说。

淘宝天猫的电商业务,也有大量场景适合大模型切入。例如,以文搜图、智能客服、卖点文案生成等。

接下来,通义千问将嵌入阿里电商、搜索、导航、文娱等场景。

AI大模型的商业落地,还在于开放API接口,按调用次数收费,这也是国外主流的商业模式。

“未来所有软件都值得接入大模型升级改造,我们将开放通义千问的能力,为每家企业打造自己的专属大模型。”周靖人表示,每个企业都可以有自己的智能客服、文案助手、AI设计师等。

前景美好,挑战也多。

大模型开发和训练一次的成本,介于200万美元至1200万美元之间,相当昂贵。

刚经历拆分的阿里,各业务单元独立经营、自负盈亏,大模型相关的成本开支压力不小。

行业来看,距离普惠化、规模化应用,大模型还需要走很长一段路。

天使投资人、互联网专家郭涛向《21CBR》记者表示:“AI大模型产业尚处于早期探索阶段,存在关键核心技术发展不成熟、算法模型不完善、训练数据缺乏及偏差、产业生态体系不健全等突出问题。”

问题多,机会更多。

张勇认为,智能化时代,大家都站在同一条起跑线上。

猜你喜欢
张勇阿里模态
Photon blockade in a cavity–atom optomechanical system
跟曾国藩学修身
傅山的“四宁四毋”
云上阿里
张勇
辰辰带你游阿里
国内多模态教学研究回顾与展望
阿里战略
基于HHT和Prony算法的电力系统低频振荡模态识别
阿里是个好榜样