...
4月7日中午,阿里云旗下大模型“通义千问”官宣开放用户测试体验。
目前,企业用户可以在官网提交体验测试申请(tongyi.aliyun.com),符合条件的用户可参与体验,而个人用户目前只能通过邀请码进入体验。
记者测试发现,通义千问功能包含效率类、生活类和娱乐类,其中效率类能够写提纲、进行SWOT分析、生成商品描述;生活类提供根据菜名写菜谱、模仿小学生写作等功能;娱乐类则能够写情书、写诗以及吹“彩虹屁”等。在自由交谈过程中,通义千问对答流畅,具备一定的中文理解和文学创作能力。
在问及为何其取名为通义千问时,其表示“通义千问”寓意为通义万千,问鼎天下。该大模型在训练过程中学习了大量的文本数据,从而具备了跨领域的知识和语言理解能力。“通义千问"这个名字也表达了这款人工智能语言模型的强大功能和广泛适用性。
不过,目前“通义千问”暂不支持输出图片、视频等其他格式的内容,也无法准确解答“鸡兔同笼”的数理推理题目。
据通义千问介绍,阿里巴巴达摩院对预训练语言模型的研发历程可以追溯到2017年。当时,阿里巴巴达摩院开始对外公开研究自然语言处理技术。“在此基础上,通义千问逐渐发展成为一个拥有丰富功能和强大能力的预训练语言模型。”通义千问指出。
2021年,阿里先后发布多模态大模型M6及语言大模型PLUG。去年9月,“通义”系列大模型在世界人工智能大会(WAIC)上正式发布。
今年3月,阿里巴巴达摩院(杭州)科技有限公司申请注册“通义万象”“通义晓语”“通义万相”等多个商标,国际分类涉及广告销售、科学仪器、网站服务等,目前商标状态均为“申请中”。
算法、算力和数据是人工智能技术研发和应用的支柱,需要多少数据和算力才能支撑起通义千问的运作?
“通过使用大量的数据和先进的算法,通义千问可以学习和理解各种语言的复杂结构和语法规则。由于其规模巨大,因此其参数规模也非常庞大,需要消耗大量的计算资源来进行训练和优化。”通义千问介绍道。
不过,在于记者的“交流”中,模型并没有披露具体的训练用参数量。
据悉,2021年,阿里发布语言大模型PLUG,其参数规模达到270亿;同年的发布多模态大模型M6,则陆续迎来了百亿、千亿、万亿和十万亿参数规模的预训练模型。
今年3月底,阿里达摩院在AI模型社区“魔搭”ModelScope上线了只支持英文输入的“文本生成视频大模型”。据介绍,训练这一模型整体参数约17亿。
数据类型上, 通义千问使用了不同来源的大量的语言数据进行训练,包括文本数据、音频数据、视频数据等等。
据了解, 通义千问既可以在云端运行,也可以离线使用。本月 11 日,2023 阿里云峰会将在京召开,届时将正式推出阿里大模型,接下来还有各类的行业应用类模型会面世。据称,阿里巴巴将于 4 月 11 日推出大模型,18 日推出行业应用类模型。
此前,阿里巴巴集团董事会主席兼首席执行官张勇也在财报会上表示,云计算是阿里巴巴面向未来的核心战略之一。目前,云计算和人工智能的结合正处于技术突破和发展的关键时期,生成式AI正在发生颠覆性突破,阿里巴巴将全力构建好自己的AI预训练大模型,并为市场上风起云涌的模型和应用提供好算力的支撑。
编辑:翟卓
声明:新华财经为新华社承建的国家金融信息平台。任何情况下,本平台所发布的信息均不构成投资建议。
发表评论