专访思必驰俞凯:专业化语言大模型是通用人工智能落地发展的核心
“大模型是人工智能的新时代。对话式的语言大模型是整个人工智能大模型进一步突破的核心。而专业化的语言大模型,是真正的通用人工智能落地的发展的核心。”思必驰联合创始人、首席科学家、上海交通大学教授俞凯在2023全球智博会上表示。
俞凯作为一名人工智能的从业者,更是一名研究者,他对目前大模型的行业发展和趋势有着自己的见解。“在接受采访时他表示,以GPT为代表的通用大模型是人工智能发展的一个集中式突破,包括对话智能技术、深度学习大模型技术、工程化能力以及大数据的整体突破。而基础AI技术创新,必须最终走入产业,结合场景应用才会变得有价值。”
通用模型 助力产业迭代
以ChatGPT为代表的通用人工智能技术,通过数据和算力效能的变化,催生出海量的新商业模式。而数字人、个人助理、搜索引擎等应用基于通用人工智能基础架构的变化,更引发了产业创新迭代,俞凯认为其对产业的影响主要体现在以下四个方面。
首先,通用人工智能技术对搜索引擎产生了革命性变化。搜索引擎之前是通过筛选关键词,推荐给用户全部答案,让用户自行筛选模式。现在,更倾向于提出一个问题,搜索引擎能直接给出回答,而且这个答案可能比此前的关键词搜索更加丰富、多元。在垂直领域,变化更巨大。比如文献的搜索衍变成为直接给出更准确、丰富的资料,给用户提供了更得力的帮助。
其次,通用人工智能技术正在重塑办公模式,仅仅输入一句简短的文字,就能生成初稿;只要提供简要演示的信息、想要的风格,点击生成,一份排版精美、动画丰富的PPT就诞生了……当办公软件得到人工智能的加持,人们的工作方式或许会从根本上发生变化。办公效率将大幅提升,办公场景从此改变。
再次,用户可以应用通用人工智能技术做内容创作。无论是生成一篇文章,生成一个邮件,其高效、快速、多风格的内容为创新应用拓展、创作成本降低等提供了有力支撑,大模型正在成为内容生产的创新引擎。
最后,就是和物理世界的连接。因为通用人工智能技术可以生成代码,而代码是连接最基础的物理设备的基本协议。当只需要一句话就可以转成代码来操作系统,人工智能就变成了一个物理操作系统。
俞凯认为,在技术的迭代发展上,ChatGPT本质就是一个统计类的深度学习对话通用大模型。而思必驰应该算是国内最早一批去进行统计类对话模型的产业化研究的公司之一,并且在任务型对话上也取得了实际的研究成绩和应用成绩。俞凯表示,思必驰已有的语音和语义的通用基础模型,已经达到亿级参数。在通用基础模型技术方面,目前思必驰使用千块GPU卡量级的超算资源,并正在整合扩展资源,在已有算法研究和数据积累的基础上,将亿级参数模型扩展到百亿以上量级。
伴随人工智能技术发展的,便一直是“AI有所为、有所不为”的讨论。俞凯表示,技术本身是中性的,关键是运用技术的人,应该向善、不作恶。生成式AI面临的两大挑战,一是数据合规,包括数据来源合规、数据处理合规、数据生成合规;二是应用边际,包括需要从人员管理上、工程化实现、场景领域上去规范应用边界,如何更好地“协助人类”而不是“替代人类”,甚至是沦为deep fake的帮凶。
涌现能力 加速落地发展
基于语言大模型的通用对话系统的出现产生了巨大的转变,在深度学习时代,产生了很多的之前没有的能力,叫做涌现能力。俞凯表示:“所有涌现能力的产生,一定不是自然而然的,它的涌现能力的产生,‘大’很重要,具有产生新可能,甚至于无穷无尽的可能性,也是大模型‘涌现’的前提条件。”