云知声黄伟:深耕人工智能11年 未来持续升级山海大模型能力
“云知声还将持续升级山海大模型能力,目标是年内通用能力比肩ChatGPT,并在医疗、物联、教育等多个垂直领域能力超越GPT4。”云知声创始人、CEO黄伟表示。
一路走来,云知声的基因血统中体现了变与不变的因素。云知声一直在顺应时代的变化,进行自我革新。同时,云知声也一直坚持将技术投入作为重要的战略方向。日前,云知声宣布推出山海大模型,并发布一系列面向不同行业需求的应用产品。山海大模型能力如何?而云知声为什么要做大模型,云知声创始人、CEO黄伟对铋读做了一些介绍。
什么是山海大模型?
山海大模型是云知声AGI技术架构升级的结果。云知声以山海大模型为基础,打造MaaS 模式的AI 2.0解决方案。山海大模型拥有十大核心能力。其中包括语言生成、语言理解、知识问答、逻辑推理、代码能力、数学能力、安全合规能力七项通用能力及插件扩展、领域增强、企业定制三项行业落地能力,云知声通过语音输入、实时互动的方式进行讲解演示。
作为生成式AI最具代表性的能力,语言生成是山海大模型的基础能力之一。山海大模型不仅可以生成各种流畅、连贯的文本,包括新闻、作文、小说、邮件、古诗和对联等各种文案,还可以通过多语种、多文体和多风格的方式支持各种语言生成任务,包括创作、摘要、翻译。此外,还支持多种约束条件下的可控文本生成。
黄伟认为,在过去的一段时间,人工智能的能力处于 AI1.0 时代,只是做一个分类的任务,很难去为客户创造一个充分的价值。在大模型引领的 AI 2.0 时代,为人工智能带来了新的能力,可以打造更多新的产品,满足客户更多的需求,例如医疗、营销、沟通等,能够创造更多的商业机会。
这一次,在通用能力基础上,云知声还发布多款基于山海大模型打造的面向不同场景需求的行业应用,从效率、成本、体验等多角度,为千行百业的智慧升级按下加速键。黄伟表示,山海大模型技术架构就是通用大模型,并针对知识密度高的领域,通过数据训练、训练数据、微调等方式,做一些专业的加强。山海大模型增强物联、医疗等行业能力,为客户提供更智能、更灵活的解决方案,打开更大的 AI 技术产业化商业空间。
为什么坚持做人工智能?
云知声从2012年入局深度学习,到后来搭建AI全栈能力,山海大模型代表的AGI技术升级,已经是云知声成立11年来的第三次技术大升级。2022年底,当ChatGPT火出圈外,云知声就已经意识到U+X战略期待已久的AGI时代到来了。于是,迅速调动研发团队,在Atlas智算平台、DCML模型工厂基础上,继续扩充算力,攻关工程优化和数据优选。在短短几个月时间里,云知声就完成了算力扩容、算法验证、并行加速、数据优选等工作,实现GPT为核心的架构升级,成功发布山海大模型,迈向通往AGI的新征程。
据官方介绍,云知声以智能语音识别、自然语言理解、知识图谱等全栈 AI 技术为核心,打造云服务和AI芯片,并基于云芯一体化平台,面向智慧物联与智慧医疗两大领域提供以对话式AI技术为基础的产品服务与综合解决方案。
据黄伟介绍,在通用数据方面,目前云知声差不多接近200p的算力,全部都是一些最新的GPU的算力。而面对专业领域,想要打造大模型,必然需要行业的数据,但并不是只有数据就够了。针对这个问题,黄伟表示,山海大模型,可以让云知声用新的能力去打造新的产品,去更好的去满足客户的需求。
例如在医疗领域进行增强的过程中,不仅需要一些行业的数据,还加入了大量的专辑、病案、教材,以及云知声在为医疗服务中积累的千万级的标准的医疗数据,并背靠国内最大的医疗知识数据图谱,才实现了山海大模型在MedQA评测能力中超越GPT-4的结果。
对于未来,黄伟也有自己的思考。他表示:“我们希望产品真正的能够更好的服务客户,接下来会把基于大模型的车载产品方案,物联方案落地,对于目前已经在使用的客户还会做一个快速升级,让使用更贴心。”