微软被曝正研究用LASER提高大型语言模型的准确性

2024-02-01 10:14:50   |   棠糖   |   96

在1月份的微软研究论坛上,微软纽约研究实验室和AI Frontiers的高级研究员Dipendra Misra解释了层选择性降级(或 LASER)如何使大型语言模型更加准确。 

LASER是一种新颖的技术,它可以在不损失模型性能的情况下,减少大型语言模型(LLM)的内存和计算需求。LLM是一种人工智能(AI)系统,它可以理解和生成自然语言。LLM 通常由数百亿个参数组成,这些参数是根据大量文本数据进行训练的。然而,这些参数也导致了 LLM 的高昂成本和低效率,因为它们需要大量的存储空间和计算能力。

通过激光,研究人员可以“干预”并用一个近似较小的权重矩阵替换一个权重矩阵。权重是模型建立的上下文连接。重量越重,模型对其的依赖程度就越大。那么,用更多相关性和上下文替换某些内容是否会降低模型的准确性?令人惊讶的是,根据他们的测试结果,答案是否定的。 

“我们正在使用LASER对LLM进行干预,因此人们会预计,随着我们进行更多近似,模型损失应该会上升,这意味着模型将表现不佳,对吧,因为我们正在丢弃来自 LLM 的信息,它经过大量数据的训练,”米斯拉说。 “但令我们惊讶的是,我们发现,如果执行正确类型的激光干预,模型损失不会上升,实际上会下降。” 

Misra表示,他的团队在三种不同的开源模型上成功使用了LASER:RoBERTa、Llama 2 和Eleuther的GPT-J。他说,有时模型改进会提高 20 到 30 个百分点。例如,在激光干预后,GPT-J基于传记的性别预测的准确率从70.9%提高到97.5%。

据铋读网了解,AI模型会犯很多事实错误,因此LLM的准确性仍然是一个问题,而且这不仅仅是担心出现幻觉,幻觉更少是关于做错事情,更多是关于编造事情。幻觉和不准确的人工智能模型可能很有趣,但它们也可能造成相当大的伤害。

这项研究表明了 LASER技术在提高LLM的可用性和可靠性方面的潜力。通过减少LLM的复杂度和开销,LASER可以使更多的人和组织能够利用LLM的强大功能,并促进AI的民主化和普及。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺,请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时发送相关信息至bireading@163.com,本站将会在48小时内处理完毕。

微软被曝正研究用LASER提高大型语言模型的准确性

2024-02-01 10:14:50 浏览量: 96 作者: 棠糖

在1月份的微软研究论坛上,微软纽约研究实验室和AI Frontiers的高级研究员Dipendra Misra解释了层选择性降级(或 LASER)如何使大型语言模型更加准确。 

LASER是一种新颖的技术,它可以在不损失模型性能的情况下,减少大型语言模型(LLM)的内存和计算需求。LLM是一种人工智能(AI)系统,它可以理解和生成自然语言。LLM 通常由数百亿个参数组成,这些参数是根据大量文本数据进行训练的。然而,这些参数也导致了 LLM 的高昂成本和低效率,因为它们需要大量的存储空间和计算能力。

通过激光,研究人员可以“干预”并用一个近似较小的权重矩阵替换一个权重矩阵。权重是模型建立的上下文连接。重量越重,模型对其的依赖程度就越大。那么,用更多相关性和上下文替换某些内容是否会降低模型的准确性?令人惊讶的是,根据他们的测试结果,答案是否定的。 

“我们正在使用LASER对LLM进行干预,因此人们会预计,随着我们进行更多近似,模型损失应该会上升,这意味着模型将表现不佳,对吧,因为我们正在丢弃来自 LLM 的信息,它经过大量数据的训练,”米斯拉说。 “但令我们惊讶的是,我们发现,如果执行正确类型的激光干预,模型损失不会上升,实际上会下降。” 

Misra表示,他的团队在三种不同的开源模型上成功使用了LASER:RoBERTa、Llama 2 和Eleuther的GPT-J。他说,有时模型改进会提高 20 到 30 个百分点。例如,在激光干预后,GPT-J基于传记的性别预测的准确率从70.9%提高到97.5%。

据铋读网了解,AI模型会犯很多事实错误,因此LLM的准确性仍然是一个问题,而且这不仅仅是担心出现幻觉,幻觉更少是关于做错事情,更多是关于编造事情。幻觉和不准确的人工智能模型可能很有趣,但它们也可能造成相当大的伤害。

这项研究表明了 LASER技术在提高LLM的可用性和可靠性方面的潜力。通过减少LLM的复杂度和开销,LASER可以使更多的人和组织能够利用LLM的强大功能,并促进AI的民主化和普及。

,

Copyright ©2018 铋读网 All Rights Reserved.

京ICP备18051707号

京公网安备 11011302001633号