Meta公司发布Code Llama AI编程工具升级版Code Llama 70B
Meta公司的CEO扎克伯格在最近的一次发布会上宣布,他们对其代码生成AI模型 Code Llama 70B进行了更新,使其成为了目前市场上“最大、性能最优的模型”。Code Llama 70B是一款能够根据用户的关键词或自然语言输入生成代码的工具,它可以支持多种编程语言,包括Python、Java、C++等。
Code Llama 70B的前身是去年8月发布的Code Llama工具,当时它引起了开发者社区的广泛关注,因为它是第一个能够免费提供给所有人使用的代码生成AI模型。Meta公司表示,新版的 Code Llama 70B 在训练数据和模型规模上都有了显著的提升,从而提高了生成代码的质量和准确性。
Meta公司在其官方博客上介绍了Code Llama 70B的一些技术细节。据悉,这个模型基于 1TB 的代码和代码相关数据进行训练而来,其中包括了来自 GitHub、Stack Overflow、Codeforces 等平台的大量开源代码、问题答案、编程竞赛题目等。这些数据涵盖了不同的编程领域和难度,从而使得 Code Llama 70B 能够适应不同的用户需求和场景。
Meta公司还展示了 Code Llama 70B 在 HumanEval 基准测试中的表现。HumanEval 是一个用于评估代码生成AI模型的标准,它由一系列人工设计的编程问题组成,要求模型根据问题描述生成正确且可运行的代码。Meta 公司称,Code Llama 70B在这个测试中的准确率达到了 53%,超过了目前最先进的GPT-3.5模型的 48.1%,但仍然低于 OpenAI 在其最新论文中给出的 GPT-4 模型的 67%。
除了Code Llama 70B这个通用版本之外,Meta公司还提供了两个针对特定编程语言优化的版本:Code Llama - Python 和 Code Llama - Instruct。这两个版本分别专注于 Python 和指令式编程语言(如 C、C++、Java 等),并且在相应的语言环境中表现更好。Meta 公司表示,这三个版本都可以免费用于研究和商业用途,并且已经托管在代码存储库Hugging Face上,用户可以通过网页或API的方式访问和使用它们。
Meta 公司表示,Code Llama 70B是其在代码生成AI领域的重要里程碑,也是其致力于打造“元宇宙”的一部分。扎克伯格在发布会上说:“我们相信,通过让更多人能够轻松地创建和分享代码,我们可以加速元宇宙的发展,并且让更多人参与其中。Code Llama 70B是我们为此做出的努力之一,我们希望它能够为开发者带来更多的便利和乐趣。”