Mistral 发布其首个代码生成 AI 模型 Codestral

Mistral 是一家由微软支持、估值 60 亿美元的法国人工智能初创公司,该公司发布了其首个用于编码的生成式人工智能模型,称为 Codestral。

与其他代码生成模型一样,Codestral 旨在帮助开发人员编写代码并与代码交互。Mistral 在一篇博客文章中解释说,它接受了 80 多种编程语言的训练,包括 Python、Java、C++ 和 JavaScript。Codestral 可以完成编码功能、编写测试和“填写”部分代码,以及用英语回答有关代码库的问题。

Mistral 将该模型描述为“开放的”,但这还有待商榷。这家初创公司的许可证禁止将 Codestral 及其输出用于任何商业活动。许可证中有一个“开发”的例外,但即便如此,也有警告:许可证还明确禁止“员工在公司业务活动中进行任何内部使用”。

原因可能是 Codestral 的部分训练使用了受版权保护的内容。Mistral 在博客文章中没有证实或否认这一点,但这并不奇怪;有证据表明,这家初创公司之前的训练数据集包含受版权保护的数据。

无论如何,Codestral 可能不值得这么麻烦。该模型有 220 亿个参数,需要一台强大的 PC 才能运行。(参数本质上定义了 AI 模型处理问题(如分析和生成文本)的技能。)虽然它根据一些基准测试击败了竞争对手(我们知道这些基准测试不可靠),但它很难说是一场大胜。

图片来源: Mistral

尽管对于大多数开发人员来说 Codestral 并不实用,并且在性能改进方面也只是渐进式的,但它必定会引发关于依赖代码生成模型作为编程助手是否明智的争论。

开发人员肯定会使用生成式 AI 工具来完成至少部分编码任务。在 2023 年 6 月的 Stack Overflow 民意调查中 ,44% 的开发人员表示他们现在在开发过程中使用 AI 工具,而 26% 的开发人员计划很快使用。然而,这些工具存在明显的缺陷。

GitClear 对过去几年提交到项目存储库的 1.5 亿多行代码进行了分析,发现生成式 AI 开发工具导致更多错误代码 被推送到代码库。此外,安全研究人员警告称,此类工具可能会 放大软件项目中现有的错误和安全问题;根据普渡大学的一项研究, OpenAI 的ChatGPT对编程问题的回答中有一半以上是错误的。

这不会阻止 Mistral 等公司尝试将其模型货币化(并获得关注)。今天上午,Mistral 在其 Le Chat 对话式 AI 平台及其付费 API 上推出了 Codestral 的托管版本。Mistral 表示,它还致力于将 Codestral 构建到 LlamaIndex、LangChain、Continue.dev 和 Tabnine 等应用框架和开发环境中。


本站全部资讯来源于实验室原创、合作机构投稿及网友汇集投稿,仅代表个人观点,不作为任何依据,转载联系作者并注明出处:https://www.lvsky.net/277.html

版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

评论