JetBrains开源Mellum模型，专注代码补全AI开发

开发多款热门应用工具的JetBrains公司发布了其首款“开源”编程AI模型。周三，该公司将去年为其各类软件开发套件推出的代码生成模型Mellum正式开源至AI开发平台Hugging Face。该模型基于超过4万亿token训练而成，拥有40亿参数规模，专门针对代码补全场景设计（即根据上下文自动补全代码片段）。

Cover Image

参数规模大致对应模型的解题能力，而token则是模型处理的原始数据单元。每百万token约相当于3万行代码量。“Mellum专为集成至专业开发者工具（如集成开发环境中的智能代码建议）、AI编程助手以及代码理解与生成研究而设计，同时也适合教育应用和微调实验。”JetBrains在技术报告中解释道。

这款采用Apache 2.0许可证的模型训练数据涵盖GitHub开源代码库和英文维基百科文章，在256块英伟达H200 GPU集群上耗时约20天完成训练。不过用户需注意：基础模型不能直接使用，必须经过微调。虽然JetBrains提供了几个针对Python优化的Mellum模型，但公司强调这些仅用于“评估潜在能力”，不建议部署至生产环境。

AI生成的代码正在改变软件开发方式，同时也带来新的安全挑战。开发者安全平台Snyk2023年末调查显示，超过50%的企业偶尔或经常遇到AI生成代码的安全问题。JetBrains特别指出，Mellum可能“反映公共代码库中的偏见”（例如生成风格类似开源仓库的代码），其代码建议也“不一定安全或无漏洞”。

“这只是个开始，”JetBrains在博客中写道，“我们不追求通用性——我们要打造专注力。只要Mellum能激发哪怕一个有意义的实验、贡献或合作，我们就会视为成功。”

搜索结果如下

阅读全文

JetBrains开源Mellum模型，专注代码补全AI开发

也可以看看

布莱丝奥兰多新片预告，即兴表演变间谍武器

阅读全文

杰森斯坦森争议动作片热播，007式特工引爆流媒体

阅读全文

艾尔登法环裸战大神初尝血源诅咒，坦言苦战连连

阅读全文