开发多款热门应用工具的JetBrains公司发布了其首款“开源”编程AI模型。周三,该公司将去年为其各类软件开发套件推出的代码生成模型Mellum正式开源至AI开发平台Hugging Face。该模型基于超过4万亿token训练而成,拥有40亿参数规模,专门针对代码补全场景设计(即根据上下文自动补全代码片段)。

Cover Image

参数规模大致对应模型的解题能力,而token则是模型处理的原始数据单元。每百万token约相当于3万行代码量。“Mellum专为集成至专业开发者工具(如集成开发环境中的智能代码建议)、AI编程助手以及代码理解与生成研究而设计,同时也适合教育应用和微调实验。”JetBrains在技术报告中解释道。

这款采用Apache 2.0许可证的模型训练数据涵盖GitHub开源代码库和英文维基百科文章,在256块英伟达H200 GPU集群上耗时约20天完成训练。不过用户需注意:基础模型不能直接使用,必须经过微调。虽然JetBrains提供了几个针对Python优化的Mellum模型,但公司强调这些仅用于“评估潜在能力”,不建议部署至生产环境。

AI生成的代码正在改变软件开发方式,同时也带来新的安全挑战。开发者安全平台Snyk2023年末调查显示,超过50%的企业偶尔或经常遇到AI生成代码的安全问题。JetBrains特别指出,Mellum可能“反映公共代码库中的偏见”(例如生成风格类似开源仓库的代码),其代码建议也“不一定安全或无漏洞”。

“这只是个开始,”JetBrains在博客中写道,“我们不追求通用性——我们要打造专注力。只要Mellum能激发哪怕一个有意义的实验、贡献或合作,我们就会视为成功。”


文章标签: #AI模型 #代码补全 #开源 #编程 #安全风险

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。