返回产学研开源生态 代码生成模型 经典开源模型

项目档案

CodeGen

程序合成模型,与早期 OpenAI Codex 同期竞争

GitHub Stars
5.1k+
方向
代码生成
形态
模型家族
机构
Salesforce AI Research
分组
国际企业实验室
类别
代码生成模型
状态
经典开源模型
启动
2022-03
语言 / 形态
Python
协议
Apache-2.0
GitHub Stars
5,176
信息更新
2026-05-04

CodeGen 是早期开放代码生成模型的重要样本,出现在 OpenAI Codex 带起程序合成热潮的同一时期。

是什么

CodeGen 是 Salesforce 发布的一组开源程序合成模型。它面向自然语言到代码、代码补全和程序生成任务,训练和评测都围绕代码语料展开。

虽然今天代码模型已经进入更强的 agent 和 IDE 形态,CodeGen 仍是开放代码生成路线的早期代表。

与 AI 的关系

代码生成是大模型最快产品化的方向之一。CodeGen 的历史价值在于它把代码模型从闭源能力拉向可下载、可评测、可改造的研究对象。

它也是理解 AI 编程助手演化的一块早期拼图。

与新加坡的关系

CodeGen 本身不完全是新加坡本地项目,但它属于 Salesforce AI Research 的全球开源资产,与新加坡实验室的人才和研究网络相关。

放在本站里,它提醒我们:新加坡 AI 生态的影响力不只来自政府和高校,也来自跨国研究团队在此形成的全球项目连接。

关键里程碑

  1. 2022-03
    CodeGen 仓库创建

资源入口

更多产学研项目