项目档案
CodeGen
程序合成模型,与早期 OpenAI Codex 同期竞争
GitHub Stars
5.1k+
方向
代码生成
形态
模型家族
- 机构
- Salesforce AI Research
- 分组
- 国际企业实验室
- 类别
- 代码生成模型
- 状态
- 经典开源模型
- 启动
- 2022-03
- 语言 / 形态
- Python
- 协议
- Apache-2.0
- GitHub Stars
- 5,176
- 信息更新
- 2026-05-04
CodeGen 是早期开放代码生成模型的重要样本,出现在 OpenAI Codex 带起程序合成热潮的同一时期。
是什么
CodeGen 是 Salesforce 发布的一组开源程序合成模型。它面向自然语言到代码、代码补全和程序生成任务,训练和评测都围绕代码语料展开。
虽然今天代码模型已经进入更强的 agent 和 IDE 形态,CodeGen 仍是开放代码生成路线的早期代表。
与 AI 的关系
代码生成是大模型最快产品化的方向之一。CodeGen 的历史价值在于它把代码模型从闭源能力拉向可下载、可评测、可改造的研究对象。
它也是理解 AI 编程助手演化的一块早期拼图。
与新加坡的关系
CodeGen 本身不完全是新加坡本地项目,但它属于 Salesforce AI Research 的全球开源资产,与新加坡实验室的人才和研究网络相关。
放在本站里,它提醒我们:新加坡 AI 生态的影响力不只来自政府和高校,也来自跨国研究团队在此形成的全球项目连接。
关键里程碑
- 2022-03CodeGen 仓库创建