Deepseek-Coder-V2 —— 与 GPT 4o 同级别的开源编程大模型

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 172 天前的主题，其中的信息可能已经有所发展或是发生改变。

发布了好几天 V2 上竟然没有讨论贴，来发一把，这是个好模型。

重点：

236B MoE ，激活参数约 33B 。
在各编码基准测试中与 GPT 4o 水平相当或更高（包括非常新的、难以污染的基准测试）。
官网 API 价格：1 元 / 百万输入 Tokens ； 2 元 / 百万输出 Tokens ，非常廉价。
除了编码，其他逻辑能力也很强。
开放权重，允许商业用途

体验： https://chat.deepseek.com/ （左侧代码助手）
GitHub： https://github.com/deepseek-ai/DeepSeek-Coder-V2
技术报告： https://github.com/deepseek-ai/DeepSeek-Coder-V2/blob/main/paper.pdf
权重： https://huggingface.co/deepseek-ai/DeepSeek-Coder-V2-Instruct

除了 236B 的完全体还有一个 Lite 版，16B 参数，大约激活 2B ，支持代码补全等，挺适合个人电脑跑： https://huggingface.co/deepseek-ai/DeepSeek-Coder-V2-Lite-Instruct

11 条回复 • 2024-06-22 15:33:03 +08:00

yinmin

172 天前 via iPhone

deepseek coder v2 在计算机领域的确很强，和 gpt4 有一拼，而且 api 价格超级便宜

nomagick

172 天前

80G*8 required....

StinkyTofus

172 天前

确实不错，问了几个 quarkus native 编译的问题，都回答正确了。

Tink

172 天前

用的逆向的，确实牛逼

crackidz

172 天前

当然是在偷偷的用啊...DeepSeek Coder 刚出来的时候就挺惊艳的

hljhbing

172 天前

我是怎么把 Deepseek-Coder-V2 看成 Docker-Compose-V2 的😰

Vitta

172 天前

Here, we provide some examples of how to use DeepSeek-Coder-V2-Lite model. If you want to utilize DeepSeek-Coder-V2 in BF16 format for inference, 80GB*8 GPUs are required.

Sniper000

172 天前 via iPhone

为啥不用免费的 4O

viWww0vvxmolvY5p

172 天前

API 还没有开放。

viWww0vvxmolvY5p

172 天前

@mway deepseek-chat 和 deepseek-coder 后端模型已更新为 DeepSeek-V2 和 DeepSeek-Coder-V2 ，无需修改模型名称即可访问。
原来是这样

adrianzhang

172 天前

我用 AnythingLLM ，使用其他模型都可以，就是这两个报错，报 llama 内核崩溃。
你知道该怎么用吗？ Ollama 装在一个台式机上，配 3060 12G 显卡，128GB 内存。