V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
hxm0070
V2EX  ›  问与答

国内这些开源大模型,哪个效果更好一些?

  •  
  •   hxm0070 · 197 天前 · 1868 次点击
    这是一个创建于 197 天前的主题,其中的信息可能已经有所发展或是发生改变。
    国内也出了不少开源的了,自己部署的话,哪个效果比较好啊?有大佬们横向对比试过吗?
    9 条回复    2024-05-30 10:07:51 +08:00
    Pteromyini
        1
    Pteromyini  
       197 天前
    01 和阿里体验好一些
    rrZ2C
        2
    rrZ2C  
       197 天前
    抖音的豆包画画我感觉还不错
    yplam
        3
    yplam  
       197 天前 via Android
    个人主观测试 llama3 最好,有中文训练的版本,其次是千问 1.5 与百川 2 ,反而是一些评分很高的模型感觉效果差,可能是推理框架支持不好或者调用的参数不合适
    neteroster
        4
    neteroster  
       197 天前
    等 Qwen2 ,这两周会出,不出意外的话应该会很强(推上几位相关负责人都很自信)
    haiku
        5
    haiku  
       197 天前 via Android
    01 吧,在海外盲测的排行榜上分也挺高的
    googlefans
        6
    googlefans  
       197 天前
    @neteroster 我一直在用千问 2.5 啊 官方网站不是一直可以用吗?
    neteroster
        7
    neteroster  
       197 天前   ❤️ 1
    @googlefans 那都不是一个系列的,Qwen 开源模型系列目前最新版本是 Qwen1.5 ( https://huggingface.co/Qwen ),下一个版本是 2 。

    所谓通义千问 2.5 指的实际上是 Dashscope 上型号为 "qwen-max" 的闭源模型,后者目前指向 "qwen-max-0428"( Chatbot Arena 榜上有名),而 Qwen2 开源系列将很可能超过该模型( ref: 官方 discord )
    laminux29
        8
    laminux29  
       197 天前
    当然是阿里的通义千问,如果笔记本配置较低,可以用 ollama 运行 34GB 的 qwen:32b-chat-v1.5-q8_0
    amorhxy
        9
    amorhxy  
       196 天前 via Android
    自己部署的话零一万物的 yi1.5-34b 最好,可以下载 dolphin 版本无审查,配置要求也低,效果比 qwen-110b 更好,闭源的话 yi-large 目前 lmsys 排行榜也很高,用了下效果也不错
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1404 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 17:06 · PVG 01:06 · LAX 09:06 · JFK 12:06
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.