chatglm吧 关注:280贴子:434
  • 6回复贴,共1

大家好,新人请教个问题,大家用什么显卡 聊天回复速度如何?

只看楼主收藏回复

我是4070 回复的好慢啊...
另外请教回复速度这个问题和核心(显卡)有关?还是显存大小或显存带宽有关?


IP属地:北京1楼2023-08-28 17:31回复
    使用量化模型6G以上8G以下用int4
    8G以上12G以下用int8
    13G以上用FP16/BF16


    IP属地:江苏来自Android客户端2楼2023-09-08 23:22
    收起回复
      我4060Ti16G显存秒回,几乎没感觉要等待。


      IP属地:广西来自Android客户端3楼2023-09-23 10:01
      收起回复

        我用的秋叶的整合包,没有强制更新,已更新就打不开了.不知道是不是因为这个原因.


        IP属地:北京4楼2023-09-28 08:26
        回复
          我的老机器,1070显卡,8g显存装int4的GLM2,短问题也基本上马上回,一秒出十几个字的样子。不爆显存应该就这样才正常吧。


          IP属地:上海来自Android客户端5楼2023-10-05 16:38
          回复