投稿

Qwen1.5系列6个模型如何选择？ AWQ还是GPTQ？#小工蚁

9012

1

2024-02-09 08:15:00

未经作者授权，禁止转载

正在缓冲...

Qwen1.5系列6个模型如何选择？ AWQ还是GPTQ？#小工蚁

小工蚁创始人发消息

小工蚁创始人张文斌原土豆网第九个员工，土豆网技术总监

Mixtral-8*7B开源模型生产环境部署优化 2块RTX4090 #小工蚁

05:53

训练大语言模型LLM 如何定义自己训练数据集？#小工蚁

13:40

如何微调开源Yi-34B成为Open LLM排名前三模型 #小工蚁

09:19

大语言模型构建新工具MergeKit 集百家之长融于一身 #小工蚁

09:39

国产首个开源MoE大模型DeepSeekMoE 16B #小工蚁

06:37

最强长上下文Text Embedding 开源模型M2-BERT

09:33

MiniMA-Chat-3B开源小模型中英文双语 #小工蚁

04:57

智谱AI GLM4和InternLM2国产大语言模型更新迭代 #小工蚁

05:12

斯坦福开源RadixAttention算法和SGLang语言，性能再翻5倍

08:01

让Mixtral-8*7B模型运行在16GB显存GPU上 #小工蚁

08:09

PatchTSMixer开源最强多变量时间序列预测算法

09:05

开源InternLM2大模型测评 #小工蚁

05:34

AWQ和GPTQ大模型4bit量化哪种算法更优？#小工蚁

03:18

Yi-VL开源最强多模态大模型 #小工蚁

04:56

突破极限：Yi-VL多模态模型惊艳亮相，推理加速性能压测演示 #小工蚁

13:24

Qwen1.5大模型春节前发布阿里送大礼包看看有啥？

09:32

Qwen1.5系列6个模型如何选择？ AWQ还是GPTQ？#小工蚁

07:49

中国开源1bit大模型量化算法BiLLM来啦 #小工蚁

08:56

Smaug开源大模型排行第一基于Qwen72B微调大模型 #小工蚁

04:22

大语言模型提示工程新框架 Self-Discover超越CoT

06:01

谷歌发布Gemini 1.5超长上下文如何实现？UC伯克利告诉你

10:55

谷歌Gemini系列模型开源了，发布Gemma 2B和7B2个模型 #小工蚁

06:37

谷歌开源Gemma-7B大模型性能和中文能力测试 #小工蚁

02:50

谷歌公布无需提示工程CoT推理解码算法 #小工蚁

10:40

StarCoder2及数据集正式发布 #小工蚁

03:29

多GPU推理加速Qwen-72B开源大模型 #小工蚁

04:53

零一万物发布Yi-9B大模型，代码数学推理能力全面提升 #小工蚁

07:04

零一万物开源大模型Yi-9B测试，性能到底如何？#小工蚁

08:52

LMSYS全球大模型PK排行榜 Qwen1.5-72B开源排名第一 #小工蚁

05:44

大语言模型企业应用排行榜，哪个模型最强？#小工蚁

04:38

揭晓答案：Qwen-72B和Yi-34B生产部署性能哪个更强？

08:01

通义千问Qwen1.5多个LoRA 同时部署和推理加速演示 #小工蚁

13:54

Qwen1.5-72B上下文推理准确度评估演示16K时最优 #小工蚁

03:43

马斯克开源全球最大模型Grok 8个专家模型组成314B神经网络

06:19

腾讯开源LlaMA Pro增强LLM性能新方法，打造行业模型 #小工蚁

06:20

Embedding模型8bit量化推理成本下降4倍，准确度下降0.7%

07:22

Databricks开源超千亿规模大模型DBRX，性能超Grok

04:48

阿里开源Qwen1.5-MoE模型评测性能究竟如何？

08:32

阿里开源Qwen1.5-MOE-A2.7B CEval评测 #小工蚁

02:53

近期开源4个MoE大模型哪个最优？DBRX？Qwen？

05:53

Jamba开源模型性能超越 Mixtral8*7B 采用最先进混合架构

10:15

开源通义千问Qwen1.5系列 14B和MoE2.7B哪个更好？ #小工蚁 #gpu

04:56

Command R专为RAG应用场景开发的大语言模型 #小工蚁

07:17

通义千问开源Qwen1.5-72B RAG海底捞针评测 #小工蚁

02:39

Command-R开源大语言模型测评 #小工蚁

03:32

通义千问开源Qwen1.5-32B 模型对比14B、72B性能如何？

04:59

通义千问1.5 32B和72B大模型性能对比2 #小工蚁

07:23

谷歌更新Transformer架构MoD 节省计算资源，提高模型性能 #小工蚁

07:32

MiniCPM-2B和MoE-8x2B模型开源最强“小模型” #小工蚁

07:03

Llama3和Llama2模型全面对比 #小工蚁

07:33

通义千问千亿大模型开源性能超LLaMA-3-70B #小工蚁

03:20

通义千问千亿模型比720亿模型更省算力 #小工蚁

04:15

SQLEval Text2SQL能力评估实践 #小工蚁

05:05

将LLaMA3上下文长度从8K扩展到超过100万

05:03

DeepSeek V2开源大模型为什么可以节省90% 以上KV Cache？

09:23

商汤开源Piccolo2大模型有啥亮点？#小工蚁

05:23

谷歌开源视觉大模型PaliGemma

06:54

多模态Embedding开源模型 Visualized BGE #小工蚁

03:44

飞鹰2系列：11B LLM和VLM支持欧洲11国语言 #小工蚁

05:56

VLM视觉大模型如何评测？MMMU排行榜 #小工蚁

04:47

VLM多模态开源大模型发展迅速下半年将成为主流

02:34

近期开源VLM大模型介绍 #小工蚁

09:52

Fish Speech V1.1发布支持Mac API流式推理演示 #小工蚁

03:33

阿里通义千问Qwen2大模型开源发布 7B达到上一代72B能力 #小工蚁

03:01

清华智谱chatglm4-9b-chat和qwen2-7b-chat哪个更强？

05:35

Yi-1.5-9b Ceval评测和Qwen2-7b glm-9b谁更强？

02:22

LLaMA3-8大模型FP8推理加速优势（更快更省）和演示

07:55

Qwen2-72-Instruct Ceval评测中英文双语最强开源模型？

02:50

Stable Diffusion 3开源发布文生图大模型媲美闭源商业模型

07:04

英伟达开源Nemotran4-340B大模型，性能直逼GPT4 #小工蚁

10:34

大模型提示工程技术调研报告（上）

07:58

大模型提示工程技术调研报告（下）

11:26

谷歌开源gemma2大语言模型用了啥新技术？

05:47

RouteLLM大模型GPT4o调用成本下降85%，性能达到95%

06:06

Mistral联合英伟达开发 NeMo 12B大模型支持中文 #小工蚁

03:18

Mistral-NeMo FP8推理加速

01:53

UC伯克利大模型调用函数排行榜，准确率高吗？#小工蚁

07:07

Meta开源LLaMA3.1 405B超大规模模型，性能直逼全球最强 #小工蚁

02:05

LLaMA3.1-8B性能评测如何运行性能最优？#小工蚁

02:23

Mistral开源Large 123B性能直逼LLaMA3.1 405B

04:28

LLaMA-3.1 8B中文能力如何？Ceval评测 #小工蚁

02:04

采访Meta科学家LLaMA3.1 405B是如何炼成的？#小工蚁

10:05

Google Gemma2 2B发布小模型性能同样强大 #小工蚁

03:33

抱抱脸开源小模型SmolLM和训练数据集 #小工蚁

08:25

Qwen2-Audio语音多模态大模型使用实践 #小工蚁

03:51

清华智谱开源生成视频大模型CogVideo

03:44

纯Memba架构大语言模型开源性能超越Transformer #小工蚁 #memba

11:15

Qwen2-7B-Instruct不同量化方法准确度和性能比较

04:37

微软开源Phi-3.5系列3个模型小而强

03:54

ggml开源大模型推理轻量框架支持手机推理大模型

04:27

微软开源Phi-3.5-mini-Instruct测评

03:02

Qwen2-VL通义千问多模态大模型能做什么？性能如何？ #小工蚁

04:17

Jamba1.5开源大模型同等性能降低10倍KV Cache

07:13

MiniCPM3-4B开源 4B参数挑战7B性能！真的吗？ #小工蚁

04:48

Reflection开源，让大模型学习“反思”

05:01

MemLong：提高大模型上下文的“外挂” #小工蚁

07:09

LLaMA-Omni开源语言对话大模型，超低延时 #小工蚁

07:31

通义千问2.5 7B-Instruct模型 C-eval评测 #小工蚁

02:18

阿里开源通义千问2.5系列大模型 #小工蚁

06:08

LongCite让大模型精准找到引用，智能回答更准确 #小工蚁

08:42

Qwen2.5-Coder写代码大模型技术报告解读 #小工蚁

07:20

Qwen2-72B大模型推理性能对比 4张RTX4090对比2张L20

02:29

Qwen2-72B性能对比英伟达RTX4090和L20各4卡

03:18

Jina Embedding v3开源多语言嵌入大模型

10:07

MOSHI实时对话大模型有啥技术亮点？

12:06

Meta发布LLaMA3.2多模态大模型 #小工蚁

07:32

阿里通义开源2个声音大模型SenseVoice和CosyVoice #小工蚁

08:34

通义千问2.5-72B大模型性能测试 Split-Fuse降低首个Token时间 #小工蚁

04:23

阿里通义千问2视觉大模型 #小工蚁

08:15

LLM投机解码实践和优化 #小工蚁

05:49

OCR-2.0开源小模型实现OCR端到端应用 #小工蚁 #pdf转markdown

05:04

开源最强VLM Molmo #小工蚁

05:08

如何降低通义千问72B大模型首个Token延时

02:36

EMU3大统一的多模态大模型 #小工蚁

04:16

探究模型亲缘关系以合并大语言模型 #小工蚁

08:58

Aya Expanse开源大模型支持多语言（中文），小且强 #小工蚁

05:08

TableGPT2针对表格问答场景开源大模型，性能超GPTo

10:07

腾讯开源混元大模型 MoE架构389B参数 #小工蚁

06:37

Qwen2.5-Coder阿里开源代码生成大模型 #小工蚁

03:34

上海AI创业团队开源OpenCoder代码生成大模型

07:04

抱抱脸开源SmolLM2 小模型运行在各种终端设备上

02:45

你信吗？一个弹窗就能让AI宕机！#小工蚁

05:40

大模型如何理解数字及如何改善？

13:12

国内类o1开源大模型纷纷发布，数学能力大幅提升

02:00

上海人工智能实验室开源视觉大模型InternVL2.5 #小工蚁

03:19

google开源Piligemma视觉大模型

09:33

模拟人类感知能力实时交互大模型IXC2.5-OL开源 #小工蚁

10:20

OpenAI官宣新一代最强模型o3有啥亮点？

05:29

通义千问2.5技术报告 #小工蚁

08:12

视觉大模型OCR全面评测

04:33

RAG新基座模型升级 ModernBert

06:47

全球首个半导体大模型SemiKong如何炼成的？#小工蚁

16:14

Meta推出全新Large Concept Models #小工蚁

04:52

Fish Speech 1.5 TTS开源模型

03:47

OLMO真正开源大模型

04:33

CosyVoice2开源TTS流式大模型实时语音“说”

07:27

DeepSeek V3技术报告深度解读

10:11

DeepSeek R1开源推理大模型性能对标OpenAI o1

03:23

DeepSeek R1技术报告解读性能比肩OpenAI o1

18:59

Mac运行VLLM推理DeekSeek R1蒸馏Qwen7B演示

02:58

通义千问视觉大模型VS人类谁更懂图？

05:15

抱抱脸发起复制DeepSeek R1开源项目Open-R1 #小工蚁 #deepseek

07:11

DeepSeekR1大模型多服务器分布式推理部署揭秘

09:02

腾讯发现DeepSeek推理大模型有欠思考问题

07:18

华佗医疗推理大模型蒸馏大模型o1推理能力

09:38

免费体验华为云32卡910B3 满血版DeepSeek R1

05:17

如何让DeepSeek R1推理大模型具有多模态能力?

03:33

文生视频大模型大盘点

06:44

通义千问最新视觉大模型VL2.5-7B OCR演示

02:57

企业独立部署DeepSeek R1最佳性价比实践

04:35

DeepSeek发布新算法NSA让大模型推理成本再降11倍

10:48

VLLM实现MLA注意力DeepSeek模型吞吐量大幅提升

03:16

谷歌发布更强视觉编码器 SigLIP2

04:09

QwQ-32B和DeepSeek蒸馏版压力测试性能对比

04:27

QwQ-32B和DeepSeek R1 32BCeval评估对比

04:49

RTX 4090 10卡双机运行DeepSeek 671B性能如何?

07:17

谷歌开源Gemma 3 27B 多模态大模型震撼来袭！

08:00

AI应用安全：如何检测和识别潜在风险？

04:24

谷歌开源Gemma-3-27B压测

04:16

后训练推理大模型全面调查

08:41

Mistral Small 3.1多语言 SOTA开源多模态模型

03:10

通义千问Qwen3和Qwen3MoE 即将发布

03:06

Meta开源Llama4

04:31

2024大模型狂飙突进

13:38

重新审视大型推理模型中的提示优化

06:41

上海人工智能实验室开源视觉大模型InternVL3

04:55

人工智能简史第5章: 神经网络简史

04:17

Qwen3和DeepSeek R1-32B 谁更胜一筹？性能大揭秘！（上）

04:00

Qwen3和DeepSeek R1-32B 谁更胜一筹？性能大揭秘！（下）

04:11

Qwen3-30B-A3B vs 32B性能大比拼!

03:42

通义千问3大模型应该如何选择？

04:24

微软开源20亿参数小模型BitNet性能更强

07:05

小米MiMo大模型Ceval评测

02:00

Metis开源多功能TTS模型

08:53

小米开源MiMo推理大模型有啥亮点?

05:00

通义千问3技术报告解读

11:24

大模型在多轮对话中迷失

08:00

Ollama支持最新推理模型 DeepSeek R1

03:10

阿里推出长推理开源大模型解决复杂长上下文推理

06:33

小米MiMo 7B多Token预测 MTP功能实践

04:32

DeepSeek R1 0528蒸馏版 Qwen3-8B性能如何？

03:33

阿里开源长上下文大模型测试 Qwen2.5-1M

06:20

Fish Speech推出新TTS模型OpenAudio-S1系列

03:52

开源机器人模型SmolVLA

04:38

Mistral开源推理大模型全面验证GRPO强化学习有效

08:42

顶部