Qwen1.5系列6个模型如何选择? AWQ还是GPTQ?#小工蚁

8995
1
2024-02-09 08:15:00
正在缓冲...
121
41
181
32
Qwen1.5系列6个模型如何选择? AWQ还是GPTQ?#小工蚁
小工蚁创始人 张文斌原土豆网第九个员工,土豆网技术总监
开源大语言模型
(17/180)
自动连播
59.2万播放
简介
Mixtral-8*7B开源模型生产环境部署优化 2块RTX4090 #小工蚁
05:53
训练大语言模型LLM 如何定义自己训练数据集?#小工蚁
13:40
如何微调开源Yi-34B成为Open LLM排名前三模型 #小工蚁
09:19
大语言模型构建新工具MergeKit 集百家之长融于一身 #小工蚁
09:39
国产首个开源MoE大模型DeepSeekMoE 16B #小工蚁
06:37
最强长上下文Text Embedding 开源模型M2-BERT
09:33
MiniMA-Chat-3B开源小模型 中英文双语 #小工蚁
04:57
智谱AI GLM4和InternLM2国产大语言模型更新迭代 #小工蚁
05:12
斯坦福开源RadixAttention算法 和SGLang语言,性能再翻5倍
08:01
让Mixtral-8*7B模型运行在16GB显存GPU上 #小工蚁
08:09
PatchTSMixer开源最强多变量 时间序列预测算法
09:05
开源InternLM2大模型测评 #小工蚁
05:34
AWQ和GPTQ大模型4bit量化 哪种算法更优?#小工蚁
03:18
Yi-VL开源最强多模态大模型 #小工蚁
04:56
突破极限:Yi-VL多模态模型惊艳亮相,推理加速性能压测演示 #小工蚁
13:24
Qwen1.5大模型春节前发布 阿里送大礼包看看有啥?
09:32
Qwen1.5系列6个模型如何选择? AWQ还是GPTQ?#小工蚁
07:49
中国开源1bit大模型量化算法BiLLM来啦 #小工蚁
08:56
Smaug开源大模型排行第一基于Qwen72B微调大模型 #小工蚁
04:22
大语言模型提示工程新框架 Self-Discover超越CoT
06:01
谷歌发布Gemini 1.5超长上下文 如何实现?UC伯克利告诉你
10:55
谷歌Gemini系列模型开源了,发布Gemma 2B和7B2个模型 #小工蚁
06:37
谷歌开源Gemma-7B大模型性能和中文能力测试 #小工蚁
02:50
谷歌公布无需提示工程CoT推理解码算法 #小工蚁
10:40
StarCoder2及数据集正式发布 #小工蚁
03:29
多GPU推理加速Qwen-72B开源大模型 #小工蚁
04:53
零一万物发布Yi-9B大模型,代码数学推理能力全面提升 #小工蚁
07:04
零一万物开源大模型Yi-9B测试,性能到底如何?#小工蚁
08:52
LMSYS全球大模型PK排行榜 Qwen1.5-72B开源排名第一 #小工蚁
05:44
大语言模型企业应用排行榜,哪个模型最强?#小工蚁
04:38
揭晓答案:Qwen-72B和Yi-34B生产部署性能哪个更强?
08:01
通义千问Qwen1.5多个LoRA 同时部署和推理加速演示 #小工蚁
13:54
Qwen1.5-72B上下文推理准确度评估演示16K时最优 #小工蚁
03:43
马斯克开源全球最大模型Grok 8个专家模型组成314B神经网络
06:19
腾讯开源LlaMA Pro增强LLM性能 新方法,打造行业模型 #小工蚁
06:20
Embedding模型8bit量化推理 成本下降4倍,准确度下降0.7%
07:22
Databricks开源超千亿规模 大模型DBRX,性能超Grok
04:48
阿里开源Qwen1.5-MoE模型 评测性能究竟如何?
08:32
阿里开源Qwen1.5-MOE-A2.7B CEval评测 #小工蚁
02:53
近期开源4个MoE大模型哪个最优?DBRX?Qwen?
05:53
Jamba开源模型性能超越 Mixtral8*7B 采用最先进混合架构
10:15
开源通义千问Qwen1.5系列 14B和MoE2.7B哪个更好? #小工蚁 #gpu
04:56
Command R专为RAG应用场景开发的大语言模型 #小工蚁
07:17
通义千问开源Qwen1.5-72B RAG海底捞针评测 #小工蚁
02:39
Command-R开源大语言模型测评 #小工蚁
03:32
通义千问开源Qwen1.5-32B 模型对比14B、72B性能如何?
04:59
通义千问1.5 32B和72B大模型性能对比2 #小工蚁
07:23
谷歌更新Transformer架构MoD 节省计算资源,提高模型性能 #小工蚁
07:32
MiniCPM-2B和MoE-8x2B模型 开源最强“小模型” #小工蚁
07:03
Llama3和Llama2模型全面对比 #小工蚁
07:33
通义千问千亿大模型开源性能超LLaMA-3-70B #小工蚁
03:20
通义千问千亿模型比720亿模型更省算力 #小工蚁
04:15
SQLEval Text2SQL能力评估实践 #小工蚁
05:05
将LLaMA3上下文长度从8K扩展 到超过100万
05:03
DeepSeek V2开源大模型为什么可以节省90% 以上KV Cache?
09:23
商汤开源Piccolo2大模型有啥亮点?#小工蚁
05:23
谷歌开源视觉大模型PaliGemma
06:54
多模态Embedding开源模型 Visualized BGE #小工蚁
03:44
飞鹰2系列:11B LLM和VLM支持欧洲11国语言 #小工蚁
05:56
VLM视觉大模型如何评测?MMMU排行榜 #小工蚁
04:47
VLM多模态开源大模型发展迅速 下半年将成为主流
02:34
近期开源VLM大模型介绍 #小工蚁
09:52
Fish Speech V1.1发布支持Mac API流式推理演示 #小工蚁
03:33
阿里通义千问Qwen2大模型开源发布 7B达到上一代72B能力 #小工蚁
03:01
清华智谱chatglm4-9b-chat和qwen2-7b-chat哪个更强?
05:35
Yi-1.5-9b Ceval评测和Qwen2-7b glm-9b谁更强?
02:22
LLaMA3-8大模型FP8推理加速 优势(更快更省)和演示
07:55
Qwen2-72-Instruct Ceval评测 中英文双语最强开源模型?
02:50
Stable Diffusion 3开源发布 文生图大模型媲美闭源商业模型
07:04
英伟达开源Nemotran4-340B大模型,性能直逼GPT4 #小工蚁
10:34
大模型提示工程技术 调研报告(上)
07:58
大模型提示工程技术 调研报告(下)
11:26
谷歌开源gemma2大语言模型用了啥新技术?
05:47
RouteLLM大模型GPT4o调用成本下降85%,性能达到95%
06:06
Mistral联合英伟达开发 NeMo 12B大模型支持中文 #小工蚁
03:18
Mistral-NeMo FP8推理加速
01:53
UC伯克利大模型调用函数排行榜,准确率高吗?#小工蚁
07:07
Meta开源LLaMA3.1 405B超大规模模型,性能直逼全球最强 #小工蚁
02:05
LLaMA3.1-8B性能评测 如何运行性能最优?#小工蚁
02:23
Mistral开源Large 123B性能直逼LLaMA3.1 405B
04:28
LLaMA-3.1 8B中文能力如何?Ceval评测 #小工蚁
02:04
采访Meta科学家LLaMA3.1 405B是如何炼成的?#小工蚁
10:05
Google Gemma2 2B发布小模型性能同样强大 #小工蚁
03:33
抱抱脸开源小模型SmolLM和训练数据集 #小工蚁
08:25
Qwen2-Audio语音多模态大模型使用实践 #小工蚁
03:51
清华智谱开源生成视频大模型CogVideo
03:44
纯Memba架构大语言模型开源性能超越Transformer #小工蚁 #memba
11:15
Qwen2-7B-Instruct不同量化方法准确度和性能比较
04:37
微软开源Phi-3.5系列3个模型 小而强
03:54
ggml开源大模型推理轻量框架 支持手机推理大模型
04:27
微软开源Phi-3.5-mini-Instruct测评
03:02
Qwen2-VL通义千问多模态大模型能做什么?性能如何? #小工蚁
04:17
Jamba1.5开源大模型同等性能降低10倍KV Cache
07:13
MiniCPM3-4B开源 4B参数挑战7B性能!真的吗? #小工蚁
04:48
Reflection开源,让大模型学习“反思”
05:01
MemLong:提高大模型上下文的“外挂” #小工蚁
07:09
LLaMA-Omni开源语言对话大模型,超低延时 #小工蚁
07:31
通义千问2.5 7B-Instruct模型 C-eval评测 #小工蚁
02:18
阿里开源通义千问2.5系列大模型 #小工蚁
06:08
LongCite让大模型精准找到引用,智能回答更准确 #小工蚁
08:42
Qwen2.5-Coder写代码大模型技术报告解读 #小工蚁
07:20
Qwen2-72B大模型推理性能对比 4张RTX4090对比2张L20
02:29
Qwen2-72B性能对比 英伟达RTX4090和L20各4卡
03:18
Jina Embedding v3开源多语言嵌入大模型
10:07
MOSHI实时对话大模型 有啥技术亮点?
12:06
Meta发布LLaMA3.2多模态大模型 #小工蚁
07:32
阿里通义开源2个声音大模型SenseVoice和CosyVoice #小工蚁
08:34
通义千问2.5-72B大模型性能测试 Split-Fuse降低首个Token时间 #小工蚁
04:23
阿里通义千问2视觉大模型 #小工蚁
08:15
LLM投机解码实践和优化 #小工蚁
05:49
OCR-2.0开源小模型实现OCR端到端应用 #小工蚁 #pdf转markdown
05:04
开源最强VLM Molmo #小工蚁
05:08
如何降低通义千问72B大模型 首个Token延时
02:36
EMU3大统一的多模态大模型 #小工蚁
04:16
探究模型亲缘关系以合并大语言模型 #小工蚁
08:58
Aya Expanse开源大模型 支持多语言(中文),小且强 #小工蚁
05:08
TableGPT2针对表格问答场景开源大模型,性能超GPTo
10:07
腾讯开源混元大模型 MoE架构389B参数 #小工蚁
06:37
Qwen2.5-Coder阿里开源代码生成大模型 #小工蚁
03:34
上海AI创业团队开源OpenCoder代码生成大模型
07:04
抱抱脸开源SmolLM2 小模型运行在各种终端设备上
02:45
你信吗?一个弹窗就能让AI宕机!#小工蚁
05:40
大模型如何理解数字及如何改善?
13:12
国内类o1开源大模型纷纷发布,数学能力大幅提升
02:00
上海人工智能实验室开源视觉大模型InternVL2.5 #小工蚁
03:19
google开源Piligemma视觉大模型
09:33
模拟人类感知能力实时交互大模型IXC2.5-OL开源 #小工蚁
10:20
OpenAI官宣新一代最强模型o3有啥亮点?
05:29
通义千问2.5技术报告 #小工蚁
08:12
视觉大模型OCR全面评测
04:33
RAG新基座模型升级 ModernBert
06:47
全球首个半导体大模型SemiKong如何炼成的?#小工蚁
16:14
Meta推出全新Large Concept Models #小工蚁
04:52
Fish Speech 1.5 TTS开源模型
03:47
OLMO真正开源大模型
04:33
CosyVoice2开源TTS流式大模型 实时语音“说”
07:27
DeepSeek V3技术报告深度解读
10:11
DeepSeek R1开源推理大模型 性能对标OpenAI o1
03:23
DeepSeek R1技术报告解读 性能比肩OpenAI o1
18:59
Mac运行VLLM推理DeekSeek R1蒸馏Qwen7B演示
02:58
通义千问视觉大模型VS人类 谁更懂图?
05:15
抱抱脸发起复制DeepSeek R1开源项目Open-R1 #小工蚁 #deepseek
07:11
DeepSeekR1大模型多服务器分布式推理部署揭秘
09:02
腾讯发现DeepSeek推理大模型 有欠思考问题
07:18
华佗医疗推理大模型 蒸馏大模型o1推理能力
09:38
免费体验华为云32卡910B3 满血版DeepSeek R1
05:17
如何让DeepSeek R1推理大模型具有多模态能力?
03:33
文生视频大模型大盘点
06:44
通义千问最新视觉大模型VL2.5-7B OCR演示
02:57
企业独立部署DeepSeek R1最佳性价比实践
04:35
DeepSeek发布新算法NSA让大模型推理成本再降11倍
10:48
VLLM实现MLA注意力DeepSeek模型吞吐量大幅提升
03:16
谷歌发布更强视觉编码器 SigLIP2
04:09
QwQ-32B和DeepSeek蒸馏版压力测试性能对比
04:27
QwQ-32B和DeepSeek R1 32BCeval评估对比
04:49
RTX 4090 10卡双机运行DeepSeek 671B性能如何?
07:17
谷歌开源Gemma 3 27B 多模态大模型震撼来袭!
08:00
AI应用安全: 如何检测和识别潜在风险?
04:24
谷歌开源Gemma-3-27B压测
04:16
后训练推理大模型全面调查
08:41
Mistral Small 3.1多语言 SOTA开源多模态模型
03:10
通义千问Qwen3和Qwen3MoE 即将发布
03:06
Meta开源Llama4
04:31
2024大模型狂飙突进
13:38
重新审视大型推理模型中的提示优化
06:41
上海人工智能实验室开源视觉大模型InternVL3
04:55
人工智能简史 第5章: 神经网络简史
04:17
Qwen3和DeepSeek R1-32B 谁更胜一筹?性能大揭秘!(上)
04:00
Qwen3和DeepSeek R1-32B 谁更胜一筹?性能大揭秘!(下)
04:11
Qwen3-30B-A3B vs 32B性能大比拼!
03:42
通义千问3大模型应该如何选择?
04:24
微软开源20亿参数小模型BitNet性能更强
07:05
小米MiMo大模型Ceval评测
02:00
Metis开源多功能TTS模型
08:53
小米开源MiMo推理大模型有啥亮点?
05:00
通义千问3技术报告解读
11:24
大模型在多轮对话中迷失
08:00
Ollama支持最新推理模型 DeepSeek R1
03:10
阿里推出长推理开源大模型解决复杂长上下文推理
06:33
小米MiMo 7B多Token预测 MTP功能实践
04:32
客服
顶部
赛事库 课堂 2021拜年纪