如何让大语言模型Qwen-7b使用Langchain中的工具? #小工蚁 #qwen7b
阿里通义千问开源多模态大模型Qwen2.5-Omni 使用Unity 调用API
AWQ大模型量化INT4比FP16 推理快2倍,GPU内存1/3
多GPU推理加速Qwen-72B开源大模型 #小工蚁
通义千问Qwen1.5多个LoRA 同时部署和推理加速演示 #小工蚁
阿里Qwen3/MoE炸裂登场?自研架构+推理狂飙,训练成本暴降75%?深度解析技术革新
阿里更新千问大模型3Qwen3开源性能能否超越Deepseek R1?
QwQ-32B三种使用方式,超好上手!
多模态Embedding开源模型 Visualized BGE #小工蚁
全球最强开源大模型Qwen 3初体验,支持Ollama本地化部署,全面支持MCP
国产首个开源MoE大模型DeepSeekMoE 16B #小工蚁
北大开源法律大模型ChatLaw:让法律问题不再复杂 #小工蚁 #ChatLaw
我挖掘了最强开源模型Qwen3的五大隐藏玩法,堪称效率外挂!
让Mixtral-8*7B模型运行在16GB显存GPU上 #小工蚁
Aqulia2天鹰模型开箱测试,对比阿里Qwen-7B #小工蚁
部署大模型在TorchServe+vLLM #小工蚁
LatentSync数字人论文解读 #小工蚁
Transformers支持3种量化算法性能对比 #小工蚁
ChatGLM2如何进行模型微调演示 #小工蚁 #chatglm2
通义千问千亿大模型开源性能超LLaMA-3-70B #小工蚁