使用llama.cpp项目bin文件运行，glm4-chat-9b大模型，速度不快，建议选择量化小的Q2试试_哔哩哔哩_bilibili

Name: %E4%BD%BF%E7%94%A8llama.cpp%E9%A1%B9%E7%9B%AEbin%E6%96%87%E4%BB%B6%E8%BF%90%E8%A1%8C%EF%BC%8Cglm4-chat-9b%E5%A4%A7%E6%A8%A1%E5%9E%8B%EF%BC%8C%E9%80%9F%E5%BA%A6%E4%B8%8D%E5%BF%AB%EF%BC%8C%E5%BB%BA%E8%AE%AE%E9%80%89%E6%8B%A9%E9%87%8F%E5%8C%96%E5%B0%8F%E7%9A%84Q2%E8%AF%95%E8%AF%95
Uploaded: 2025-06-13T20:09:05.700Z