中文版Llama3,在ollama上畅快玩转多模态!
laohaibao666
2024年04月30日 23:13
收录于文集
共40篇

我们在llama3 in Chinese (首个llama3 中文版) 项目找发现已经有llama3 中文微调的多模态项目了,项目是Bunny-Llama-3-8B-V 和llava-llama-3-8b,这2个项目在huggingface上都有相应下载,模型下载地址  https://huggingface.co/BAAI/Bunny-Llama-3-8B-Vhttps://huggingface.co/xtuner/llava-llama-3-8b-v1_1,结合上期模型量化技术,我们今天来测试一下这个llama3 中文版多模态技术。

1 模型下载

目前huggingface已经有了gguf格式的模型文件了,我们只需要下载下来即可。

模型下载地址https://huggingface.co/xtuner/llava-llama-3-8b-v1_1-gguf/blob/main/llava-llama-3-8b-v1_1-int4.gguf

因为gguf文件是单个文件,我们只需要一个文件即可,这里我们选择lava-llama-3-8b-v1_1-int4.gguf 4B模型,点击浏览器下载直接在网页端即可完成下载。

 下载好模型保存到本地,我的电脑上是E:\AI\GGUF

2.编写Modelfile

我们修改Modelfile 文件如下

代码块
Shell
自动换行
复制代码
FROM ./llava-llama-3-8b-v1_1-int4.gguf
TEMPLATE """{{- if .System }}
<|system|>
{{ .System }}
</s>
{{- end }}
<|user|>
{{ .Prompt }}
</s>
<|assistant|>
"""
PARAMETER stop "<|system|>"
PARAMETER stop "<|user|>"
PARAMETER stop "<|assistant|>"
PARAMETER stop "</s>
复制成功

3.创建自定义模型

代码块
Shell
自动换行
复制代码
ollama create llava-llama-3-8b-v1_1-int4 -f Modelfile
复制成功

       通过以上命令我们完成自定义多模态模型ollama模型镜像的创建

4.模型运行

我们先检查一下模型是否加载 ollama 列表中

代码块
Shell
自动换行
复制代码
ollama list
复制成功

5  模型测试

       我们先用命令行测试一下

代码块
Shell
自动换行
复制代码
ollama run llava-llama-3-8b-v1_1-int4
复制成功

   我们使用电脑上chatbox 客户端工具调用一下

因为目前chatbox目前主推自己 chatbox AI ,所以我们输入图片后在进行聊天会报错

 这个时候为了验证多模态功能我们需要借助另外一套软件open-webui,关于open-webui  安装这里就不详细展开了。感兴趣的小伙伴可以私下给我。或者看我这期视频 《开启open-webui:一键集成ollama,打造革命性GPT体验!​

  open-webui 测试

  打开open-webui web端,从下拉模型选择我们刚才创建的自定义模型llava-llama-3-8b-v1_1-int4

   多模态功能是可以,但是识别率好像不行,可能和我本地使用4B量化后的模型有关系。

总结:我们通过以上方式实现了llama3 中文多模态模型结合 ollama 自定义创建模型的方式,通过open-webui 这个项目实现了llama3 中文微调版多模态使用。相信后面会有更加好用的基于llama3 版本的多模态模型出现。今天的分享就到这里,感兴趣小伙伴可以持续关注。