Qwen1.5-MoE: 1/3的激活参数量达到7B模型的性能

AI日日新

编辑于 2024年03月30日 07:16

首先需要安装依赖：

 代码块
Python
自动换行
复制代码
!pip install bitsandbytes modelscope
!pip install --upgrade accelerate
!pip install git+https://github.com/huggingface/transformers复制成功

接着加载模型并进行量化：

 代码块
Python
自动换行
复制代码
from modelscope import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig
import torch
tokenizer = AutoTokenizer.from_pretrained(&quot;qwen/Qwen1.5-MoE-A2.7B-Chat&quot;)
bnb_config = BitsAndBytesConfig(load_in_4bit=True, bnb_4bit_compute_dtype=torch.bfloat16)
model = AutoModelForCausalLM.from_pretrained(&quot;qwen/Qwen1.5-MoE-A2.7B-Chat&quot;, quantization_config=bnb_config)复制成功

定义聊天函数：

 代码块
Python
自动换行
复制代码
def qwen_moe_chat(prompt: str):
    messages = [{&quot;role&quot;: &quot;system&quot;, &quot;content&quot;: &quot;You are a helpful assistant.&quot;}, {&quot;role&quot;: &quot;user&quot;, &quot;content&quot;: prompt}]
    text = tokenizer.apply_chat_template(messages,tokenize=False, add_generation_prompt=True)
    model_inputs = tokenizer([text], return_tensors=&quot;pt&quot;).to(&#39;cuda&#39;)
    generated_ids = model.generate(model_inputs.input_ids, max_new_tokens=512)
    generated_ids = [output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)]
    response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
    return response复制成功

最终对模型进行测评：

 代码块
Python
自动换行
复制代码
book_review = [&quot;很生气，一晚上看完，只有生气。太矫情了&quot;,
               &quot;这个标题真是太贴切了，真的是罪，真的是美。&quot;,
               &quot;没有才调，看在材料份上加一星。&quot;,
               &quot;电影更值得一看&quot;,
               &quot;历史书做成这样真是太赞了！&quot;,
               &quot;废话太多&quot;,
               &quot;啥玩意，情色系的啊。故事一般。看的困。&quot;,
               &quot;你是猴子请来的逗逼吗。&quot;,
               &quot;人生读过最狗血的书之一  除了对了解穆斯林信仰风俗有所帮助之外都是狗血&quot;,
               &quot;作为资深影迷，这本书必读&quot;,
               &quot;两章果断弃！&quot;,
               &quot;跟看我高中同学的日记本差不多。&quot;,
               &quot;文不对题，读不下去。&quot;,
               &quot;莫非法国人的法语水平都堕落了？&quot;,
               &quot;就不加友情分了…&quot;,
               &quot;如隔夜白开，索然无味。&quot;,
               &quot;2015.1025  融合了我喜欢的所有元素，校园爱情、破镜重圆、高干子弟，可是却写不出一篇让人有一口气读下去的好文。&quot;,
               &quot;没多大意思，文笔俏皮轻佻得刻意。&quot;,
               &quot;据说抄袭大风刮过的《桃花债》和公子欢喜的《思凡》，呵呵哒&quot;,
               &quot;第二遍&quot;]

prompt = &quot;评论：{} 请将以上评论分类到 好评 或 差评（你只需要回复 好评 或 差评）&quot;

for review in book_review:
    new_prompt = prompt.format(review)
    response = qwen_moe_chat(new_prompt)
    print(response, review)复制成功

UP主的推荐

文本分类实战

¥99起

UP主的推荐

自然语言处理实用教程

¥99起

cv33479928

分享至

投诉或建议