Z1-Rumination(智谱沉思)模型,技术实现分析报告
Herthon,一个为女性设计的编程语言(狗头保命)
阿里Qwen3强势发布!国产最强开源模型!10分钟带你本地部署Qwen3并实际测试!
1.58bit量化671B的DeepSeekR1模型,在CPU上缓慢推理或者2x H100 80GB
AI智能体的天塌了,国外研究人员发布具身智能AI模型,在思维链中调用工具,或将彻底颠覆传统Agent
开盒!AI时代的大模型安全风险
用GPT-4.1玩“森Tree”开发的小游戏《雨天》
Qwen 3 + Cline:最强免费AI编程组合?
实现OpenAI的ChatGPT视频聊天
最强的最小尺寸开源模型?Qwen3-0.6B对比Qwen2.5-0.5B实测
【Deepseek提示词】Deepseek不好用?那是你不会写提示词!学会这个提示词技巧,把你的Deepseek训练成精!
【整活】让R1评价贾浅浅《雪天》“一个坑……一条线”我们不会笑,除非忍不住
5060Ti 16G大模型实测:1.7B到32B Qwen3模型推理性能对比 | 30B参数效果惊人?!
通义千问qwen3 如何通过参数控制思考过程?大模型训练
手把手教你从0-1训练一个自己的专属大模型,LLM最佳训练指南来了!保姆级教程,小白一看就会! (训练+实操)
避免系统提示词泄漏的三种方案
OpenAI的ChatGPT视频聊天,我实现了
现在,请使用DeepSeek R1
【推理模型大作战】如何训练LLM“思考”?推理大模型新范式:从openai o1到DeepSeek-R1再到QwQ-32B;大模型推理 大模型训练 大模型入门
一句话干翻Qwen3