deepseek r1微调模型应用落地案例(医疗法律,PatientSeek),适合借鉴学习。

9.5万
41
2025-02-16 14:12:05
正在缓冲...
3573
2826
1.1万
1104
本视频讲解deepseek r1微调模型应用落地案例(医疗法律),适合大家学习和借鉴,代码和相关资料完全开源。 视频中markdown(含代码)文档地址:https://pan.quark.cn/s/ce195bd4aeeb llama-cpp-python的whl下载地址:https://pan.quark.cn/s/947a7c2266cb 博客地址:https://medium.com/enterprise-rag/introducing-patientseek-the-first-open-source-med-legal-deepseek-reasoning-model-74f98e9608ae PatienSeek的huggingface地址:https://huggingface.co/whyhow-ai/PatientSeek/tree/main/snapshots/70661aa9b9e6c69734b394916ddbc540fd4731bf PatientSeek(gguf)模型下载地址:https://pan.quark.cn/s/1de062d8ff80
自动连播
41.5万播放
简介
号称目前最强开源大模型, 使用了 Reflection-Tuning技术,能够自我纠错。
07:30
deepseek的深度思考太像人的思维过程了,并且也很好的把思维过程转成代码
06:15
5分钟极简本地部署deepseek-r1蒸馏模型,并且快速搭建前端页面
06:47
如何让deepseek-r1支持agent工具调用
05:25
如何快速微调DeepSeek-R1-8b模型,并且可视化训练过程,赶紧行动起来
15:26
如何在本地微调DeepSeek-R1-8b模型
11:24
如何将微调后的DeepSeek-R1-8b模型转成ollama格式的模型,方便提供api服务
19:22
从零开始手撕微调代码(deepseek-r1蒸馏模型),并且本地运行和调试,无需联网。
54:27
继续手写微调代码(deepseek-r1蒸馏模型),构建本地推理pipeline。
17:09
deepseek r1微调模型应用落地案例(医疗法律,PatientSeek),适合借鉴学习。
34:24
来自deepseek最新论文(2.17)解读,展示如何构建高质量推理数据集。
50:46
deepseek多模态模型(janus)的应用案例demo,事故预警监测。
06:03
kimi最新技术(MoBA)论文:MoE和Block Attention的创新性组合支撑LLM百万级上下文长度
51:35
deepseek多模态模型(janus)微调实战。
22:18
deepseek开源FlashMLA,MLA解码内核,针对可变长度序进行底层计算优化
07:09
DeepSeek开源DeepGEMM, 针对矩阵乘法进行优化
10:43
一种新的大语言模型范式,扩散大语言模型(diffusion LLM)
08:02
开放推理数据集共享,真的很方便。
05:00
一种有意思的语言模型,扩散语言模型(LLaDA),已经开源。
20:58
传统RAG即将落幕,Agentic RAG的时代来了
28:54
客服
顶部
赛事库 课堂 2021拜年纪