2D图片转3D文件OBJ格式,Comfyui的TripoSR插件测试,3月8日更新

895
0
2024-03-08 11:56:54
作者声明:个人观点,仅供参考
正在缓冲...
13
投币
22
3
TripoSR是SD母公司推出的2D转3D的模型,看到有大佬做了对应的comfyui插件,就及时更新看看。 插件安装使用难度:3星(全域VPN或外网),5星(非全域VPN或无法直连抱脸) 其他报错,比如输出节点404,插件问答区有说明,找不到就评论区问我吧。
Comfyui开源插件开发者; 工作日分享最新的AI方法; 分享comfy插件测试视频。
自动连播
30.3万播放
简介
强烈推荐ComfyUI_TensorRT!新的Unique3D 网格模型方法
02:46
ComfyUI-StoryDiffusion和HiDiffusion-Pro插件的重要更新介绍
01:46
ComfyUI-storydiffussion插件及最新DMD2加速模型测试
02:28
controlnet++即将登场?0413
01:47
基于Parler_TTS自制的ComfyUI_TTS插件测试,ComfyUI日常0412
01:59
XL模型加内绘伪实时绘画自制工作流及comfyUI日常0411
02:28
Controlnet内绘梦幻XL模型测试及ComfyUI日常0410
02:28
4月9日更新:我制作的ComfyUI-ChatGLM-API开源插件测试
03:00
4月8日更新:ComfyUI日常,SD官方最新的CosXL模型测试
03:12
4月7日更新:ComfyUI日常更新,基于更新的IP2P再再测试
01:34
4月6日更新,comfyUI日常及IP2P再测试
03:53
4月5日更新:腾讯MuseV动画及对应ComfyUI插件测试
04:05
4月3日,Steerable-Motion运动可控视频插件测试
02:34
4月2日更新:ComfyUI日常及“背景移除插件”对比测试
02:43
4月1日常更新及IP2P模型伪测试
02:37
3月31日更新腾讯AniPortrait 人像动画音频驱动合成模型测试
02:10
3月30日更新:comfyUI日常及SDXS0.9类LCM加速模型测试
03:39
3月29日重磅ai应用,Suno生成式歌曲创作,强烈推荐测试、尝试
03:40
3月28日,comfyui日常,TCD-SDXL-LoRA超级加速LORA模型
03:41
3月27日comfyUI日常系列,Lora变种,Dora微调不严谨测试
02:16
3月26日comfyui日常更新,DDColor上色及CCSR高清修复插件,
02:14
3月25日ComfyUI日常系列,motionctrl 文生视频路径控制插件,
01:34
3月24日ComfyUI日常更新系列,①新奇ip adapter模型测试,②animate-diff lighting 文生视频测试,
01:59
3月23日ComfyUI 字节跳动animate-diff lighting 闪电加速模型测试,
03:02
3月22日ComfyUI 日常更新及SV3D转DUST3R工作流测试,
01:04
3月21日ComfyUI 日常更新及“视频加绿幕”工作流
01:05
3月20日ComfyUI 日常更新及“SV3D工作流测试”,
01:02
3月19日ComfyUI 日常更新SV3D支持(重要更新)
01:35
3月17日ComfyUI 日常更新系列DPMAdaptative 采样器额外节点
02:23
3月16日ComfyUI插件测试 DUSt3R 2D转3D插件
01:13
3月15日特别版《ComfyUI 日常更新系列》及《插件和库安装简单教程》
02:32
3月14日comfyUI animatediff动画制作插件测试,
02:28
3月13日comfyui日常更新测试,更新3M及LMS采样器节点
01:21
3月12日Comfyui的日常更新测试,含部分答疑内容
00:58
3月11日Comfyui的CLIP merging节点更新测试,
01:35
3月10日Comfyui的Euler A节点更新测试,
01:52
3月9日Comfyui的“图像反推文字插件-MoonDream”测试,
03:40
3月8日2D图片转3D文件OBJ格式,Comfyui的TripoSR插件测试,
02:01
3月7日comfyui关键更新, Stable Cascade的controlnet超分辨率模型已可以在comfyui工作流中使用
01:51
3月6日关键更新, Stable Cascade的canny已可以在comfyui工作流中使用
02:05
3月5日comfyui的kornia库的初步应用尝鲜。
04:34
MuseTalk测试MuseV加TTS工作流0415
02:03
PBR材质制作模型及GPT-sovits-comfyUI插件伪测试0416
01:19
PBR材质AI生成插件及PerpNeg节点测试
01:34
AI-PBR贴图质量 粗测 ComfyUI 日常更新
01:10
SD3粗看,controlnet++快测,日常更新
00:59
一键换衣插件测试,避坑指南及日常更新
00:52
最新,Hyper-SD 模型尝鲜测试先导视频
00:31
最新Hyper-SD尝鲜测试
01:58
Hyper_SD助力AI实时绘画,你的krita可以删掉了。
01:51
给小白新手做的ComfyUI抱脸模型下载插件
01:43
人体抠图插件测试及对应XL内绘工作流
01:26
Typer-SD官方ComfyUI插件测试
02:32
Dreamer XL内绘v2版模型测试
01:50
最新Llama 3与Phi 3模型,“猫娘”设定对话粗测
01:43
最新的Align Your Steps调度器对比测试
02:06
羊驼3的ComfyUI插件及语音转prompt插件
01:27
最新B-Lora 尝鲜测试
01:42
新高清修复放大模型及comfyUI模型下载插件更新
01:58
Hyper-SD 高CFG值lora测试,TCD插件测试
02:03
Story-Diffusion故事画板AI生成实机测试
01:48
CustomNet,腾讯-零样本换视角扩散模型测试
02:22
基于llama.cpp的 提示词美化及图片反推插件
01:39
fish-speech TTS,B-lora ComfyUI应用测试
02:12
PuLID_ComfyUI人脸复刻插件测试
02:07
HiDiffusion comfyUI高清图片生成插件测试 解锁更高分辨率的创造力和效率
02:06
MasterWeaver 人脸复刻与 DGE 直接高斯3维编辑前瞻
01:06
IC-Light 图片光照控制插件,MistoLine 新controlnet线图XL模型
02:19
ComfyUI-ELLA,EMMA,全景消焦及Diffusion2GAN技术前瞻
02:02
腾讯-混元Hunyuan开源, Hidiffusion插件更新
01:49
ID-Animator Zero-shot(零样本)人物视频生成
01:19
ID_Animator ComfyUI自制插件测试
01:11
自制CustomNet移植ComfyUI插件测试
01:25
ComfyUI-Anyline超高素质细致线Controlnet适配测试
01:27
ComfyUI-Hidiffusion插件更新 anyline及openpose XL适配
02:04
CharacterFactory角色工厂测试
02:00
Texture Dreamer 3D纹理生成方法
01:11
MiniCPM-Llama3-V-2_5大模型测试
01:07
DMD2四步加速模型惊艳ComfyUI-storydiffussion插件上线
01:25
Pandora自然语言模型,signLLM手语大模型,及SDXL flash模型测试
02:02
streamv2v直播推流换脸方法及comfyUI插件测试,SDXL controlnet scribble 模型
01:47
3DitScene “语言引导编辑任意场景“方法 Story插件更新,加入加速模型
01:58
PCM加速lora,ComfyUI_omost和MusePose测试
03:20
最新智普glm-4-9b开源模及SD公司出品stable-audio-open-1.0文生音频模型测试
02:52
最新Flash Diffusion加速“任意”扩散模型 ComfyUI_StableAudio_Open 插件测试
02:13
材质赋予,语义增强等pOps方法介绍, Physics3D方法介绍
02:16
0611
01:45
ComfyUI_Pops 插件开源上线 Follow-Your-Emoji 方法介绍
02:03
ComfyUI_Pops 插件开源上线 Follow-Your-Emoji 方法介绍
02:29
LEDITS 真实图像编辑方法 SD3-diffusers 流程测试 VideoLLaMA 2 方法介绍
02:31
comfyUI-StoryDiffusion 已支持Lora及修复风格bug Depth-Anything-V2 方法介绍
02:19
Control-X 无引导文生图控制结构和外观方法
02:08
DiffAvatar 基于差分仿真的仿真服装优化 HIdiffusion 基于官方更新已重构
00:58
SD3 -Flash 4步出图,为 story-diffusion插件推荐一些动漫风的lora
01:32
MS-Diffusion方法介绍,基于MS-diffusion,story-diffusion 加入双角色同框功能
01:25
LEDITS++方法,story双角色功能正式上线
01:26
Florence-2 推进各种视觉任务的统一表示 EvTexture 基于事件驱动的视频超分辨率纹理增强
01:43
DiffSynth-Studio 新的扩散引擎 MOFA-Video基于生成运动场的可控制图像动画
01:23
RobustSAM 对退化图像进行鲁棒分割新方法
01:11
不需要梯子,三步解决抱脸模型下载问题,CLAY 创建高质量的3D资产的方法
02:03
Story_diffusion 加入双人同框controlnet功能,PointDreamer 基于彩色点云二维修复重建的零样本三维纹理网格方法,
01:42
Controlnet-tile-sdxl上新, AuraSR基于GAN的超分辨率放大方法
02:15
MARS5-TTS方法 日常更新
01:03
MimicMotion 高质量人体运动视频生成,Hunyuan-Captioner 混元捕手
02:10
Mann-E_Dreams加速模型 ,PAG方法 MS-diffusion方法的comfyUI故事画板插件
02:08
Surf-D 生成任意拓扑的高质量曲面方法,InstantStyle-Plus方法
01:40
LivePortrait 具有缝合和重定目标控制的高效人像动画 HunyuanDiT-comfyUI 测试一下
02:01
controlnet++ 代码放出 BeyondScene 具有预训练扩散的高分辨率以人为中心的场景生成
01:30
ComfyUI-anydoor换衣插件已开源上线。
01:24
ComfyUI-makeup一键人脸化妆插件,Housecrafter及 Tile-Upscaler 方法
01:20
GeoWizard 方法 FC diffusion方法 EchoMimic 方法快速浏览
01:22
VEnhancer及Mast3R及Color peel方法一览
01:18
StyleSplat方法一览,RTMPose3D工具包及ComfyUI_EchoMimic插件
01:12
RRM,及最优高斯散斑方法,及ComfyUI_EchoMimic
01:07
Text-Animator、Video-Infinity及ComfyUI_FollowYourEmoji 表情包制作插插件
01:26
IDOL、Click-Gaussian及LaSe-E2V方法一览
01:48
FL-Trainer在comfyUI中训练lora,ComfyUI_Streamv2v_Plus:易用的streamv2v已上线
01:23
PhotomakeV2,SyncTweedies:基于同步扩散的通用生成框架 ComfyUI_Hi-diffusion:易用性更新
01:51
DVT V2:去噪视觉变换器 日常更新
01:00
HumanVid数据集,AccDiffusion超分方法,LightenDiffusion低光增强
01:09
One Noise to Rule Them All(噪声魔戒?),TRG-Release,AuraSR-v2高清修复模型
01:37
Diffree:方法介绍, Artist:无需训练,无controlnet,lora的风格模型
01:29
SF3D,SD公司快速3D建模,ComfyUI_MS_Diffusion代码重构以复现官方
01:32
Tora:阿里最新视频生成方法, ComfyUI_Diffree插件已上线
00:50
ComfyUI_StoryDiffusion加入可灵模型及PhotomakeV2支持,PAI缓解LVLM模型的幻视,
01:38
TurboEdit 小步扩散,ProCreate 更有创造力的扩散,matting-by-generation:抠图新秀?
01:24
IP-Adapter-Instruct 方法介绍和 ComfyUI_FoleyCrafter 视频配音插件
01:37
ControlNext和Stable-audio-controlnet:方法一览
01:21
MooER基于LLM的语音识别及翻译及comfyUI插件,以及1个新的3D及UV贴图生成方法
02:10
CLIP-fine-tune:微调你自己的clip模型
01:10
TiTok和TurboEdit以及Imagine yourself方法介绍
01:44
DEGAS:全身段高斯化身(数字人)
01:35
UniPortrait多角色IP类框架,MegaFusion高分辨率的SD模型
00:51
Sapiens(智人): Meta的人类视觉模型基础的新方法一览
00:48
RB-Modulation 谷歌基于随机最优控制的扩散模型无训练个性化
00:51
AuraFace人像emb新模型,CogVideoX-5b上新
01:17
AiM:首个基于Mamba框架的扩散模型方法,Build-A-Scene方法
01:06
GameNGen:第一个完全由神经网络模型驱动的游戏引擎 KEEP:新加坡南洋理工的高清视频修复方法
01:08
Sapiens-Pytorch-Inference: 基于spaiens的pytorch推理 CSGO:文本到图像生成中的内容风格组合
01:23
SHOW-O方法介绍,看看CoRe新论文
01:51
DiffUHaul:无需训练的图像对象拖动方法 CSGO:推理代码放出
01:08
看看DeepFakeDefenders,Loopy数字人
01:19
FluxMusic,ViewCrafter,DeepFakeDefenders第一名及comfyUI插件
01:28
StreamingT2V的StreamingSVD方法,以及企鹅的Open-MAGVIT2上新
01:16
RB-Modulation的demo演示,Conan-embedding-v1
01:14
3D Gaussian Ray Tracing 项目及基于弗洛伦萨2的comfyUI打标插件
01:06
LinFusion高清图片生成,羊驼3Omni语音交互
01:13
FLUX-PuLID面世,看看Adobe的新方法
01:12
Instant Drag,数字人新方法,finegrain-box-segmenter,脱底模型介绍
02:14
GVHMR创建真实动作,Phidias新的3D资产生成模型
01:38
3DTopia-XL生成3D资产和PBR材质,diffusion-e2e-ft微调模型方法,
01:34
StoryMaker 小红书故事方法,storydiffusion插件已同步该功能
01:33
ExAvatar全身3D高斯化身项目,StableDelight去除镜面反射高光
01:47
OpenMusic 表现出众的开源音乐生成项目 SoundStorm 谷歌的高效并行音频生成项目
02:41
TextBoost 通过微调文本编码器实现文生图模型的一次性个性化,调试story maker
02:12
Emu3,多模态模型,MaskBit:Embedding-free的方法
01:16
ComfyGen文生图优化,DisEnvisioner图生图优化
01:11
ML-depth-pro 苹果深度模型, 复现Story-maker的controlnet
01:22
港科大的 Lotus深度及法线预测方法 魔搭的Ace
01:25
Stable Video Portraits最新数字人方法 Inverse Painting还原绘画步骤
01:12
GS-VTON 可控三维虚拟试穿 VFusion3D 3D资产项目
01:21
RGB-X 室内AI渲染新思路,DreamMesh4D 视频到4D生成
01:26
TextToon 实时卡通转绘 Pyramidal Flow 快手开源视频生成
01:21
Flex3D和AniSDF 两个3D重建项目介绍
01:07
GAGavatar数字化身方法,Meissonic模型,ComfyUI-Sapiens插件
00:56
ComfyUI-sapiens插件上线,RF-Inversion改善flux出图质量
01:30
Janus模型,MeshUp及HART方法,RF-Inversion非官方复现
01:30
ComfyUI_Hallo2音频驱动动画并放大comfyUI插件已上线
01:19
BitNet 微软的1比特LLM官方推理框架,只用i7跑100B模型
01:01
EfficientViT方法,DreamCraft3D++方法及 SD3.5 还未测试,只说几句
01:43
高斯三次方, Flux量化nf4 lora, SD3.5简单测试
01:09
Unbounded角色模拟的无限AI生成游戏,VistaDream场景构建
00:55
OmniParser 微软基于纯视觉的GUI助手 DAWN数字人
00:53
SMITE 视频分割方法 DiffGS 实用高斯散斑扩散方法
00:59
MagicTailor 个性组件迁移,ComfyUI_OmniParser插件简单介绍
01:31
DreamClear高清修复,GrounDiT免训练可控空间接地
00:57
EcomID 面部迁移方法及插件 co-tracker点追踪的方法
01:18
In-Context-LoRA 助力淘汰不思进取的设计师? ComfyUI_Demucs 简单复现音频人声分离
01:30
Consistory 英伟达的故事话本方法 1d-tokenizer 代码更新
01:03
MVPaint 3D纹理细化框架, InstantIR 在ComfyUI的初步复现
01:02
Cosmos-Tokenizer 英伟达的图像及视频tokenizer套件,CDIM 约束扩散隐式模型
00:49
X-Portrait2 字节升级版的肖像动画 D3RoMa方法
01:18
CAD-MLLM AI大模型的CAD生成,DimensionX单图生成任何3D和4D场景
01:25
DELTA 视频密集跟踪 SVDQuant全模型新量化方法
01:11
Face_anon_simple 让面部深伪更难被检测,In-Context-Lora 粗测
01:32
Edify-3d 英伟达的量3D资产项目 supervision快讯及杂闻
01:04
ZIM 零样本提取所有图像 在comfyUI中使用consistory
02:21
Add-it 英伟达基于flux的自由插入方法,Vidu4D高保真4D重建
01:06
LLaMA-Mesh 3D网格生成 ComfyUI_Face_Anon_Simple 简单有效地篡改照片里的人脸
01:31
SD3.5 IP-Adapter测试,Stylecodes,开源的类MJ的srefs
01:35
SAMURAI 零样本视觉跟踪的SAM模型 ProEdit 3D场景编辑
01:21
Flux-Tool 是时候淘汰旧模型了,echomimic_v2 音频半身驱动,对应comfyUI插件已更新
01:26
LTXVideo和StableV2V视频生成,omini control虽小但能硬控flux
01:18
Material Anything通过扩散为任何3D对象生成材质diptych-prompting方法
01:17
SD3.5三件套FitDiT虚拟试穿DreamRunnerAI故事视频
01:43
BootComp多件衣物虚拟试穿方法 DreamMix内绘主体迁移编辑增强
01:18
斯坦福大学的故事绘本方法,ROICtrl分区控制方法
01:22
PSHuman人体3D重建,TALK-Act数字人和ComfyUI_EchoMimic 非官方的V2版自定义姿态演示
02:15
RollingDepth 视频深度方法 DeSplat 无干扰渲染的分解高斯散斑方法
01:22
MV-Adapter轻松生成多视图一致的图像 ComfyUI_EchoMimic V2内置视频驱动已完成
01:20
Efficient Track Anything轻量级的SAM方法 GeneMAN 基于多源人体数据的广义单图像三维人体重建
00:54
One Shot, One Talk全身数字人 OSDFace 模糊人脸恢复只需一步,ultralytics漏洞自检
01:23
TRELLIS 微软3D生成模型 ComfyUI_PBR_Maker一键PBR材质生成插件
01:45
LayerFusion 分层文生图 MEMO表现不错的音频驱动数字人
01:27
StableAnimator 单图跳舞动画生成 CutS3D 非实例指导语义分割3D至2D
01:55
ComfyUI_Trellis 粗测, TactileDreamFusion 利用触觉感知进行3D生成
01:22
onediffusion一次扩散,生成全部,以及基于扩散的注意力扭曲用于一致的3D场景编辑方法
01:00
ComfyUI_TRELLIS 安装简易指引及功能说明
02:26
Leffa 脸书开源的换衣方法 InvSR 通过扩散反演实现任意步长图像超分辨率
01:19
ColorFlow 企鹅的线稿上色方法 Cap4d 4D数字人化身
01:19
Marigold-DC 使用导向扩散零样本单目深度切割 Mvlift通过2D扩散将运动提升到3D世界
01:17
FreeSplatter 2D转3D框架,AniDoc 图片转动画
02:04
INFP 字节双音轨数字人方法 Flowing from Words to Pixels 跨模态进化的框架
02:06
DisPose 可控人体图像动画的解纠缠姿态引导 VideoVAEPlus 基于跨模态视频VAE的大运动视频自动编码
01:40
PartGen 基于多视图扩散模型的零件级三维生成与重建 尝试做一个comfyUI安装简单的GPT-SoVITS插件(失败)
02:07
VidTwin 具有解耦结构和动力学的视频VAE LMM 统一多模态运动生成的大运动模型
01:09
StereoCrafter 将任意2D视频转为3D视频 DINO-X-API 开放世界目标检测与理解的统一视觉模型
01:03
Orient-Anything 评估任何物体的方向 华佗GPT-o1 开源医药领域LLM
01:23
Dora 锐边采样策略和双交叉注意力机制来增强VAE重建 Edicho 野生图像的一致图像编辑 xformer不兼容flash-attn新版报错的解决方法
01:52
3D-to-4d 赋予3D物体‘生命‘ ,PERSE 单图像的个性化3D头像生成
01:06
PAR 并行自回归视觉生成 Video Anydoor 具有精确运动控制的高保真视频对象插入 ComfyUI_Pshuman 开发中
01:20
SeedVR 在扩散变换中播下无限种子以实现通用视频修复 LightningDiT 驯服潜在扩散模型中的优化困境
01:15
LatentSync 音频条件潜在扩散模型实现声唇同步(字节) TangoFlux 基于流匹配和排序偏好优化的超快且准确的文本到音频生成 Gaga 通过3D感知
01:07
ComfyUI_SHMT 基于SHMT方法的人脸换妆插件 STAR 用于真实世界视频超分辨率方法
01:18
Sa2va 将SAM2与LLaVA结合,以深入理解图像和视频 Phi-4 微软大语言模型焕新 Diffusion as Shader 用于生成可控的3D
01:25
Hallo3 基于扩散变换网络的高动态逼真肖像图像动画 SVFR 广义视频人脸恢复的统一框架
01:09
MoonDream2 轻量级语言模型 ComfyUI_FRSV 视频修复上色内绘插件 ComfyUI_GPT_SoVITS_Lite 轻量TTS推理插件
01:21
Sana 基于线性扩散变换的高效高分辨率图像合成(英伟达) micro_diffusion 极少预算下从零开始进行扩散训练
01:12
MangaNinja 线条艺术着色与精确参考(阿里) JASCO 用于时间控制文本到音乐生成的联合音频和符号调节(脸书)
01:19
FramePainter 利用视频扩散先验进行交互式图像编辑 LayerAnimate 用动画的特定层控制
01:04
Dynamic Face 视频换脸 AnyStory 在文生图中实现统一的单主题和多主题个性化
00:55
X-Dyna 字节的可控视频新方法,ComfyUI-MangaNinjia 线稿上色插件开发完成
01:15
EMO2 末端效应器引导的音频驱动头像视频生成 Video Depth Anything 超长视频的一致深度估计
01:10
DiffuEraser 视频内绘的扩散模型(阿里) VideoLifter 通过快速分层立体对齐将视频提升到3D
01:13
Don't Splat your Gaussians 用于散射和发射介质建模和渲染的体射线追踪图元 Fast3R 在一次正向通道中实现1千加 图像的三维重建
01:33
OmniHuman-1 数字人 MatAnyone 视频人物分割 ComfyUI_DiffuEraser 视频人物消除
02:21
FluxSR 流动轨迹蒸馏实现真实图片一步超分 CSD-MT 妆容迁移方法及ComfyUI插件
01:34
DynVFX 用动态内容增强真实视频, Sonic将焦点转移到肖像动画中的全局音频感知及ComfyUI_Sonic插件
01:08
MotionCanvas 具有可控图像到视频生成的电影镜头设计 ComfyUI_FramePainter 交互式图像编辑插件上线前测试
01:58
Goku 基于流的视频生成基础模型 ComfyUI_FramePainter 修改模型加载
01:09
aurafusion360 360场景高斯散斑修复,ComfyUI_Sonic 插件更新演示
00:58
Light-A-Video 通过渐进式光融合进行无训练视频重新照明 Cinemaster 用于文生视频的3D感知和可控的电影镜头框架
01:18
VFX Creator 利用可控扩散变换器生成动画视觉特效 OmniParser V2 基于纯视觉的GUI代理的屏幕解析工具V2版本发布
01:13
ThinkDiff 在扩散模型中启用多模态上下文推理 Pippo 单张人物照片生成高分辨率多视角图片方法
01:37
Phantom 通过跨模态对齐生成主题一致的视频 YOLOv12 以注意力为中心的实时对象检测器 Soundwave 对于 LLM 中的语音文本对齐,少即是多
02:40
YuE(乐) 开源长歌词生成音乐项目 ComfyUI_YuE_MS 基于YuE的ComfyUI插件开源上线前演示 ComfyUI_light_A_video
02:35
ComfyUI_YuE 上线及简单的使用说明 ComfyUI_Hallo3 痛苦开发中
03:03
FantasyID 面部信息增强ID保留视频生成 Sketch-Seg 使用自然图像先验的场景草图实例分割
02:06
WAN X 阿里万象开源,公开表扬 PhotoDoodle 从少量镜头配对数据中学习艺术图像编辑 KV-Edit 无需训练的图像编辑,实现精确的背景保留
01:27
DreamEngine 用于图像生成的多模态表现对齐 Mobius 通过 Latent Shift 将文本转换为无缝循环视频
01:24
Kiss3DGen 重新利用图像扩散模型生成3D资产 Distill Any Depth 蒸馏创建了一个更强大的单目深度估计器
01:22
DiffRhythm 快且简单的全长歌曲AI生成 layered_vectorization 基于语义简化的分层图像矢量化
01:44
VideoPainter 任意长度视频修复和编辑与即插即用上下文控制 ComfyUI_KV_Edit 插件功能演示
01:56
tight-inversion 用于真实图像编辑的图像条件反转 RewardSDS 通过奖励加权抽样对齐分数蒸馏
01:19
SoftREPA 在扩散模型中将文本与图像对齐比您想象的要容易 CSM 模型焕新,GS-VTON可控3D穿戴代码焕新
01:39
Thera 具有神经热场的无混叠任意尺度超分辨率 Piece it Together 使用 IP-Priors 进行部件组合
01:19
Personalize Anything 使用DT自由个性化所有东西 Edit Transfer 通过视觉上下文学习进行图片编辑
01:52
Concat-ID 通用性的在视频生成中保持身份特征 stable-virtual-camera SD的单图或多图多视角3D场景生成扩散模型
01:22
DeepMesh 使用强化学习的自回归创建艺术级的网格 ComfyUI_Personalize_Anything 上线前演示
01:19
MagicID ID一致和动态保留视频定制的混合偏好优化 bolt3d 几秒重建一个3D场景
01:11
InfiniteYou 灵活的照片重塑,同时保留您的身份 URAE 自由地(难)在flux中使用超分
01:28
BottleneckSampling 无需训练的扩散模型加速 CFG-Zero-star 针对流匹配模型的改进型CFG InfiniteYou 尝鲜测试
01:48
flow-inference-time-scaling 基于随机生成和滚动预算强制的flow模型推理时间缩放 diffusion-4k 基于Latent 扩散模
01:17
RF-DETR SOTA实时目标检测模型 DiffPortrait360 360度全景合成的高一致人像扩散
01:21
UniDisc 多模态离散扩散模型 FirePlace 三维物体放置的LLM常识推理的几何细化
01:42
说几嘴GPT4-O的话题 Unconditional Priors Matter 改进微调扩散模型的条件生成
01:51
AnimeGamer 无限动漫生命模拟与下一场游戏状态预测 ILLUME+ 用双视觉标记化和扩散细化来阐明统一MLLM
02:06
Actalker 基于掩蔽选择性状态空间建模的数字人 FreSca 揭示扩散模型中的尺度空间 MagicColor 多实例草图着色
02:16
Colan 基于合成表示移植的图像编辑 为ComfyUI_MangaNinjia的视觉点迁移做的半成品前端演示
02:06
SPF-Portrait 迈向纯粹的肖像定制,语义污染无忧微调 SkyReels-A2 在视频扩散transformer中合成任何物体
01:52
UNO 通过上下文生成解锁更多可控性;OmniSVG 统一的可缩放矢量图形(SVG)生成模型
02:13
FantasyTalking 通过相干运动合成生成逼真的说话肖像 UNO 在ComfyUI中的简单测试
01:53
HoloPart 生成式3D零件Amodal分割 VisualCloze 基于视觉上下文学习的通用图像生成框架
01:49
HiFlow 采用 Flow-Aligned Guidance的免训练高分辨率图像生成 FlexIP 动态控制保存和个性,以生成自定义图像
02:03
PMNI 无姿态多视图法线集成用于反射和无纹理表面重建 Prima.cpp 加速低资源家庭集群的70B级LLM推理
02:18
FireEdit 基于区域感知视觉语言模型的细粒度指令图像编辑 Easy3D 一种简单而有效的3D交互式分割方法
01:49
RealCustom 将图像表示为实时定制的真实文字(字节ID迁移) SimpleAR 推动自回归视觉生成的前沿
02:02
InstantCharacter 使用可扩展的扩散变换器框架对任何角色进行个性化设置(ID迁移) RealCustom 已移植到comfyUI插件(ID迁移)
01:38
HiScene 使用等距视图生成创建分层3D场景 InstantCharacter 已移植到comfyUI插件,12G勉强能用(ID迁移)
02:00
styleme3d 基于3D高斯分布的多编码器去纠缠Priors风格化 Phantom 代码焕新(视频主体一致)
01:50
Describe Anything 图片或视频指定区域的详细描述(英伟达) RealisDance 图生跳舞视频 VisualCloze 视觉完形填空
01:38
EDGS 消除致密化以实现3DGS的高效收敛 T2I-Personalization-with-AR 基于自回归模型的个性化文生图
01:33
Uni3C 将精确的3D增强相机和人体运动控制统一用于视频生成 Step1X-Edit 先进的开源图像编辑模型(接近GPT-4o?)
01:59
KeySync 一种高分辨率无泄漏唇同步的鲁棒方法(数字人类) Pixel3DMM 用于单图像3D人脸重建的先验方法
01:59
VersBand 基于提示控制的歌曲生成通用框架 The Power of Context 多模态模型如何提高图像超分辨率(所以你狂堆上下文)
03:50
SuperEdit 纠正和促进对基于指令的图像编辑的监督。(图像编辑类) PixelHacker 具有结构和语义一致性的图像修复(图像编辑类)
02:12
ID-Patch 用于集体照的ID迁移方法 DICE-Talk 带情绪的数字人生成(Sonic姊妹方法) ComfyUI_DICE_Talk 插件实机演示
02:13
GUAVA 可推广的半身高斯数字人 PrimitiveAnything 生成人工制作的 3D 基元装配体
01:24
Step1X-3D 面向高保真和可控的纹理化3D资产生成 LBM 用于快速图像到图像转换的潜空间桥匹配
01:47
Genmo 人类运动的全面模型(英伟达) MiniMax-Speech 内置可学习语音编码器的本征零样本文生音频
03:54
LightLab 用扩散模型控制图片中的灯光(谷歌) CAST 从RGB图像重建组件对齐的3D场景
02:16
CustomsSVG 基于图像扩散先验的风格定制文生矢量 CubeDiff 重新利用基于扩散的图像模型生成全景图
02:02
InstanceGen 使用实例级指令生成图片 SOAP 风格全知的动画肖像
02:27
KEEP 卡尔曼启发的视频人脸超分辨率特征传播(焕新) DreamO 在ComfyUI的量化4测试
02:21
3dtown 从单幅图像构建三维城镇 MMaDA 多模态大扩散语言模型
01:54
DiCo 重振卷积神经网络以实现可扩展和高效的扩散建模 Dreamo 风格及ID迁移在ComfyUI的NF4测试
01:51
evo search 进化搜索提升图像和视频生成质量的测试时间缩放框架 ScaleKV 具有规模感知的KV缓存压缩带给视觉自回归模型高效的内存管理
02:11
OmniConsistency 从配对风格化数据中学习风格不一致性 HunyuanVideo-Avatar 高保真音频驱动的多角色人体动画
01:52
magref 任意垫图视频生成的遮罩指南 lorashop 使用flow transformer生成和编辑无需训练的多主体图像
02:10
TIC-FT 视频扩散模型多功能控制的时间上下文微调 Cora 使用小步扩散的对应感知图像编辑 Bagel在ComfyUI的nf4测试
02:23
SenseFlow 基于flow文生图模型的分布匹配蒸馏(DMD) Composeanything 用于文生图的复合对象先验
01:36
PartCrafter 通过复合潜在扩散变换器生成结构化3D网格 TACA 对多模态扩散transformer中交叉模态相互作用的再思考
01:53
HunyuanVideo-Avatar 把坑踩完了才跑通,非GP版本
00:14
PosterCraft 统一框架下的反思型高质量审美海报生成 DreamActor-H1 通过运动设计的扩散变换器生成高保真人体产品演示视频
02:13
SongGeneration 多偏好对齐的高质量歌曲生成 LoRA-Edit 通过掩模感知LoRA微调进行可控的第一帧引导视频编辑
02:16
Align Your Flow 缩放连续时间流图蒸馏 PartPacker 通过双体积包装高效生成零件级3D对象 ComfyUI_PartPacker 插件演示
02:41
LeVo 效果不错的开源歌曲生成方法(SongGeneration) ComfyUI_SongGeneration 插件演示及安装难点说明
03:26
DicFace 用于时间相干视频人脸恢复的狄利克雷约束变分密码本学习 DreamCube 通过多平面同步生成 3D 全景图
01:11
SwapAnyHead 阿里的数字换头 Tar 字节的文本对齐模型
01:34
SimpleGVR 视频超清方法 anima-x 制作3D骨骼动画 DreamO 焕新1.1
01:57
DRA-Ctrl 阿里用腾讯的模型来降维打击 MaskedLRM 手搓3D mesh编辑
01:46
FLUX Kontext 随便聊几句 SAM4D 自动驾驶的快速分割
01:45
XVerse 字节多角色ID迁移 Shape-for-Motion 用3D代理来编辑视频
02:31
Calligrapher 一键修改海报字体(平面狂喜)EX-4D 用深度水密网格生成4D视频
02:00
Assembler3d 又一个可分割3D生成方法 VINCIE 从视频中解锁上下文图片编辑
01:35
LongAnimation 线稿动画上色 Depthanything-AC 获取任意条件下的图片深度
01:23
AniCrafter 替换任意视频的任意人STR-Match 无训练视频编辑
01:37
EchoMimicV3 阿里数字人焕新 x-planner 复杂指令图像编辑
01:26
OmniPart 零件级3D AI生成 4kagent 超分任何图像到4K
01:57
T-LoRA 增强单图微调定制模型 Go to Zero 零样本3D动作生成
01:23
ComfyUI_AniCrafter 基本完成及使用注意事项CanonSwap 高保真视频人脸替换
01:46
Addit 无训练图像自由插入 ALG 提升图生视频的动态
01:29
ComfyUI_AniCrafter 使用答疑,FantasyPortrait 多角色肖像动画
04:15
OmniSVG 矢量绘制方法正式开源;RoMaP 鲁棒性3D掩码零件级编辑
01:50
ComfyUI_OmniSVG 简单测试 DAViD 微软的视觉模型
01:49
ObjectClear 使用对象效果attention移除 ComfyUI_ObjectClear 演示
02:25
Diffuman4d 稀疏视频4DGS重建,Ultra3D:高效,快速,零件级3D生成
02:16

中分段要不要学临床?

中分段专业选择,张老师指点迷津
客服
顶部
赛事库 课堂 2021拜年纪