投稿

2D图片转3D文件OBJ格式，Comfyui的TripoSR插件测试，3月8日更新

895

0

2024-03-08 11:56:54

作者声明：个人观点，仅供参考

未经作者授权，禁止转载

正在缓冲...

TripoSR是SD母公司推出的2D转3D的模型，看到有大佬做了对应的comfyui插件，就及时更新看看。插件安装使用难度：3星（全域VPN或外网），5星（非全域VPN或无法直连抱脸）其他报错，比如输出节点404，插件问答区有说明，找不到就评论区问我吧。

Smthem 发消息

Comfyui开源插件开发者；工作日分享最新的AI方法; 分享comfy插件测试视频。

强烈推荐ComfyUI_TensorRT！新的Unique3D 网格模型方法

02:46

ComfyUI-StoryDiffusion和HiDiffusion-Pro插件的重要更新介绍

01:46

ComfyUI-storydiffussion插件及最新DMD2加速模型测试

02:28

controlnet++即将登场？0413

01:47

基于Parler_TTS自制的ComfyUI_TTS插件测试，ComfyUI日常0412

01:59

XL模型加内绘伪实时绘画自制工作流及comfyUI日常0411

02:28

Controlnet内绘梦幻XL模型测试及ComfyUI日常0410

02:28

4月9日更新：我制作的ComfyUI-ChatGLM-API开源插件测试

03:00

4月8日更新：ComfyUI日常，SD官方最新的CosXL模型测试

03:12

4月7日更新：ComfyUI日常更新，基于更新的IP2P再再测试

01:34

4月6日更新,comfyUI日常及IP2P再测试

03:53

4月5日更新：腾讯MuseV动画及对应ComfyUI插件测试

04:05

4月3日，Steerable-Motion运动可控视频插件测试

02:34

4月2日更新：ComfyUI日常及“背景移除插件”对比测试

02:43

4月1日常更新及IP2P模型伪测试

02:37

3月31日更新腾讯AniPortrait 人像动画音频驱动合成模型测试

02:10

3月30日更新：comfyUI日常及SDXS0.9类LCM加速模型测试

03:39

3月29日重磅ai应用，Suno生成式歌曲创作，强烈推荐测试、尝试

03:40

3月28日，comfyui日常，TCD-SDXL-LoRA超级加速LORA模型

03:41

3月27日comfyUI日常系列,Lora变种,Dora微调不严谨测试

02:16

3月26日comfyui日常更新，DDColor上色及CCSR高清修复插件，

02:14

3月25日ComfyUI日常系列，motionctrl 文生视频路径控制插件，

01:34

3月24日ComfyUI日常更新系列，①新奇ip adapter模型测试，②animate-diff lighting 文生视频测试，

01:59

3月23日ComfyUI 字节跳动animate-diff lighting 闪电加速模型测试，

03:02

3月22日ComfyUI 日常更新及SV3D转DUST3R工作流测试，

01:04

3月21日ComfyUI 日常更新及“视频加绿幕”工作流

01:05

3月20日ComfyUI 日常更新及“SV3D工作流测试”，

01:02

3月19日ComfyUI 日常更新SV3D支持（重要更新）

01:35

3月17日ComfyUI 日常更新系列DPMAdaptative 采样器额外节点

02:23

3月16日ComfyUI插件测试 DUSt3R 2D转3D插件

01:13

3月15日特别版《ComfyUI 日常更新系列》及《插件和库安装简单教程》

02:32

3月14日comfyUI animatediff动画制作插件测试，

02:28

3月13日comfyui日常更新测试,更新3M及LMS采样器节点

01:21

3月12日Comfyui的日常更新测试，含部分答疑内容

00:58

3月11日Comfyui的CLIP merging节点更新测试，

01:35

3月10日Comfyui的Euler A节点更新测试，

01:52

3月9日Comfyui的“图像反推文字插件-MoonDream”测试，

03:40

3月8日2D图片转3D文件OBJ格式，Comfyui的TripoSR插件测试，

02:01

3月7日comfyui关键更新， Stable Cascade的controlnet超分辨率模型已可以在comfyui工作流中使用

01:51

3月6日关键更新， Stable Cascade的canny已可以在comfyui工作流中使用

02:05

3月5日comfyui的kornia库的初步应用尝鲜。

04:34

MuseTalk测试MuseV加TTS工作流0415

02:03

PBR材质制作模型及GPT-sovits-comfyUI插件伪测试0416

01:19

PBR材质AI生成插件及PerpNeg节点测试

01:34

AI-PBR贴图质量粗测 ComfyUI 日常更新

01:10

SD3粗看，controlnet++快测，日常更新

00:59

一键换衣插件测试，避坑指南及日常更新

00:52

最新，Hyper-SD 模型尝鲜测试先导视频

00:31

最新Hyper-SD尝鲜测试

01:58

Hyper_SD助力AI实时绘画，你的krita可以删掉了。

01:51

给小白新手做的ComfyUI抱脸模型下载插件

01:43

人体抠图插件测试及对应XL内绘工作流

01:26

Typer-SD官方ComfyUI插件测试

02:32

Dreamer XL内绘v2版模型测试

01:50

最新Llama 3与Phi 3模型，“猫娘”设定对话粗测

01:43

最新的Align Your Steps调度器对比测试

02:06

羊驼3的ComfyUI插件及语音转prompt插件

01:27

最新B-Lora 尝鲜测试

01:42

新高清修复放大模型及comfyUI模型下载插件更新

01:58

Hyper-SD 高CFG值lora测试，TCD插件测试

02:03

Story-Diffusion故事画板AI生成实机测试

01:48

CustomNet，腾讯-零样本换视角扩散模型测试

02:22

基于llama.cpp的提示词美化及图片反推插件

01:39

fish-speech TTS，B-lora ComfyUI应用测试

02:12

PuLID_ComfyUI人脸复刻插件测试

02:07

HiDiffusion comfyUI高清图片生成插件测试解锁更高分辨率的创造力和效率

02:06

MasterWeaver 人脸复刻与 DGE 直接高斯3维编辑前瞻

01:06

IC-Light 图片光照控制插件，MistoLine 新controlnet线图XL模型

02:19

ComfyUI-ELLA，EMMA，全景消焦及Diffusion2GAN技术前瞻

02:02

腾讯-混元Hunyuan开源， Hidiffusion插件更新

01:49

ID-Animator Zero-shot（零样本）人物视频生成

01:19

ID_Animator ComfyUI自制插件测试

01:11

自制CustomNet移植ComfyUI插件测试

01:25

ComfyUI-Anyline超高素质细致线Controlnet适配测试

01:27

ComfyUI-Hidiffusion插件更新 anyline及openpose XL适配

02:04

CharacterFactory角色工厂测试

02:00

Texture Dreamer 3D纹理生成方法

01:11

MiniCPM-Llama3-V-2_5大模型测试

01:07

DMD2四步加速模型惊艳ComfyUI-storydiffussion插件上线

01:25

Pandora自然语言模型，signLLM手语大模型，及SDXL flash模型测试

02:02

streamv2v直播推流换脸方法及comfyUI插件测试，SDXL controlnet scribble 模型

01:47

3DitScene “语言引导编辑任意场景“方法 Story插件更新，加入加速模型

01:58

PCM加速lora，ComfyUI_omost和MusePose测试

03:20

最新智普glm-4-9b开源模及SD公司出品stable-audio-open-1.0文生音频模型测试

02:52

最新Flash Diffusion加速“任意”扩散模型 ComfyUI_StableAudio_Open 插件测试

02:13

材质赋予，语义增强等pOps方法介绍， Physics3D方法介绍

02:16

0611

01:45

ComfyUI_Pops 插件开源上线 Follow-Your-Emoji 方法介绍

02:03

ComfyUI_Pops 插件开源上线 Follow-Your-Emoji 方法介绍

02:29

LEDITS 真实图像编辑方法 SD3-diffusers 流程测试 VideoLLaMA 2 方法介绍

02:31

comfyUI-StoryDiffusion 已支持Lora及修复风格bug Depth-Anything-V2 方法介绍

02:19

Control-X 无引导文生图控制结构和外观方法

02:08

DiffAvatar 基于差分仿真的仿真服装优化 HIdiffusion 基于官方更新已重构

00:58

SD3 -Flash 4步出图，为 story-diffusion插件推荐一些动漫风的lora

01:32

MS-Diffusion方法介绍，基于MS-diffusion，story-diffusion 加入双角色同框功能

01:25

LEDITS++方法，story双角色功能正式上线

01:26

Florence-2 推进各种视觉任务的统一表示 EvTexture 基于事件驱动的视频超分辨率纹理增强

01:43

DiffSynth-Studio 新的扩散引擎 MOFA-Video基于生成运动场的可控制图像动画

01:23

RobustSAM 对退化图像进行鲁棒分割新方法

01:11

不需要梯子，三步解决抱脸模型下载问题，CLAY 创建高质量的3D资产的方法

02:03

Story_diffusion 加入双人同框controlnet功能,PointDreamer 基于彩色点云二维修复重建的零样本三维纹理网格方法,

01:42

Controlnet-tile-sdxl上新， AuraSR基于GAN的超分辨率放大方法

02:15

MARS5-TTS方法日常更新

01:03

MimicMotion 高质量人体运动视频生成，Hunyuan-Captioner 混元捕手

02:10

Mann-E_Dreams加速模型 ,PAG方法 MS-diffusion方法的comfyUI故事画板插件

02:08

Surf-D 生成任意拓扑的高质量曲面方法，InstantStyle-Plus方法

01:40

LivePortrait 具有缝合和重定目标控制的高效人像动画 HunyuanDiT-comfyUI 测试一下

02:01

controlnet++ 代码放出 BeyondScene 具有预训练扩散的高分辨率以人为中心的场景生成

01:30

ComfyUI-anydoor换衣插件已开源上线。

01:24

ComfyUI-makeup一键人脸化妆插件，Housecrafter及 Tile-Upscaler 方法

01:20

GeoWizard 方法 FC diffusion方法 EchoMimic 方法快速浏览

01:22

VEnhancer及Mast3R及Color peel方法一览

01:18

StyleSplat方法一览，RTMPose3D工具包及ComfyUI_EchoMimic插件

01:12

RRM，及最优高斯散斑方法，及ComfyUI_EchoMimic

01:07

Text-Animator、Video-Infinity及ComfyUI_FollowYourEmoji 表情包制作插插件

01:26

IDOL、Click-Gaussian及LaSe-E2V方法一览

01:48

FL-Trainer在comfyUI中训练lora，ComfyUI_Streamv2v_Plus：易用的streamv2v已上线

01:23

PhotomakeV2,SyncTweedies：基于同步扩散的通用生成框架 ComfyUI_Hi-diffusion：易用性更新

01:51

DVT V2：去噪视觉变换器日常更新

01:00

HumanVid数据集，AccDiffusion超分方法，LightenDiffusion低光增强

01:09

One Noise to Rule Them All（噪声魔戒？），TRG-Release,AuraSR-v2高清修复模型

01:37

Diffree：方法介绍, Artist：无需训练，无controlnet，lora的风格模型

01:29

SF3D，SD公司快速3D建模，ComfyUI_MS_Diffusion代码重构以复现官方

01:32

Tora：阿里最新视频生成方法， ComfyUI_Diffree插件已上线

00:50

ComfyUI_StoryDiffusion加入可灵模型及PhotomakeV2支持，PAI缓解LVLM模型的幻视，

01:38

TurboEdit 小步扩散，ProCreate 更有创造力的扩散，matting-by-generation：抠图新秀？

01:24

IP-Adapter-Instruct 方法介绍和 ComfyUI_FoleyCrafter 视频配音插件

01:37

ControlNext和Stable-audio-controlnet：方法一览

01:21

MooER基于LLM的语音识别及翻译及comfyUI插件，以及1个新的3D及UV贴图生成方法

02:10

CLIP-fine-tune：微调你自己的clip模型

01:10

TiTok和TurboEdit以及Imagine yourself方法介绍

01:44

DEGAS:全身段高斯化身（数字人）

01:35

UniPortrait多角色IP类框架，MegaFusion高分辨率的SD模型

00:51

Sapiens（智人）: Meta的人类视觉模型基础的新方法一览

00:48

RB-Modulation 谷歌基于随机最优控制的扩散模型无训练个性化

00:51

AuraFace人像emb新模型，CogVideoX-5b上新

01:17

AiM：首个基于Mamba框架的扩散模型方法，Build-A-Scene方法

01:06

GameNGen：第一个完全由神经网络模型驱动的游戏引擎 KEEP：新加坡南洋理工的高清视频修复方法

01:08

Sapiens-Pytorch-Inference：基于spaiens的pytorch推理 CSGO：文本到图像生成中的内容风格组合

01:23

SHOW-O方法介绍，看看CoRe新论文

01:51

DiffUHaul：无需训练的图像对象拖动方法 CSGO：推理代码放出

01:08

看看DeepFakeDefenders，Loopy数字人

01:19

FluxMusic，ViewCrafter，DeepFakeDefenders第一名及comfyUI插件

01:28

StreamingT2V的StreamingSVD方法，以及企鹅的Open-MAGVIT2上新

01:16

RB-Modulation的demo演示，Conan-embedding-v1

01:14

3D Gaussian Ray Tracing 项目及基于弗洛伦萨2的comfyUI打标插件

01:06

LinFusion高清图片生成，羊驼3Omni语音交互

01:13

FLUX-PuLID面世，看看Adobe的新方法

01:12

Instant Drag,数字人新方法,finegrain-box-segmenter,脱底模型介绍

02:14

GVHMR创建真实动作，Phidias新的3D资产生成模型

01:38

3DTopia-XL生成3D资产和PBR材质，diffusion-e2e-ft微调模型方法，

01:34

StoryMaker 小红书故事方法，storydiffusion插件已同步该功能

01:33

ExAvatar全身3D高斯化身项目，StableDelight去除镜面反射高光

01:47

OpenMusic 表现出众的开源音乐生成项目 SoundStorm 谷歌的高效并行音频生成项目

02:41

TextBoost 通过微调文本编码器实现文生图模型的一次性个性化,调试story maker

02:12

Emu3，多模态模型，MaskBit：Embedding-free的方法

01:16

ComfyGen文生图优化，DisEnvisioner图生图优化

01:11

ML-depth-pro 苹果深度模型, 复现Story-maker的controlnet

01:22

港科大的 Lotus深度及法线预测方法魔搭的Ace

01:25

Stable Video Portraits最新数字人方法 Inverse Painting还原绘画步骤

01:12

GS-VTON 可控三维虚拟试穿 VFusion3D 3D资产项目

01:21

RGB-X 室内AI渲染新思路，DreamMesh4D 视频到4D生成

01:26

TextToon 实时卡通转绘 Pyramidal Flow 快手开源视频生成

01:21

Flex3D和AniSDF 两个3D重建项目介绍

01:07

GAGavatar数字化身方法，Meissonic模型，ComfyUI-Sapiens插件

00:56

ComfyUI-sapiens插件上线，RF-Inversion改善flux出图质量

01:30

Janus模型，MeshUp及HART方法，RF-Inversion非官方复现

01:30

ComfyUI_Hallo2音频驱动动画并放大comfyUI插件已上线

01:19

BitNet 微软的1比特LLM官方推理框架，只用i7跑100B模型

01:01

EfficientViT方法，DreamCraft3D++方法及 SD3.5 还未测试，只说几句

01:43

高斯三次方, Flux量化nf4 lora, SD3.5简单测试

01:09

Unbounded角色模拟的无限AI生成游戏，VistaDream场景构建

00:55

OmniParser 微软基于纯视觉的GUI助手 DAWN数字人

00:53

SMITE 视频分割方法 DiffGS 实用高斯散斑扩散方法

00:59

MagicTailor 个性组件迁移，ComfyUI_OmniParser插件简单介绍

01:31

DreamClear高清修复，GrounDiT免训练可控空间接地

00:57

EcomID 面部迁移方法及插件 co-tracker点追踪的方法

01:18

In-Context-LoRA 助力淘汰不思进取的设计师？ ComfyUI_Demucs 简单复现音频人声分离

01:30

Consistory 英伟达的故事话本方法 1d-tokenizer 代码更新

01:03

MVPaint 3D纹理细化框架， InstantIR 在ComfyUI的初步复现

01:02

Cosmos-Tokenizer 英伟达的图像及视频tokenizer套件，CDIM 约束扩散隐式模型

00:49

X-Portrait2 字节升级版的肖像动画 D3RoMa方法

01:18

CAD-MLLM AI大模型的CAD生成，DimensionX单图生成任何3D和4D场景

01:25

DELTA 视频密集跟踪 SVDQuant全模型新量化方法

01:11

Face_anon_simple 让面部深伪更难被检测,In-Context-Lora 粗测

01:32

Edify-3d 英伟达的量3D资产项目 supervision快讯及杂闻

01:04

ZIM 零样本提取所有图像在comfyUI中使用consistory

02:21

Add-it 英伟达基于flux的自由插入方法，Vidu4D高保真4D重建

01:06

LLaMA-Mesh 3D网格生成 ComfyUI_Face_Anon_Simple 简单有效地篡改照片里的人脸

01:31

SD3.5 IP-Adapter测试，Stylecodes，开源的类MJ的srefs

01:35

SAMURAI 零样本视觉跟踪的SAM模型 ProEdit 3D场景编辑

01:21

Flux-Tool 是时候淘汰旧模型了，echomimic_v2 音频半身驱动，对应comfyUI插件已更新

01:26

LTXVideo和StableV2V视频生成，omini control虽小但能硬控flux

01:18

Material Anything通过扩散为任何3D对象生成材质diptych-prompting方法

01:17

SD3.5三件套FitDiT虚拟试穿DreamRunnerAI故事视频

01:43

BootComp多件衣物虚拟试穿方法 DreamMix内绘主体迁移编辑增强

01:18

斯坦福大学的故事绘本方法，ROICtrl分区控制方法

01:22

PSHuman人体3D重建，TALK-Act数字人和ComfyUI_EchoMimic 非官方的V2版自定义姿态演示

02:15

RollingDepth 视频深度方法 DeSplat 无干扰渲染的分解高斯散斑方法

01:22

MV-Adapter轻松生成多视图一致的图像 ComfyUI_EchoMimic V2内置视频驱动已完成

01:20

Efficient Track Anything轻量级的SAM方法 GeneMAN 基于多源人体数据的广义单图像三维人体重建

00:54

One Shot, One Talk全身数字人 OSDFace 模糊人脸恢复只需一步，ultralytics漏洞自检

01:23

TRELLIS 微软3D生成模型 ComfyUI_PBR_Maker一键PBR材质生成插件

01:45

LayerFusion 分层文生图 MEMO表现不错的音频驱动数字人

01:27

StableAnimator 单图跳舞动画生成 CutS3D 非实例指导语义分割3D至2D

01:55

ComfyUI_Trellis 粗测， TactileDreamFusion 利用触觉感知进行3D生成

01:22

onediffusion一次扩散，生成全部，以及基于扩散的注意力扭曲用于一致的3D场景编辑方法

01:00

ComfyUI_TRELLIS 安装简易指引及功能说明

02:26

Leffa 脸书开源的换衣方法 InvSR 通过扩散反演实现任意步长图像超分辨率

01:19

ColorFlow 企鹅的线稿上色方法 Cap4d 4D数字人化身

01:19

Marigold-DC 使用导向扩散零样本单目深度切割 Mvlift通过2D扩散将运动提升到3D世界

01:17

FreeSplatter 2D转3D框架,AniDoc 图片转动画

02:04

INFP 字节双音轨数字人方法 Flowing from Words to Pixels 跨模态进化的框架

02:06

DisPose 可控人体图像动画的解纠缠姿态引导 VideoVAEPlus 基于跨模态视频VAE的大运动视频自动编码

01:40

PartGen 基于多视图扩散模型的零件级三维生成与重建尝试做一个comfyUI安装简单的GPT-SoVITS插件(失败)

02:07

VidTwin 具有解耦结构和动力学的视频VAE LMM 统一多模态运动生成的大运动模型

01:09

StereoCrafter 将任意2D视频转为3D视频 DINO-X-API 开放世界目标检测与理解的统一视觉模型

01:03

Orient-Anything 评估任何物体的方向华佗GPT-o1 开源医药领域LLM

01:23

Dora 锐边采样策略和双交叉注意力机制来增强VAE重建 Edicho 野生图像的一致图像编辑 xformer不兼容flash-attn新版报错的解决方法

01:52

3D-to-4d 赋予3D物体‘生命‘ ,PERSE 单图像的个性化3D头像生成

01:06

PAR 并行自回归视觉生成 Video Anydoor 具有精确运动控制的高保真视频对象插入 ComfyUI_Pshuman 开发中

01:20

SeedVR 在扩散变换中播下无限种子以实现通用视频修复 LightningDiT 驯服潜在扩散模型中的优化困境

01:15

LatentSync 音频条件潜在扩散模型实现声唇同步（字节） TangoFlux 基于流匹配和排序偏好优化的超快且准确的文本到音频生成 Gaga 通过3D感知

01:07

ComfyUI_SHMT 基于SHMT方法的人脸换妆插件 STAR 用于真实世界视频超分辨率方法

01:18

Sa2va 将SAM2与LLaVA结合，以深入理解图像和视频 Phi-4 微软大语言模型焕新 Diffusion as Shader 用于生成可控的3D

01:25

Hallo3 基于扩散变换网络的高动态逼真肖像图像动画 SVFR 广义视频人脸恢复的统一框架

01:09

MoonDream2 轻量级语言模型 ComfyUI_FRSV 视频修复上色内绘插件 ComfyUI_GPT_SoVITS_Lite 轻量TTS推理插件

01:21

Sana 基于线性扩散变换的高效高分辨率图像合成（英伟达） micro_diffusion 极少预算下从零开始进行扩散训练

01:12

MangaNinja 线条艺术着色与精确参考（阿里） JASCO 用于时间控制文本到音乐生成的联合音频和符号调节（脸书）

01:19

FramePainter 利用视频扩散先验进行交互式图像编辑 LayerAnimate 用动画的特定层控制

01:04

Dynamic Face 视频换脸 AnyStory 在文生图中实现统一的单主题和多主题个性化

00:55

X-Dyna 字节的可控视频新方法，ComfyUI-MangaNinjia 线稿上色插件开发完成

01:15

EMO2 末端效应器引导的音频驱动头像视频生成 Video Depth Anything 超长视频的一致深度估计

01:10

DiffuEraser 视频内绘的扩散模型（阿里） VideoLifter 通过快速分层立体对齐将视频提升到3D

01:13

Don't Splat your Gaussians 用于散射和发射介质建模和渲染的体射线追踪图元 Fast3R 在一次正向通道中实现1千加图像的三维重建

01:33

OmniHuman-1 数字人 MatAnyone 视频人物分割 ComfyUI_DiffuEraser 视频人物消除

02:21

FluxSR 流动轨迹蒸馏实现真实图片一步超分 CSD-MT 妆容迁移方法及ComfyUI插件

01:34

DynVFX 用动态内容增强真实视频， Sonic将焦点转移到肖像动画中的全局音频感知及ComfyUI_Sonic插件

01:08

MotionCanvas 具有可控图像到视频生成的电影镜头设计 ComfyUI_FramePainter 交互式图像编辑插件上线前测试

01:58

Goku 基于流的视频生成基础模型 ComfyUI_FramePainter 修改模型加载

01:09

aurafusion360 360场景高斯散斑修复，ComfyUI_Sonic 插件更新演示

00:58

Light-A-Video 通过渐进式光融合进行无训练视频重新照明 Cinemaster 用于文生视频的3D感知和可控的电影镜头框架

01:18

VFX Creator 利用可控扩散变换器生成动画视觉特效 OmniParser V2 基于纯视觉的GUI代理的屏幕解析工具V2版本发布

01:13

ThinkDiff 在扩散模型中启用多模态上下文推理 Pippo 单张人物照片生成高分辨率多视角图片方法

01:37

Phantom 通过跨模态对齐生成主题一致的视频 YOLOv12 以注意力为中心的实时对象检测器 Soundwave 对于 LLM 中的语音文本对齐，少即是多

02:40

YuE（乐）开源长歌词生成音乐项目 ComfyUI_YuE_MS 基于YuE的ComfyUI插件开源上线前演示 ComfyUI_light_A_video

02:35

ComfyUI_YuE 上线及简单的使用说明 ComfyUI_Hallo3 痛苦开发中

03:03

FantasyID 面部信息增强ID保留视频生成 Sketch-Seg 使用自然图像先验的场景草图实例分割

02:06

WAN X 阿里万象开源，公开表扬 PhotoDoodle 从少量镜头配对数据中学习艺术图像编辑 KV-Edit 无需训练的图像编辑，实现精确的背景保留

01:27

DreamEngine 用于图像生成的多模态表现对齐 Mobius 通过 Latent Shift 将文本转换为无缝循环视频

01:24

Kiss3DGen 重新利用图像扩散模型生成3D资产 Distill Any Depth 蒸馏创建了一个更强大的单目深度估计器

01:22

DiffRhythm 快且简单的全长歌曲AI生成 layered_vectorization 基于语义简化的分层图像矢量化

01:44

VideoPainter 任意长度视频修复和编辑与即插即用上下文控制 ComfyUI_KV_Edit 插件功能演示

01:56

tight-inversion 用于真实图像编辑的图像条件反转 RewardSDS 通过奖励加权抽样对齐分数蒸馏

01:19

SoftREPA 在扩散模型中将文本与图像对齐比您想象的要容易 CSM 模型焕新，GS-VTON可控3D穿戴代码焕新

01:39

Thera 具有神经热场的无混叠任意尺度超分辨率 Piece it Together 使用 IP-Priors 进行部件组合

01:19

Personalize Anything 使用DT自由个性化所有东西 Edit Transfer 通过视觉上下文学习进行图片编辑

01:52

Concat-ID 通用性的在视频生成中保持身份特征 stable-virtual-camera SD的单图或多图多视角3D场景生成扩散模型

01:22

DeepMesh 使用强化学习的自回归创建艺术级的网格 ComfyUI_Personalize_Anything 上线前演示

01:19

MagicID ID一致和动态保留视频定制的混合偏好优化 bolt3d 几秒重建一个3D场景

01:11

InfiniteYou 灵活的照片重塑，同时保留您的身份 URAE 自由地（难）在flux中使用超分

01:28

BottleneckSampling 无需训练的扩散模型加速 CFG-Zero-star 针对流匹配模型的改进型CFG InfiniteYou 尝鲜测试

01:48

flow-inference-time-scaling 基于随机生成和滚动预算强制的flow模型推理时间缩放 diffusion-4k 基于Latent 扩散模

01:17

RF-DETR SOTA实时目标检测模型 DiffPortrait360 360度全景合成的高一致人像扩散

01:21

UniDisc 多模态离散扩散模型 FirePlace 三维物体放置的LLM常识推理的几何细化

01:42

说几嘴GPT4-O的话题 Unconditional Priors Matter 改进微调扩散模型的条件生成

01:51

AnimeGamer 无限动漫生命模拟与下一场游戏状态预测 ILLUME+ 用双视觉标记化和扩散细化来阐明统一MLLM

02:06

Actalker 基于掩蔽选择性状态空间建模的数字人 FreSca 揭示扩散模型中的尺度空间 MagicColor 多实例草图着色

02:16

Colan 基于合成表示移植的图像编辑为ComfyUI_MangaNinjia的视觉点迁移做的半成品前端演示

02:06

SPF-Portrait 迈向纯粹的肖像定制，语义污染无忧微调 SkyReels-A2 在视频扩散transformer中合成任何物体

01:52

UNO 通过上下文生成解锁更多可控性；OmniSVG 统一的可缩放矢量图形(SVG)生成模型

02:13

FantasyTalking 通过相干运动合成生成逼真的说话肖像 UNO 在ComfyUI中的简单测试

01:53

HoloPart 生成式3D零件Amodal分割 VisualCloze 基于视觉上下文学习的通用图像生成框架

01:49

HiFlow 采用 Flow-Aligned Guidance的免训练高分辨率图像生成 FlexIP 动态控制保存和个性，以生成自定义图像

02:03

PMNI 无姿态多视图法线集成用于反射和无纹理表面重建 Prima.cpp 加速低资源家庭集群的70B级LLM推理

02:18

FireEdit 基于区域感知视觉语言模型的细粒度指令图像编辑 Easy3D 一种简单而有效的3D交互式分割方法

01:49

RealCustom 将图像表示为实时定制的真实文字（字节ID迁移） SimpleAR 推动自回归视觉生成的前沿

02:02

InstantCharacter 使用可扩展的扩散变换器框架对任何角色进行个性化设置（ID迁移） RealCustom 已移植到comfyUI插件（ID迁移）

01:38

HiScene 使用等距视图生成创建分层3D场景 InstantCharacter 已移植到comfyUI插件，12G勉强能用（ID迁移）

02:00

styleme3d 基于3D高斯分布的多编码器去纠缠Priors风格化 Phantom 代码焕新（视频主体一致）

01:50

Describe Anything 图片或视频指定区域的详细描述（英伟达） RealisDance 图生跳舞视频 VisualCloze 视觉完形填空

01:38

EDGS 消除致密化以实现3DGS的高效收敛 T2I-Personalization-with-AR 基于自回归模型的个性化文生图

01:33

Uni3C 将精确的3D增强相机和人体运动控制统一用于视频生成 Step1X-Edit 先进的开源图像编辑模型（接近GPT-4o？）

01:59

KeySync 一种高分辨率无泄漏唇同步的鲁棒方法（数字人类） Pixel3DMM 用于单图像3D人脸重建的先验方法

01:59

VersBand 基于提示控制的歌曲生成通用框架 The Power of Context 多模态模型如何提高图像超分辨率（所以你狂堆上下文）

03:50

SuperEdit 纠正和促进对基于指令的图像编辑的监督。(图像编辑类) PixelHacker 具有结构和语义一致性的图像修复（图像编辑类）

02:12

ID-Patch 用于集体照的ID迁移方法 DICE-Talk 带情绪的数字人生成（Sonic姊妹方法） ComfyUI_DICE_Talk 插件实机演示

02:13

GUAVA 可推广的半身高斯数字人 PrimitiveAnything 生成人工制作的 3D 基元装配体

01:24

Step1X-3D 面向高保真和可控的纹理化3D资产生成 LBM 用于快速图像到图像转换的潜空间桥匹配

01:47

Genmo 人类运动的全面模型（英伟达） MiniMax-Speech 内置可学习语音编码器的本征零样本文生音频

03:54

LightLab 用扩散模型控制图片中的灯光（谷歌） CAST 从RGB图像重建组件对齐的3D场景

02:16

CustomsSVG 基于图像扩散先验的风格定制文生矢量 CubeDiff 重新利用基于扩散的图像模型生成全景图

02:02

InstanceGen 使用实例级指令生成图片 SOAP 风格全知的动画肖像

02:27

KEEP 卡尔曼启发的视频人脸超分辨率特征传播（焕新） DreamO 在ComfyUI的量化4测试

02:21

3dtown 从单幅图像构建三维城镇 MMaDA 多模态大扩散语言模型

01:54

DiCo 重振卷积神经网络以实现可扩展和高效的扩散建模 Dreamo 风格及ID迁移在ComfyUI的NF4测试

01:51

evo search 进化搜索提升图像和视频生成质量的测试时间缩放框架 ScaleKV 具有规模感知的KV缓存压缩带给视觉自回归模型高效的内存管理

02:11

OmniConsistency 从配对风格化数据中学习风格不一致性 HunyuanVideo-Avatar 高保真音频驱动的多角色人体动画

01:52

magref 任意垫图视频生成的遮罩指南 lorashop 使用flow transformer生成和编辑无需训练的多主体图像

02:10

TIC-FT 视频扩散模型多功能控制的时间上下文微调 Cora 使用小步扩散的对应感知图像编辑 Bagel在ComfyUI的nf4测试

02:23

SenseFlow 基于flow文生图模型的分布匹配蒸馏（DMD） Composeanything 用于文生图的复合对象先验

01:36

PartCrafter 通过复合潜在扩散变换器生成结构化3D网格 TACA 对多模态扩散transformer中交叉模态相互作用的再思考

01:53

HunyuanVideo-Avatar 把坑踩完了才跑通，非GP版本

00:14

PosterCraft 统一框架下的反思型高质量审美海报生成 DreamActor-H1 通过运动设计的扩散变换器生成高保真人体产品演示视频

02:13

SongGeneration 多偏好对齐的高质量歌曲生成 LoRA-Edit 通过掩模感知LoRA微调进行可控的第一帧引导视频编辑

02:16

Align Your Flow 缩放连续时间流图蒸馏 PartPacker 通过双体积包装高效生成零件级3D对象 ComfyUI_PartPacker 插件演示

02:41

LeVo 效果不错的开源歌曲生成方法（SongGeneration） ComfyUI_SongGeneration 插件演示及安装难点说明

03:26

DicFace 用于时间相干视频人脸恢复的狄利克雷约束变分密码本学习 DreamCube 通过多平面同步生成 3D 全景图

01:11

SwapAnyHead 阿里的数字换头 Tar 字节的文本对齐模型

01:34

SimpleGVR 视频超清方法 anima-x 制作3D骨骼动画 DreamO 焕新1.1

01:57

DRA-Ctrl 阿里用腾讯的模型来降维打击 MaskedLRM 手搓3D mesh编辑

01:46

FLUX Kontext 随便聊几句 SAM4D 自动驾驶的快速分割

01:45

XVerse 字节多角色ID迁移 Shape-for-Motion 用3D代理来编辑视频

02:31

Calligrapher 一键修改海报字体（平面狂喜）EX-4D 用深度水密网格生成4D视频

02:00

Assembler3d 又一个可分割3D生成方法 VINCIE 从视频中解锁上下文图片编辑

01:35

LongAnimation 线稿动画上色 Depthanything-AC 获取任意条件下的图片深度

01:23

AniCrafter 替换任意视频的任意人STR-Match 无训练视频编辑

01:37

EchoMimicV3 阿里数字人焕新 x-planner 复杂指令图像编辑

01:26

OmniPart 零件级3D AI生成 4kagent 超分任何图像到4K

01:57

T-LoRA 增强单图微调定制模型 Go to Zero 零样本3D动作生成

01:23

ComfyUI_AniCrafter 基本完成及使用注意事项CanonSwap 高保真视频人脸替换

01:46

Addit 无训练图像自由插入 ALG 提升图生视频的动态

01:29

ComfyUI_AniCrafter 使用答疑，FantasyPortrait 多角色肖像动画

04:15

OmniSVG 矢量绘制方法正式开源；RoMaP 鲁棒性3D掩码零件级编辑

01:50

ComfyUI_OmniSVG 简单测试 DAViD 微软的视觉模型

01:49

ObjectClear 使用对象效果attention移除 ComfyUI_ObjectClear 演示

02:25

Diffuman4d 稀疏视频4DGS重建，Ultra3D:高效，快速，零件级3D生成

02:16

顶部