投稿

AI论文精读之SDMG-R

1010

0

2022-03-04 00:15:43

未经作者授权，禁止转载

正在缓冲...

-

图像信息提取

计算机视觉

大家好我是爱因发消息

新论文、新算法层出不穷，这不是我们的认知负担，而是我们的认知福利。

一口气玩到凌晨两点，太上头了！

这游戏太上头了

data2vec 一种通用的适用于任意模态的无监督学习框架

18:45

MAE 视觉自监督学习 Masked Autoencoders Are Scalable Vision Learners

27:24

CRNN OCR领域的重要模型

18:25

Faster R-CNN 目标检测的里程碑模型

21:24

Mask TextSpotter v1、v2、v3 #OCR

17:33

SDMG-R图像关键信息提取

27:48

Transformer GPT和BERT都在用的基础模型结构

15:23

PP-OCR 百度开源的OCR模型

17:00

MMoE 多任务学习

11:53

Swin Transformer

17:38

ESMM 多任务学习

07:31

ChineseBERT 更适合中文的BERT

07:14

PLE 多任务学习

12:09

CoCa 多模态预训练模型

06:37

CLIP 多模态预训练模型

08:26

LIMoE 多模态预训练模型

09:21

DBNet 文本检测模型

07:27

RepVGG 结构重参数化

10:27

SVTR 文本识别模型

10:46

ViT (Vision Transformer)

09:41

ViLT 多模态预训练模型

08:44

ViT-Adapter 用于密集预测任务的ViT适配器

09:58

BEIT 视觉预训练模型

07:06

WDNet 水印去除重要模型

09:09

SAM segment anything 分割一切大模型

12:43

多模态大模型BLIP-2

18:20

InstructBLIP 利用指令微调训练的多模态大模型

17:11

多模态大模型Qwen-VL

10:30

多模态基础模型InternVL

13:05

InternVL1.5多模态大模型

14:24

顶部