AI论文精读之CRNN OCR领域的重要模型
AI论文精读之Mask TextSpotter v1、v2、v3
AI论文精读之PP-OCR
AI论文精读之多模态大模型BLIP-2
AI论文精读之data2vec
AI论文精读之MMoE
AI论文精读之PLE
AI论文精读之RepVGG
AI论文精读之MAE Masked Autoencoders Are Scalable Vision Learners
AI论文精读之ESMM
AI论文精读之CoCa
智能文档识别终极PK:MinerU与PaddleOCR巅峰对决,dify一键解锁多模态OCR能力
AI论文精读之BEIT
多模态大模型Qwen-VL
DeepSeek自动提取身份证信息后批量生成劳动合同
AI论文精读之ViLT
AI论文精读之SAM segment anything 分割一切大模型
强推!【Transformer+UNet】不愧是医学图像分割创新最容易复现的3个通用模块!【附论文及代码】UNet原理+项目实战!人工智能|计算机视觉|图像分割
智能PDF文档OCR结构化提取工具——MinerU
OpenCV入门到实战,目标追踪、图像识别、识别物体、轮廓检测、识别文字一口气学完,全程干货无废!草履虫都能听懂!人工智能/计算机视觉/机器学习/深度学习/AI