SaRA SaRA是一种新型预训练扩散模型微调方法,通过重新激活预训练阶段未被充分使用的参数,有效提升模型的适应性和泛化能力。该方法支持核范数低秩稀疏训练,能够防止过拟合并优化模型性能,同时大幅降低计算资源需求。SaRA适用于多种应用场景,包括图像风格迁移、视频生成及下游数据集微调等,仅需少量代码调整即可实现高效微调。 AI项目与工具 2025年06月12日 12 点赞 0 评论 361 浏览
Florence Florence-2是微软Azure AI团队研发的多功能视觉模型,支持图像描述、目标检测、视觉定位和图像分割等功能。该模型基于Transformer架构,采用序列到序列学习方法,利用自注意力机制实现多模态信息融合。通过训练大规模数据集,Florence-2在多个应用场景中表现出色,包括图像和视频分析、内容审核、辅助驾驶、医疗影像分析以及零售和库存管理。 AI项目与工具 2025年06月12日 67 点赞 0 评论 361 浏览
Junlala AI Junlala AI 是一家专注于人工智能领域的公司。我们汇聚了行业内顶尖专家和高级工程师,致力于研发尖端的人工智能算法和解决方案。 AI服务商 2025年06月05日 100 点赞 0 评论 360 浏览
Eagle 2.5 Eagle 2.5 是一款由英伟达开发的视觉语言模型,专注于长上下文多模态学习,具备处理高分辨率图像和长视频序列的能力。其参数规模为 8B,但性能接近更大模型。采用信息优先采样和渐进式后训练策略,提升模型稳定性与适应性。支持多样任务,适用于视频分析、图像处理、内容创作及教育等多个领域。 AI项目与工具 2025年06月11日 59 点赞 0 评论 360 浏览
Pyramid Pyramid-Flow是一款基于文本生成高清视频的AI工具,利用创新的金字塔流匹配算法,支持从低分辨率到高分辨率的逐步生成过程,可生成长达10秒、分辨率达1280×768的视频内容。该模型具备端到端优化能力,支持连续帧生成,确保视频内容的连贯性和高质量。 AI项目与工具 2025年06月12日 93 点赞 0 评论 358 浏览
DreamO DreamO是由字节跳动与北京大学联合开发的图像定制生成框架,基于扩散变换器(DiT)模型实现多条件图像生成。支持身份、风格、背景等条件的灵活集成,具备高质量生成、条件解耦和精准控制能力。适用于虚拟试穿、风格迁移、主体驱动生成等多种场景,具备广泛的适用性和技术先进性。 AI项目与工具 2025年06月11日 31 点赞 0 评论 355 浏览
EMO2 EMO2是一种由阿里巴巴智能计算研究院开发的音频驱动头像视频生成技术,通过音频输入和静态人像照片生成高质量、富有表现力的动态视频。其核心技术包括音频与手部动作的协同建模、扩散模型生成视频帧,以及高精度音频同步。该工具支持多样化动作生成,适用于虚拟现实、动画制作和跨语言内容创作等场景,具备自然流畅的视觉效果和丰富的应用场景。 AI项目与工具 2025年06月12日 62 点赞 0 评论 354 浏览
OneThingAI 面向丰富的业务场景,提供一站式、全方位的云服务解决方案。服务于AI 训练/推理、科学计算、图形图像处理、视频编解码等场景, AI服务商 2025年06月05日 66 点赞 0 评论 336 浏览
NarratoAI NarratoAI是一款基于AI技术的影视解说和编辑工具,它利用大型语言模型(LLM)、计算机视觉和自然语言处理技术来理解视频内容,自动生成解说文案,并将文案转化为配音,同时进行视频剪辑和字幕生成。该工具支持个性化定制,可以满足不同用户的视频制作需求,简化视频制作流程,帮助非专业人士快速制作出专业水准的视频内容。 AI项目与工具 2025年06月12日 52 点赞 0 评论 335 浏览