开源项目

ConsiStory

它提供了一种快速、高效且训练无关的方法来生成一致性图像,特别适用于需要保持主题一致性的应用场景。它不仅能够处理单主题场景,还能够应对多主题挑战,并与现有的图像编辑工具...

Llama 3.2

在图像理解和文本处理任务上展现出卓越的性能,并通过定制化微调和本地部署,推动了AI技术的开放性和可访问性。

Follow Your Pose

一个创新的文本到视频生成框架,它通过两阶段训练策略实现了高度的姿态控制和时间连贯性。该框架不仅能够根据文本描述生成视频,还能让用户通过姿态序列精确控制视频中角色的动作...

Void

它通过集成AI功能,为用户提供了一个高效、智能的编程和文本编辑环境。无论是代码开发还是文本编辑,Void都能提供强大的支持和便捷的操作。

Real

一个强大的图像超分辨率工具,它利用深度学习和生成对抗网络,在没有真实高分辨率图像作为参考的情况下,通过合成退化过程来提升低分辨率图像的质量。

书生·物华2.0(3DTopia 2.0)

采用创新的原语(primitive-based)三维表示方法PrimX,能够高效编码和生成具有物理基础渲染(PBR)特性的高质量三维资产。

PortraitGen

AI人像视频编辑工具,它通过先进的技术实现了对视频中人物的高质量编辑。无论是在影视制作、艺术创作、广告宣传、时尚展示、社交媒体还是游戏开发等领域,PortraitGen都能提供高效...

Vary

一个小型但功能强大的视觉语言模型,它使得资源有限的研究者和开发者也能体验到先进的视觉语言模型功能。

StarCoder 2

一个强大的代码生成和理解工具,它通过大规模训练和多样化的模型规模,为开发者提供了一个高性能的编程辅助平台。

GOT

创新的OCR模型,它通过先进的技术提供了精准、高效的OCR解决方案。无论是文档数字化、场景文本识别还是票据处理等应用场景,GOT-OCR 2.0都能提供强大的支持。