AI项目与工具

DanceFusion

DanceFusion是一款由清华大学开发的开源框架,专注于音频驱动的舞蹈动作生成与重建。它采用分层时空Transformer-VAE和扩散模型,能够处理不完整或嘈杂的数据,生成与音乐高度同步的逼真舞蹈动作。该工具支持多种应用场景,包括内容创作、虚拟现实、互动娱乐、舞蹈教育以及动画制作等,展现了其在多领域的应用价值。

Supermaven

Supermaven是一款基于人工智能技术的代码补全工具,专为提升开发人员编程效率而设计。它支持大上下文窗口、多语言兼容性及与主流编辑器的集成,同时具备智能聊天功能和错误检测修复能力,适用于日常编码、大型代码库维护及多语言项目开发等场景。

BlinkShot

BlinkShot 是一款基于 AI 的实时图像生成工具,支持用户通过输入描述性提示快速生成高质量图像。它采用 Together AI 的 Flux Schnell 技术,提供自定义分辨率和生成步骤功能,适合艺术创作、设计、游戏开发、广告营销等多个领域。工具基于开源技术开发,具备良好的可扩展性和可观察性。

Piczoo

Piczoo是一款多功能图片编辑工具,具备智能拼图、滤镜相机、艺术字体及贴纸等功能,支持用户轻松美化图片并分享至社交平台,广泛应用于社交媒体分享、旅行记录、美食展示和个人生活点滴记录等多个场景。

SPAR3D

SPAR3D是一种基于两阶段设计的单图像3D重建工具,能从单张2D图像生成高质量的3D网格。它结合点扩散模型与三平面Transformer技术,实现快速、精确的几何与纹理重建,并支持用户交互式编辑。适用于增强现实、影视制作、工业设计等多个领域。

MagicColor

MagicColor是一款由香港科技大学开发的多实例线稿图着色工具,基于自监督训练和实例引导模块,实现高效、精准的色彩分配。支持参考图像驱动,具备实例级控制与边缘增强功能,适用于动画、数字艺术、游戏开发等领域。采用扩散模型与双UNet架构,提升着色质量和效率,适合创意设计与教育应用。

DreamActor

DreamActor-M1是字节跳动推出的AI图像动画框架,能够将静态照片转化为高质量动态视频。其核心在于混合引导机制,结合隐式面部表示、3D头球和身体骨架,实现对表情和动作的精准控制。支持多语言语音驱动、口型同步、灵活运动转移及多样化风格适配,适用于虚拟角色创作、个性化动画生成、虚拟主播制作及创意广告等领域,具备高保真、强连贯性和广泛适用性。

AVD2

AVD2是由多所高校联合开发的自动驾驶事故视频理解框架,通过生成高质量事故视频并结合自然语言描述与推理,提升对复杂事故场景的理解能力。其功能涵盖事故视频生成、原因分析、预防建议及数据集增强,支持自动驾驶系统的安全优化与研究。基于先进模型如Open-Sora 1.2和ADAPT,AVD2在多项评估中表现优异,为自动驾驶安全提供了重要技术支撑。

AI智能写手

AI智能写手是一款基于人工智能技术的文本创作辅助工具,涵盖续写小说、文案润色、工作报告生成、PPT制作及多语言翻译等功能,支持多种场景应用,助力用户高效完成高质量写作任务。

PresentationGPT

PresentationGPT是一款基于AI的演示文稿生成工具,支持快速生成高质量的PowerPoint和Google幻灯片。用户可通过输入主题或上传文件实现自动化创作,并享受多格式导出、自定义设计等功能。产品提供免费与付费选项,适用于商业演示、教育培训、学术研究等多种场景,助力高效内容输出。