生成

渗透智能

一款全方位AI产品,集成问答+绘画+导图+PDF对话等功能!

通义舞王

阿里云通义千问APP里的一个功能,是一个免费的ai跳舞视频生成工具,只要你上传一张照片,就可以生成一段神形兼备的舞蹈视频。

The AI Scientist

The AI Scientist-v2 是一个端到端的 AI 系统,能够自主完成从提出科学假设到撰写论文的全流程科研任务。它采用基于代理的树搜索方法,提高科学探索效率,并结合视觉-语言模型优化内容质量。该系统已成功生成并通过同行评审的 AI 论文,标志着 AI 在科学研究领域的重大突破。适用于科研自动化、机器学习、跨学科研究及教育等多个场景。

闪剪_AI剪辑_数字人

闪剪是一款AI智能视频剪辑工具,自2021年起专注于数字人领域,并在2022年推出了数字人短视频创作平台。该平台提供SAAS级企业应用的数字产品,并打造了APP和网页两种产品形态。

ID

ID-Animator是一款由腾讯光子工作室、中科大和中科院合肥物质科学研究院联合开发的零样本人类视频生成技术。它能够根据单张参考面部图像生成个性化视频,并根据文本提示调整视频内容。ID-Animator通过结合预训练的文本到视频扩散模型和轻量级面部适配器,实现高效的身份保真视频生成。其主要功能包括视频角色修改、年龄和性别调整、身份混合以及与ControlNet等现有条件模块的兼容性。

TANGO

TANGO是一个开源框架,利用分层音频运动嵌入和扩散插值网络,生成与目标语音同步的全身手势视频。其主要功能包括高保真视频制作、跨模态对齐、过渡帧生成及外观一致性保持,适用于新闻播报、虚拟YouTuber、在线教育等多个领域。该工具通过先进的技术解决了动作与语音匹配问题,并有效提升了视频内容制作效率。

Hailuo AI

Hailuo AI 是一款基于AI技术的视频生成工具,支持将文本和图片转化为动态视频内容。提供多种艺术风格与场景选择,最新模型可让2D插画动起来,适用于创意设计、影视制作等领域,帮助用户高效实现视觉创意,提升创作效率。

Noiz AI

Noiz AI 是一款基于自研大模型的 AI 语音合成与克隆工具,支持 3-10 秒音频快速生成逼真语音模型,适用于 TTS、视频配音和多语言翻译。具备情感化语音输出与一键语言转换功能,广泛应用于内容创作、教育、商业及娱乐等领域,提升内容表达效果与国际化传播能力。

Toona.io

一个提供生成和分享动画漫画、动态漫画和动感漫画工具平台。Toona通过提供图像修复、自动上色、图像增强和动画生成等功能来让漫画创作更简单。

EyeDiff

EyeDiff是一款基于扩散模型的文本到图像生成工具,专为多模态眼科图像生成设计。通过自然语言提示,EyeDiff能够捕捉常见及罕见眼病的关键特征,显著提升诊断准确性。该工具采用CLIP文本编码器与交叉注意力机制,结合潜在扩散模型(LDM),生成高质量、与文本高度一致的图像,适用于数据增强、疾病筛查、数据共享及医学教育等场景。