生成

OmniTalker

OmniTalker 是一款由阿里巴巴开发的实时多模态交互技术,支持文本、图像、音频和视频的同步处理,并能生成自然流畅的语音响应。其核心技术包括 Thinker-Talker 架构和 TMRoPE 时间对齐技术,实现音视频精准同步与高效流式处理。适用于智能语音助手、内容创作、教育、客服及工业质检等场景,具有高实时性与稳定性。

Loudly

一种允许用户使用人工智能技术创作原创音乐的AI音乐生成器、Ai编曲软件。用户可以选择特定的流派和所需的音乐长度,Loudly AI将在几秒钟内生成独特的曲目。

JoggAI

JoggAI是一款基于AI技术的头像生成工具,可根据文本描述创建个性化的写实或卡通风格头像,并支持动态表情与动作。用户可通过简单操作自定义面部特征、服装、背景等细节,适用于社交媒体、数字营销、游戏开发及教育等多个领域,具备高度灵活性与易用性。

CF Spark Art

CF Spark Art 只需一句文本和点击就可生成 AI 图像。这个 AI 艺术生成器通过单个文本提示和您选择的图像比例生成独特的图像变化。

CogVideo

目前最大的通用领域文本生成视频预训练模型,含94亿参数。CogVideo将预训练文本到图像生成模型(CogView2)有效地利用到文本到视频生成模型,并使用了多帧率分层训练策略。

MakeMyTale

一个可让您使用人工智能为儿童创作短篇小说的Ai故事生成器。您可以选择年龄组、流派、主要角色和他们的名字,AI 将在几分钟内为您生成一个独特的故事。

团队快剪

团队快剪是由闪剪智能开发的一款专为团队带货打造的AI视频创作系统,集成了爆款脚本库、短视频拍摄模板和商品素材管理功能,旨在帮助本地生活服务商家和品牌提高视频内容创作和团...

Pixelied

Pixelied是一款基于浏览器的在线图形设计工具,提供丰富的模板库、版权免费的照片与图标资源以及一键背景移除等功能。用户可在线完成图片编辑、格式转换等任务,并利用其强大的AI图像生成技术实现高效创作。产品适用于社交媒体营销、内容创作、品牌推广等多个领域,支持团队协作,满足多样化视觉需求。

DiffusionGPT

DiffusionGPT是一款基于大型语言模型的开源文本到图像生成系统,由字节跳动与中山大学联合开发。它采用思维树和优势数据库技术,能够解析和处理多样化的文本提示,生成高质量图像。系统通过多模型的选择与集成、基于人类反馈的优化以及高效的图像生成执行,实现了从文本到图像的无缝转换。DiffusionGPT适用于多种应用场景,具有广泛适用性和灵活性。

misgif

misgif是一款基于AI的创意工具,通过面部替换技术将用户照片融入热门GIF、影视片段中,生成个性化表情包和视频。它支持多平台操作,拥有丰富的媒体库和强大的编辑功能,适合个人娱乐、社交媒体内容创作及品牌营销推广,同时提升群聊互动趣味性。