生成

迅排设计

一款漂亮且功能强大的在线海报设计器,图片编辑器,仿稿定设计,迅排设计Poster-Design适用于海报生成、电商产品图、文章长图、视频/公众号封面等多种场景。

databutton

Databutton 是一款面向非技术人员的 AI 驱动零代码开发平台,支持通过自然语言快速生成 Web 应用和 SaaS 产品。平台提供代码生成、界面设计、数据库管理、一键部署及 API 集成功能,适用于创业者、产品经理、教育工作者等各类用户,简化开发流程,提升效率。

DiffEditor

DiffEditor是由北京大学深圳研究生院与腾讯PCG联合研发的图像编辑工具,基于扩散模型,结合图像与文本提示,支持细粒度对象移动、尺寸调整、内容拖动及跨图像编辑。采用区域随机微分方程(Regional SDE)和时间旅行策略,提升编辑准确性和灵活性。无需额外训练即可实现高效图像处理,适用于创意设计、人像修复和风景优化等场景。

VidFul.ai

一个利用Kling AI和Luma AI Dream Machine技术的AI视频生成器,将文本和图像快速转化为专业视频。用户只需通过VidFul.ai输入文本或上传图像,即可轻松生成不错的视频。

AI Letter Generator

AI Letter Generator是一款专注于信件生成的人工智能工具,支持商务信函、求职信、个人信件及感谢信等多种类型信件的创作。其核心功能包括多语言支持、隐私保护、专业格式化选项等,旨在为用户提供高效、安全且专业的信件撰写体验。

OpenAudio S1

OpenAudio S1是Fish Audio推出的文本转语音(TTS)模型,基于200万小时音频数据训练,支持13种语言。采用双自回归架构和RLHF技术,生成自然流畅的语音,支持50多种情感和语调标记。具备零样本和少样本语音克隆功能,仅需10到30秒音频即可生成高保真声音。适用于视频配音、播客、游戏角色语音、虚拟助手、游戏娱乐、教育培训及客服系统等场景。提供40亿参数完整版和5亿参数开源版,满足

Neural4D 2o

Neural4D 2o 是一款基于多模态数据训练的 3D 大模型,支持文本、图像、3D 和运动数据输入,实现高精度的 3D 内容生成与编辑。具备上下文一致性、角色身份保持、换装和风格迁移等功能,支持自然语言指令操作。采用 Transformer 编码器与 3D DiT 解码器架构,原生兼容 MCP 协议,提升创作效率与交互体验,适用于 3D 内容创作、游戏开发、影视动画等多个领域。

讯飞译制

讯飞译制是一款基于语音识别与机器翻译技术的智能字幕制作与翻译平台,支持多语言转换与自动字幕生成,提供高精度识别、智能时间码匹配、多格式导出及配音功能,适用于短视频出海、教学视频、广告宣传等多种场景,提升内容传播效率与国际化水平。

WPS Al

WPS 智能文档基于 WPS AI 技术,提供内容生成、表达优化、文档理解及处理等功能。

Vidu主体参照功能

Vidu的主体参照功能是一项由Vidu AI首次推出的参考一致性功能,旨在保持视频中单一主体(如真人、2D或3D角色)的一致性。该功能不仅支持对角色的面容、半身、全身特征进行精确控制,还涵盖多种角色类型和画风,包括写实风格和各种艺术风格。它能有效解决视频制作中的一致性问题,提升创作效率,并降低技术门槛,适用于艺术创作、商业广告、社交媒体内容、教育和培训、游戏开发以及电影和电视剧制作等多种应用场景。