生成

Audyo

Audyo是一款文本到语音的AI语音转换器,允许用户通过打字创建和编辑人类质量的AI语音。

MDM

Matryoshka Diffusion Models (MDM) 是一种由苹果公司开发的新型扩散模型框架,通过嵌套UNet架构实现多分辨率联合去噪,支持从低分辨率到高分辨率的渐进式训练,显著提升高分辨率图像生成效率,适用于多种应用场景,如数字艺术创作、游戏开发、电影制作等,并具备出色的零样本泛化能力。

WeGen

WeGen是一款由中国科学技术大学等机构联合开发的多模态生成模型,结合多模态大语言模型与扩散模型,支持文本到图像生成、图像编辑、风格迁移等多种视觉任务。其特点包括对模糊指令的多样化响应、高一致性输出以及交互式生成能力,适用于创意设计、内容创作等多个领域。

CollovGPT

Collov AI解决人工智能室内设计的未来

生数

生数以其创新的多模态大模型和深度生成式算法研究,为艺术设计、游戏制作、影视后期和内容社交等领域提供了强大的技术支持和解决方案。

Qwen2vl

Qwen2VL-Flux 是一款基于多模态图像生成的模型,结合了 Qwen2VL 和 FLUX 技术。它支持多种生成模式,包括变体生成、图像到图像转换、智能修复和 ControlNet 引导生成,并具备深度估计和线条检测功能。该模型提供灵活的注意力机制和高分辨率输出,适用于艺术创作、内容营销、游戏开发等多个领域。

JanusFlow

JanusFlow是一款集成了自回归语言模型与校正流技术的多模态AI模型,能够在单一框架内高效完成图像理解和生成任务。它通过解耦视觉编码器和表示对齐策略,显著提升了模型在视觉理解与图像生成上的表现,广泛应用于图像生成、多模态内容创作、视觉问答、图像理解和辅助设计等多个领域。

Amadeus Code

Amadeus Code 是一款基于 AI 的音乐创作工具,可自动生成旋律与和弦,支持多种音乐风格,适用于个人创作、团队协作及音乐教育等多种场景。用户可免费使用基础功能,如生成 MIDI 文件并导入 DAW 进行编辑,也可选择按需或订阅方式获取更多高级功能,提升创作效率与多样性。

语鲸大模型

语鲸大模型是一个多功能的AI语言处理工具,它通过先进的算法和持续的学习,为用户提供高效、准确的语言服务。

VDraw

VDraw是一款基于AI的信息图表生成工具,可将文本、文档或视频内容快速转换为可视化图形。用户可自定义颜色、字体及品牌元素,支持多格式输入并提供便捷的分享功能。适用于教学、营销、内容创作等领域,提升信息传达效率与视觉效果。