AI

Stable Diffusion 3

Stable Diffusion 3 是一款由 Stability AI 开发的先进文本到图像生成模型,通过改进的文本渲染能力、多主题提示支持、可扩展的参数量、图像质量提升及先进的架构技术,实现了高质量和多样性的图像生成。该模型在图像生成和文本理解方面取得了显著进展,并通过 Diffusion Transformer 架构和 Flow Matching 技术提升了模型效率和图像质量。

FabricDiffusion

FabricDiffusion是一项由谷歌与卡内基梅隆大学联合开发的高保真3D服装生成技术,可将2D服装图像的纹理和印花高质量地转移到3D服装模型上。其核心技术基于去噪扩散模型和大规模合成数据集,生成多种纹理贴图并支持跨光照条件的精准渲染,具备优秀的泛化能力和实际应用潜力,适用于虚拟试衣、游戏开发、影视制作及时尚设计等多个领域。

BlinkShot

BlinkShot 是一款基于 AI 的实时图像生成工具,支持用户通过输入描述性提示快速生成高质量图像。它采用 Together AI 的 Flux Schnell 技术,提供自定义分辨率和生成步骤功能,适合艺术创作、设计、游戏开发、广告营销等多个领域。工具基于开源技术开发,具备良好的可扩展性和可观察性。

Coqui.ai

Coqui.ai 是一个语音技术的开源平台,Coqui.ai 通过生成式 AI 提供逼真、富有情感的文本转语音,它可以从 3 秒的音频中克隆任何声音并调整其风格、节奏和情感。

​XCole

​XCole 是一款集AI绘图、AI文字、AI创作等为一体的综合性AI创作平台,XCole 能快速将您的创意转化为您所需要的文字、图片形式,让AI帮助您大幅提升生产力。

Alpha3D

Alpha3D是一款无需3D建模经验的人工智能驱动工具,可将2D图像或文本描述快速转化为3D模型。它支持游戏开发、虚拟现实、增强现实及元宇宙等领域的应用,具备文本到3D、2D到3D模型生成等功能,并可与NVIDIA Omniverse集成,提供从免费到企业级的多种订阅方案。

图司机

图司机提供海量海报在线制作、邀请函、易拉宝、banner、gif动图、名片、公众号首图、在线PS等免费设计素材和模板,可在线一键搞定设计、印刷并能在线图片编辑、照片编辑。

Hunyuan

Hunyuan-Large是一款由腾讯开发的大规模混合专家(MoE)模型,以其庞大的参数量成为当前参数规模最大的开源MoE模型之一。该模型基于Transformer架构,擅长处理长文本任务,同时在多语言自然语言处理、代码生成以及数学运算等领域展现出色性能。通过合成数据增强训练与创新的注意力机制,Hunyuan-Large实现了高效的推理吞吐量,并广泛应用于内容创作、教育辅助、知识问答及数据分析等多

LazyLLM

LazyLLM 是一款开源的低代码平台,用于高效构建多智能体大语言模型应用。它支持低代码开发、多智能体架构、模型微调、一键部署、跨平台运行及多模态扩展等功能,适用于聊天机器人、RAG、故事创作和AI绘画等多种场景。其核心采用数据流驱动和模块化设计,提升开发效率和灵活性。

Uberduck

Uberduck是一个开源的语音AI社区,可以帮助用户在几分钟内通过api创建人工智能生成的音频应用程序。它允许用户使用5000 +富有表现力的声音制作AI画外音,并使用他们的AI生成的说唱...