生成

MOKI

MOKI是美图旗下一个提供一站式AI短片制作服务的平台,通过其AI技术,为用户提供从前期策划到后期制作的全方位短片制作解决方案。无论是创意构思、素材生成还是后期剪辑,MOKI都能...

孟子大模型

孟子大模型作为澜舟科技的核心产品之一,展现了公司在认知智能领域的技术实力和创新能力。通过其强大的语言处理和多模态数据处理能力,孟子大模型为不同行业提供了灵活、高效的解...

I ♡ Captions

I ♡ Captions轻松为视频和音频创建高质量的字幕。上传您的内容,根据渠道的具体要求生成精确的字幕,将字幕工作量减少高达75%。

Lumiere

谷歌研究院开发的基于空间时间的文本到视频扩散模型。采用了创新的空间时间U-Net架构,能够一次性生成整个视频的时间长度,确保了生成视频的连贯性和逼真度。

Freestyler

Freestyler是一款由多机构合作开发的AI工具,专注于说唱音乐的自动化生成。它通过结合语言模型、条件流匹配技术和神经声码器,实现了从歌词和伴奏到高质量说唱音频的全流程转化。Freestyler还推出了RapBank数据集,并支持零样本音色控制,广泛应用于音乐创作、现场表演、游戏音效及教育等领域。

National Gallery Mixtape

National Gallery Mixtape 是伦敦国家美术馆与 Google Arts & Culture 合作推出的 AI 音乐实验工具。用户可从 200 幅精选名画中选择最多 6 幅,AI 会分析画作的色彩、主题、情感和历史背景,生成匹配的音乐片段。用户可调整音量、顺序和叠加方式,并通过风格、乐器和心情标签定制音乐氛围。该工具基于谷歌 Gemini 模型,提供实时互动体验,适用于教育、艺

EvalsOne Ai

一个功能强大而简单易用的一站式评估平台,EvalsOne Ai用于迭代优化生成式AI的应用程序。它可以帮助克服AI生成中的不确定性,简化工作流程,增强团队信心,确保

presti

Presti是一款基于生成式AI技术开发的家具行业产品摄影解决方案,能够将单一产品图像转化为逼真的生活场景照片,显著降低摄影成本并提高效率。它支持用户添加配饰、更换材质及背景生成,广泛应用于家具展示、虚拟摄影、室内设计和电子商务等领域。

Text to Bark

Text to Bark 是由 ElevenLabs 推出的全球首个 AI 狗语文本转语音模型,能将文字转化为高度逼真的狗吠声,支持多种犬种选择和语气调整。技术基于深度学习和犬类语言学研究,适用于宠物训练、科研、娱乐及家庭互动等多种场景,具备良好的可扩展性和实用性。

Xmind AI

Xmind AI是一款功能强大的思维导图和头脑风暴软件,它通过直观的可视化方式帮助用户组织、管理和扩展思路。Xmind支持多种图表类型,让用户能够以最适合自己的方式捕捉创意和规划项...