生成

通义万相

通义万相,一个不断进化的人工智能艺术创作大模型,擅长将奇思妙想转化为图画。

Pippo

Pippo是由Meta Reality Labs研发的图像到视频生成模型,可基于单张照片生成多视角高清人像视频。采用多视角扩散变换器架构,结合ControlMLP模块与注意力偏差技术,实现更丰富的视角生成和更高的3D一致性。支持高分辨率输出及细节自动补全,适用于虚拟现实、影视制作、游戏开发等多个领域。技术方案涵盖多阶段训练流程,确保生成质量与稳定性。

DCEdit

DCEdit是一款基于双层控制机制的图像编辑工具,结合精确语义定位策略与视觉、文本自注意力优化,提升图像编辑的准确性和可控性。无需额外训练即可应用于现有扩散模型,支持复杂场景下的精细编辑任务,如对象替换、颜色调整等,适用于广告、影视、社交媒体等多个领域。

Sloyd

Sloyd作为一个3D建模工具,通过其参数生成器和机器学习技术,为用户提供了一个高效且易于使用的平台,以创建和定制3D资产。

copysmith

CopySmith是一款基于人工智能技术的文案生成工具,专为电商和企业级用户提供高效的内容创作解决方案。它利用自然语言处理技术,帮助用户快速生成高质量的文章、广告文案和产品描述等文本内容。用户可通过选择模板、输入关键词等方式定制化生成所需文本,并且支持多语言版本,适合国际化业务发展。主要应用场景包括电商商品详情页优化、营销推广材料制作、企业内部沟通文档编写等,旨在提升内容创作效率与质量。

DeerFlow

DeerFlow 是字节跳动推出的开源研究框架,结合语言模型与多种工具,支持高效完成复杂研究任务。具备多Agent架构,支持自然语言交互与智能协作,适用于研究报告、播客、演示文稿等内容生成。支持多种语言模型和外部工具集成,提供灵活配置与扩展能力,广泛应用于学术、市场、教育及个人知识管理等领域。

AI画廊

一个专注于人工智能(AI)作品的展示平台,提供了大量的AI绘画作品提示词分享和描述生成器。

Indic Parler

Indic Parler-TTS 是一款由 Hugging Face 与 AI4Bharat 联合开发的多语言文本到语音模型,支持 20 种印度语言和英语,提供 69 种独特语音。该模型基于深度学习架构,通过描述性文本输入实现对音调、语速、情感等参数的灵活控制,适用于多种语音合成场景。在低资源语言上表现优异,具备高自然度和清晰度的语音输出能力。

FineShare Singify

Singify 作为一个 AI 驱动的歌曲翻唱生成器,为用户提供了一个创新的方式来重新演绎和享受音乐。