虚拟

Tripo 2.0

Tripo 2.0 是一款基于 AI 技术的 3D 模型生成工具,融合了 DiT 和 U-Net 模型架构,具备高效生成高质量 3D 模型的能力。支持文本和图像输入生成 3D 模型,同时提供纹理贴图、负向提示输入等功能,广泛应用于游戏开发、影视制作、虚拟现实、教育及工业设计等领域。

破壳AI口语

破壳AI口语是一款基于AI技术的英语口语学习工具,涵盖生活、校园、旅游、职场等多场景对话,帮助用户提升流利度、语法和发音。支持雅思口语模考打分、实时纠错、地道表达润色等功能,用户可与多样虚拟角色互动,增强学习趣味性。适用于日常交流、留学、职场、旅游及考试备考等场景,助力用户高效提升英语口语能力。

Amphion

Amphion是一款开源音频生成工具包,包含文本转语音(TTS)、歌声合成(SVS)、语音转换(VC)、歌声转换(SVC)、文本转音频(TTA)和文本转音乐(TTM)等功能。它支持多种神经声码器,并提供可视化模型架构,帮助用户快速掌握音频生成技术。通过统一框架和预训练模型,Amphion推动了音频生成领域的研究和应用发展。

Elai.io

了解Elai如何帮助您提高转化率,增加有机流量和提高观众与视频的互动。

AgentMarket

AgentMarket是一款由清华大学深圳国际研究生院的Agentland实验室开发的线上社交小游戏,它结合了模拟经营和AI捏人技术,允许玩家通过AI帮助创建个性化的Agent角色,并在虚拟集市中进行交流和交易。游戏特色包括AI捏人、AI大富翁模式、留言和卡片系统,为玩家提供了高度互动性和沉浸式的社交体验。玩家可以创建独特的角色,与其他Agent进行自由交流,推销商品,解锁更多交流功能,同时还可以

Interior AI

Interior AI是一个人工智能图像生成器平台,允许用户上传自己(或其他人)家的图像,并根据17种预选风格之一生成新的外观和布局。它是日益增长的人工智能图像生成器生态系统的一部分...

The Matrix

The Matrix是一款基于AI的世界模拟器,能够生成高保真度、无限时长的视频流,支持实时交互控制。它融合了3A游戏数据与真实世界视频,具备零样本泛化能力。核心技术包括交互模块、移窗去噪过程模型和流一致性模型,适用于游戏开发、影视制作、虚拟现实、教育模拟及城市规划等多个领域。

GarDiff

GarDiff是一款基于人工智能的虚拟试穿工具,采用CLIP和VAE编码提取服装外观先验,并结合服装聚焦适配器和高频细节增强算法,生成高保真试穿图像。它能够精准对齐服装与人体姿态,保留复杂图案与纹理,适用于电子商务、时尚设计、个性化推荐、社交媒体、虚拟时尚秀及游戏等多个领域,提供真实且沉浸式的在线试穿体验。

Diffuse

Diffuse 是一款基于 AI 技术的视频编辑工具,支持用户通过自拍照生成个性化虚拟角色,并结合文本或图像生成高质量视频内容。其功能包括动作模仿、文本到视频生成、预剪辑选择及提示编辑,适用于社交媒体、广告、教育等多种场景。该工具专注于移动端使用,提升视频创作的便捷性与灵活性。

Direct3D

Direct3D-S2是由南京大学、DreamTech、复旦大学和牛津大学联合开发的高分辨率3D生成框架,基于稀疏体积表示和空间稀疏注意力(SSA)机制,提升扩散变换器(DiT)的计算效率并降低训练成本。该框架包含全端到端的稀疏SDF变分自编码器(SS-VAE),支持多分辨率训练,在1024³分辨率下仅需8个GPU即可训练。Direct3D-S2能够从图像生成高分辨率3D形状,具有精细几何细节和高