AI项目与工具

GaussianCity

GaussianCity是由南洋理工大学S-Lab团队开发的高效3D城市生成框架,基于3D高斯绘制技术,采用紧凑的BEV-Point表示方法降低显存和存储需求。其空间感知的BEV-Point解码器可生成高质量3D城市场景,支持多样化视角和实时渲染,适用于游戏、影视、城市规划等领域。相比现有方法,其生成速度提升60倍,兼具高效与高质量特性。

LuminaBrush

LuminaBrush是一款基于深度学习的图像照明生成工具,采用两阶段处理流程:首先提取图像的均匀光照状态,再根据用户涂鸦生成具体光照效果。它支持实时调整光照参数,适用于复杂图像细节处理,广泛应用于数字艺术、游戏设计、影视后期等领域。工具提供交互式界面,便于用户高效创作。

F5

F5-TTS是一款由上海交通大学研发的高性能文本转语音(TTS)系统,采用流匹配与扩散变换器技术,支持多语言合成及情感控制等功能。它能够在无额外监督条件下生成高质量语音,适用于多种商业和非商业场景,如有声读物、语音助手、语言学习等。

BibiGPT

BibiGPT是一款利用人工智能技术自动分析和提炼音视频内容的工具。它能够一键总结来自多个平台的音视频内容,并提供多样化的总结形式,包括摘要、思维导图、字幕列表和文章视图。此外,用户可以自由提问,以获取相关问题的答案。BibiGPT支持多客户端使用,包括iOS快捷指令、微信服务号、书签版、PWA客户端、Chromium内核的浏览器插件及电脑桌面端。它还提供了多种导出和保存选项,并支持与音视频内容进

Submagic

Submagic是一款基于人工智能技术的视频编辑工具,专为内容创作者、企业及团队设计。其核心功能包括动态字幕生成、高级B-Roll素材集成、基于文本的剪辑操作及团队协作支持。通过这些功能,Submagic能够显著提升视频制作效率,增强内容的专业性和吸引力,同时支持用户收集反馈以持续优化内容质量。适用场景涵盖社交媒体、商业营销、教育、播客、新闻媒体及产品演示等领域。

风平智能

风平智能提供一站式AI解决方案,涵盖虚拟数字人定制、AI短视频生成、数字人直播、IP培育及交易等功能。平台利用先进AI技术,支持多语言互动,服务于金融、教育、医疗等行业,推动数字人技术在元宇宙时代的广泛应用。

DeepSite

DeepSite 是一款基于 DeepSeek-V3 模型的在线开发工具,用户可通过自然语言描述快速生成游戏、网页或应用代码,并支持实时预览。无需安装环境,操作简便,适用于快速原型开发、教育学习、创意实现及小型项目开发,提升了编程的易用性和效率。

xpression camera

Expression Camera是一款结合人工智能技术的虚拟相机应用,能够通过单张照片生成逼真的虚拟形象,涵盖面容、表情和身体动作。支持实时生成、个性化定制、隐私保护及多样化内容创作。用户可在视频会议、直播、在线教育等场景中使用虚拟形象,兼具实用性和娱乐性。

GenFM

GenFM是一款由ElevenLabs开发的AI工具,可将PDF、文章、电子书等内容转换为多角色播客音频。它支持32种语言,具备自动化声音选择、人性化填充词添加及高度定制化功能,适用于教育、播客制作、有声书创作、商业推广等多个领域。

Llama 3

Llama 3是Meta公司开发的一款最新大型语言模型,提供了8B和70B两种参数规模的模型。它通过增加参数规模、扩大训练数据集、优化模型架构和增强安全性等功能,显著提升了自然语言处理能力,适用于编程、问题解决、翻译和对话生成等多种应用场景。Llama 3在多个基准测试中表现出色,并且通过指令微调进一步增强了特定任务的表现。