工具

PPTAgent

PPTAgent是由中国科学院软件研究所研发的AI驱动演示文稿生成工具,采用两阶段编辑方法,从文档自动生成结构清晰、内容一致的PPT。它结合大型语言模型与幻灯片分析技术,支持大纲生成、内容编辑与质量评估,适用于教育、企业、市场等多个场景,显著提升演示文稿制作效率与质量。

Wav2Lip

Wav2Lip是一款开源的唇形同步工具,能够将音频文件转换为与口型同步的视频。它支持多种语言,适用于视频编辑、游戏开发和虚拟现实等多个领域。Wav2Lip具备音频驱动口型生成、面部表情同步和多语言支持等功能,采用先进的技术原理,如数据预处理、音频特征提取、口型编码器、音频到口型映射及生成对抗网络(GAN)。该工具提升了电影和视频的后期制作质量,增强了虚拟现实中的交互体验,还用于游戏开发、语言学习和

Compress JPG

一个免费在线的图片压缩工具,免费在线压缩 JPG、JPEG、PNG、WebP、GIF、AVIF、JXL 和 QOI 格式的图片,无需注册或登录。

QA

QA-MDT是一款基于文本生成高质量音乐的开源工具,其核心技术包括质量感知训练、掩蔽扩散变换器以及音乐与文本的同步优化。它能够根据用户提供的文本描述生成多样化的音乐作品,并通过质量控制确保输出结果的高保真度。此外,QA-MDT支持音乐与文本的一致性增强,适用于广告、影视配乐、音乐教育及智能设备等多个领域。

SONIFY.io

Sonify 在音频、数据和新兴技术的交叉领域进行创新。我们设计和开发音频优先的产品和数据驱动的解决方案。

Planner 5D

Planner 5D是一款AI驱动的3D家居设计工具,支持快速创建逼真室内设计方案。提供8000+家具和装饰品库,支持AI平面图识别、360°虚拟漫游等功能,适用于个人和专业人士。兼容多平台,适合家居设计、商业空间规划及教育场景。

破壳AI口语

破壳AI口语是一款基于AI技术的英语口语学习工具,涵盖生活、校园、旅游、职场等多场景对话,帮助用户提升流利度、语法和发音。支持雅思口语模考打分、实时纠错、地道表达润色等功能,用户可与多样虚拟角色互动,增强学习趣味性。适用于日常交流、留学、职场、旅游及考试备考等场景,助力用户高效提升英语口语能力。

SNOOPI

SNOOPI是一种基于增强单步扩散模型的文本到图像生成框架,通过PG-SB和NASA技术提高了模型的稳定性和控制力。它在多方面表现出色,包括提高生成效率、排除不期望的图像元素、支持多种模型背板以及生成高质量图像。SNOOPI广泛应用于数字艺术、游戏开发、广告、社交媒体和影视等领域。

词爪网

词爪网,禁词,极限词,敏感词,新广告法违禁词查询检测工具。