生成

Stable Video Diffusion

Stable Video Diffusion是一种先进的生成式人工智能视频模型,将图像转换为视频,从而改变了视频生成领域。

PromptLLM

一款AIGC提示工具。该工具通过仅几个输入的词语生成详细的图像,简化了创建详细图像的过程。

Kodezi Ai

Kodezi Ai,程序员的自动更正功能。Kodezi 是一个 AI 驱动的开发工具,可以在几秒钟内调试、优化、转换、生成和记录您的代码。

Amphion

Amphion是一款开源音频生成工具包,包含文本转语音(TTS)、歌声合成(SVS)、语音转换(VC)、歌声转换(SVC)、文本转音频(TTA)和文本转音乐(TTM)等功能。它支持多种神经声码器,并提供可视化模型架构,帮助用户快速掌握音频生成技术。通过统一框架和预训练模型,Amphion推动了音频生成领域的研究和应用发展。

GPTExcel

GPTExcel 是一款基于AI的电子表格辅助工具,支持公式生成、自动化脚本编写、SQL查询生成等功能,简化复杂数据处理流程。它提供详细解释,帮助用户理解和应用生成内容,并支持表格模板创建、数据可视化和正则表达式生成,适用于多种应用场景,如财务、数据分析和人力资源管理。

Speechify

Speechify是一款文本转语音的应用程序,通过将文本转换成自然的声音,帮助你理解和记住更多你所阅读的内容。它可以在Chrome、iOS、Android和Mac上使用。

ChatPDFLocal

一款专为Mac用户设计的本地PDF阅读和处理工具,它结合了原生 macOS 界面和强大的大型语言模型(LLM),能够快速、安全地处理 PDF 文件。

BoomCut

BoomCut是小影科技推出的AI视频本地化工具,支持视频换脸、多语言口播、字幕翻译、声音克隆及字幕擦除等功能,适用于跨境营销和多语言内容制作。用户可通过简单操作生成高质量视频,降低制作成本,提升内容传播效率。适用于广告投放、市场拓展及个性化营销场景。

Argil

Argil是一款基于SOTA深度学习技术的AI视频生成平台,支持快速创建个性化AI克隆形象,适用于品牌推广、教育、娱乐等多种场景。平台提供丰富的虚拟形象和灵活的视频编辑功能,如机位控制、肢体语言调整等,提升视频吸引力与真实性。无代码操作简化创作流程,支持多语言及多平台适配,适合个人创作者与企业使用。

LatentLM

LatentLM是一款由微软与清华大学合作开发的多模态生成模型,能够统一处理文本、图像、音频等多种数据类型。它基于变分自编码器(VAE)和因果Transformer架构,支持自回归生成与跨模态信息共享,特别擅长图像生成、多模态语言模型及文本到语音合成等任务,其提出的σ-VAE进一步提升了模型的鲁棒性。