生成

OmniParse

OmniParse是一款开源数据解析平台,支持多种文件类型的非结构化数据转换为结构化格式,包括文档、图像、视频、音频及网页内容。其核心功能涵盖表格提取、图像字幕生成、音视频转录以及网页内容结构化处理,利用自然语言处理、光学字符识别及深度学习技术提升解析效率与准确性。OmniParse完全在本地运行,确保数据隐私与安全,广泛应用于文档自动化处理、客户服务、市场研究、法律合规及医疗记录管理等领域。

Eduwriter.ai

一种开创性论文写作工具,可以帮助学生毫不费力地撰写复杂的论文。通过选择主题、论文类型、主题领域和所需的页数,在几秒钟内轻松撰写一篇独特的论文。

EzAudio

EzAudio是一款基于文本到音频(Text-to-Audio, T2A)生成模型,通过优化的扩散变换器架构和高效的数据训练策略,实现了快速生成高质量音频的功能。它支持多种应用场景,如音乐创作、影视后期制作、语音合成等,并具备高保真度和低资源消耗的特点。

MagicSchool

MagicSchool是一款面向教育领域的AI平台,提供课程规划、视频问题生成、行为干预方案制定和内容创作等功能,帮助教师提高教学效率与质量。平台支持多语言操作,内置80多种AI工具,适用于课堂教学、备课、学生个性化支持及家校沟通等多种场景,具备良好的实用性与扩展性。

PromptBase

PromptBase是一个在线平台,专注于AI提示词的交易与应用。用户可以浏览并购买由专业AI创作者制作的提示词,涵盖多种AI模型及应用场景;同时,用户也可上传自己的提示词成为卖家,或利用这些提示构建AI应用程序。PromptBase支持内容生成、艺术创作、社交媒体营销、游戏开发等多个领域,为AI技术的普及与创新提供了有力支持。

Ideamap Ai

Ideamap Ai,创意和AI激发创造力的地方,它是一个用于头脑风暴的可视化工作空间,在这里团队可以协作创意,并使用人工智能来提升他们的创造力。

SwiftBrush V2

SwiftBrush V2 是一款基于文本到图像的单步扩散模型,通过改进权重初始化、LoRA训练及夹紧CLIP损失等技术,实现了与多步Stable Diffusion模型相媲美的性能。它无需真实图像数据即可训练,显著提升了生成速度和图像质量,广泛应用于艺术创作、游戏开发、虚拟现实等领域。

TurboTTS

TurboTTS是一款支持多语言的在线文本转语音工具,提供300多种真实语音选择,生成自然流畅的语音效果。适用于短视频、教育、广告及播客等多种场景,操作简单,支持多种音频格式下载,并可合法用于商业用途。凭借AI技术,用户能高效完成语音内容制作,满足多样化需求。

商汤如影

商汤如影是一款由商汤科技开发的AI数字人视频生成平台,通过先进大模型技术创建高度逼真的数字人形象,应用于教育、金融、营销等领域。平台具备数字人创建、声音克隆、视频生成、自动化数据标注、图片生成、实时互动等功能,并支持多语言及多种服务形式,以满足个性化和专业化的服务需求。

WeGen

WeGen是一款由中国科学技术大学等机构联合开发的多模态生成模型,结合多模态大语言模型与扩散模型,支持文本到图像生成、图像编辑、风格迁移等多种视觉任务。其特点包括对模糊指令的多样化响应、高一致性输出以及交互式生成能力,适用于创意设计、内容创作等多个领域。