生成

炼丹家AI

炼丹家AI,一个集成“AI对话“和“AI绘画”的人工智能垂直细分功能网站能够简单高效生成高质量文本创作与绘制出各种各样的惊艳图片作品。

TextHarmony

TextHarmony是一款由华东师范大学与字节跳动联合开发的多模态生成模型,擅长视觉与文本信息的生成与理解。该模型基于Slide-LoRA技术,支持视觉文本生成、编辑、理解及感知等功能,广泛应用于文档分析、场景文本识别、视觉问题回答、图像编辑与增强以及信息检索等领域。通过高质量数据集的构建与多模态预训练,TextHarmony在视觉与语言生成任务中表现出色。

Xmind AI

Xmind AI是一款功能强大的思维导图和头脑风暴软件,它通过直观的可视化方式帮助用户组织、管理和扩展思路。Xmind支持多种图表类型,让用户能够以最适合自己的方式捕捉创意和规划项...

EmotiVoice

EmotiVoice是网易有道推出的开源文本到语音系统,支持中英文及2000+音色,能根据提示生成带情感的语音。具备情感合成、语音克隆、多语言支持等功能,提供Web界面和API接口,适用于有声读物、智能助手、教育、客服等场景,技术上支持高效部署与模型微调。

TreeMind树图 | 思维导图

TreeMind树图是基于AI人工智能的在线思维导图工具。提供海量知识导图、素材资源,支持一键AI生成导图;分屏浏览,边看资料边做导图。

OmniAudio

OmniAudio-2.6B是一款专为边缘设备设计的高性能音频语言模型,具备语音识别、转录、问答、对话生成及内容创作等核心功能。其技术优势在于多模态架构的高效集成、稀疏性利用以及三阶段训练流程,支持FP16和Q4_K_M量化版本,确保在资源受限的环境下仍能稳定运行。OmniAudio-2.6B可应用于智能助手、车载系统、会议记录、教育和医疗等多个领域,为用户提供便捷、高效的语音交互体验。

AvatarGO

AvatarGO是由南洋理工大学、上海AI Lab和香港大学联合开发的AI框架,能够根据文本描述生成高质量的4D人体与物体交互场景。其核心在于利用LLM引导的接触重定位、空间感知的分数蒸馏采样和运动优化技术,实现精确的接触识别与动画生成,有效解决穿透问题。支持多种人物与物体组合,适用于虚拟导购、展厅讲解、VR/AR内容创作等多个领域。

Lumiere

谷歌研究院开发的基于空间时间的文本到视频扩散模型。采用了创新的空间时间U-Net架构,能够一次性生成整个视频的时间长度,确保了生成视频的连贯性和逼真度。

ImgCreator AI

Imgcreator AI,一款强大而灵活的在线图片生成工具,您只需在输入框中输入您想要转化为图像的文本。

必优科技

通过AI快速进行内容创作,营销文案、科普问答、文段续写等,加速内容生成,对seo创作友好!