创作

MUMU

MUMU是一种多模态图像生成模型,通过结合文本提示和参考图像来生成目标图像,提高生成的准确性和质量。该模型基于SDXL的预训练卷积UNet,并融合了视觉语言模型Idefics2的隐藏状态。MUMU能够在风格转换和角色一致性方面展现强大的泛化能力,同时在生成图像时能够很好地保留细节。主要功能包括多模态输入处理、风格转换、角色一致性、细节保留以及条件图像生成。

Synthesizer V

Synthesizer V是一款革命性的音乐制作工具,它使用基于深度神经网络的合成引擎来生成令人难以置信的逼真的歌声。它具有可定制的AI音高生成,无限音轨,无核心限制,VST3/AU插件支...

CreatorKit

CreatorKit是一款基于AI技术的视觉内容创作工具,支持图片、视频及广告的智能生成与编辑。其核心功能包括AI图像生成、视频制作、品牌定制、多平台适配等,适用于电商、社交媒体及广告行业。用户可通过简单指令完成内容创作,提升效率并优化视觉呈现。提供多种订阅方案,满足不同规模企业的需求。

WriterDuet

专业的剧本写作工具,WriterDue具有在任何地点、任何时间与合作伙伴共同实时协作功能。

百度文库AI助手

百度基于文心一言重构的一站式智能文档助手,旨在为用户提供智能化的文档处理和写作支持。

PromptFix

PromptFix是一款基于扩散模型的开源AI图像修复工具,支持多种图像处理任务,如上色、物体移除、去雾、去模糊等。它通过20步去噪过程精确修复图像缺陷,同时保持图像结构完整性和泛化能力。PromptFix具备高频细节保护、辅助提示适配器、零样本学习能力和大规模数据集构建等特点,适用于个人照片编辑、专业摄影、数字艺术创作、媒体广告及电影制作等多个领域。

白日梦AI

一个文生视频类AIGC创作平台,支持文生视频、动态画面、AI角色生成、人物/场景一致性,可以将故事生成视频。

智启特AI

集合AI对话、绘图生成等AIGC功能的集合平台,提供行业解决方案;

Granite 3.1

Granite 3.1是IBM推出的一款先进语言模型,具备强大的上下文处理能力和多语言支持功能。其核心特性包括扩展至128K tokens的上下文窗口、全新嵌入模型以及功能调用幻觉检测能力。该模型适用于客户服务自动化、内容创作、企业搜索、语言翻译及合规性检查等多种应用场景。

Tarsier

字节跳动推出的一系列大规模视觉语言模型(LVLM),专注于视频理解任务,包括视频描述、问答、视频定位、幻觉测试等功能。