AI

ShotAdapter

ShotAdapter是一款由Adobe与UIUC联合开发的文本到多镜头视频生成框架,通过过渡标记和局部注意力掩码策略,实现角色身份一致性和镜头内容精准控制。支持用户通过文本提示调节镜头数量、时长和背景,适用于影视、广告、教育、游戏等领域,具备高效、灵活和可扩展的技术特点。

馆长

馆长是一款基于RAG技术的浏览器插件式AI问答工具,支持本地知识库管理,可导入PDF、Word、网页等内容,通过语义搜索提供精准答案。所有数据存储于本地,保障隐私安全,支持离线使用。具备中英文搜索、无限文档导入、多平台集成等特性,适用于个人知识管理、企业内部知识库、在线学习及图书馆服务等场景。

PowerMode AI

PowerMode AI是一个为初创公司提供AI生成的ppt演讲平台。

Muyan

Muyan-TTS是一款面向播客场景的开源文本转语音工具,基于超10万小时播客数据训练,支持零样本语音合成与说话人适配,可在0.33秒内生成1秒音频,适合实时与长内容合成。支持本地部署与API调用,应用于播客、有声书、视频配音、AI角色及新闻播报等领域,兼具高效性与灵活性。

Fynix

Fynix 是一款基于 AI 的软件开发辅助工具,支持多语言和主流 IDE,提供代码生成、质量分析、流程图可视化、自然语言指令等功能。适用于个人开发者和企业团队,提升开发效率与代码规范性,支持 JIRA 集成,并提供灵活的定价方案。

VideoCrafter2

VideoCrafter2 是一款由腾讯AI实验室开发的视频生成模型,通过将视频生成过程分解为运动和外观两个部分,能够在缺乏高质量视频数据的情况下,利用低质量视频保持运动的一致性,同时使用高质量图像提升视觉质量。该工具支持文本到视频的转换,生成高质量、具有美学效果的视频,能够理解和组合复杂的概念,并模拟不同的艺术风格。

刺鸟配音

一款专业文字转语音的有情绪的配音软件,刺鸟配音声音媲美真人的AI配音技术,可以为你轻松配出好声音。

VARGPT

VARGPT是一款多模态大语言模型,整合了视觉理解和生成任务于统一的自回归框架中。它通过next-token和next-scale预测机制,支持文本与图像的混合输入和输出,具备高效的视觉生成能力。模型采用三阶段训练策略,提升了在视觉问答、推理及图像生成任务中的表现。适用于多模态内容创作、指令到图像合成等场景。

Granite 4.0 Tiny Preview

Granite 4.0 Tiny Preview是IBM推出的轻量级语言模型,具备高效计算能力和紧凑结构,支持在消费级GPU上运行多个长上下文任务。采用混合Mamba-2/Transformer架构,结合高效与精准优势,支持无位置编码(NoPE)处理128K tokens上下文。内存需求降低72%,推理时仅激活1B参数,适用于边缘设备部署、长文本分析及企业级应用开发,适合资源受限环境下的AI研究与

Arcads

Arcads是一个AI视频广告制作平台,它能将简单的文本或产品链接转换成引人入胜的短视频广告。这个工具特别适合追求效率和成本效益的品牌和营销团队,提供快速、多语言的视频广告创...