Aitubo Aitubo是一款基于先进Flux模型的AI图像和视频生成平台,支持用户通过文本提示生成高质量图像,并具备背景移除、图像放大增强、AI外扩绘画以及人脸交换等功能,广泛应用于游戏开发、动漫制作、艺术创作及广告营销等领域。 AI项目与工具 2025年06月12日 42 点赞 0 评论 698 浏览
图应 图应是一款基于AIGC技术的AI商拍工具,专为电商领域设计,通过AI生成高质量商品图像,支持模特与场景定制,具备智能编辑功能。其应用场景涵盖广告创意、印刷出版、服装时尚等领域,显著提升商业视觉效果,降低拍摄成本并提高效率。 AI项目与工具 2025年06月12日 60 点赞 0 评论 698 浏览
ParGo ParGo是一种由字节与中山大学联合开发的多模态大语言模型连接器,通过结合局部与全局token,提升视觉与语言模态的对齐效果。其核心模块PGP和CPP分别提取图像的局部和全局信息,增强细节感知能力。在多个基准测试中表现优异,尤其在文字识别和图像描述任务中优势明显。采用自监督学习策略,提高模型泛化能力,适用于视觉问答、图像字幕生成、跨模态检索等多种场景。 AI项目与工具 2025年06月12日 38 点赞 0 评论 698 浏览
Aqua Voice Aqua Voice 是一款AI驱动的语音转录与文档编辑工具,支持语音转文字、自然语言指令编辑、自动格式优化及多语言处理。它适用于高效写作、辅助输入及跨平台办公场景,兼容多种主流应用,提升文本创作效率与准确性。 AI项目与工具 2025年06月11日 81 点赞 0 评论 698 浏览
冒泡鸭 借助自研的多模态大模型技术,冒泡鸭成为对话AI的新代表。这个先进的系统植入了众多由大模型技术支持的智能对话单元,这些“智能体”旨在提供用户所需的信息和灵感,不仅解答疑问,... 创作工具 1970年01月01日 0 点赞 0 评论 698 浏览
VRAG VRAG-RL是阿里巴巴通义大模型团队推出的视觉感知驱动的多模态RAG推理框架,旨在提升视觉语言模型在处理视觉丰富信息时的检索、推理和理解能力。通过定义视觉感知动作空间,实现从粗粒度到细粒度的信息获取,并结合强化学习和综合奖励机制优化模型性能。该框架支持多轮交互推理,具备良好的可扩展性,适用于智能文档问答、视觉信息检索、多模态内容生成等多种场景。 AI项目与工具 2025年06月11日 84 点赞 0 评论 698 浏览
LTXV LTXV-13B 是 Lightricks 推出的开源 AI 视频生成模型,拥有 130 亿参数,可在消费级显卡上高效运行,生成速度比同类产品快 30 倍。支持文本、图像转视频及多关键帧调节,具备多尺度渲染和高压缩率技术,适用于影视、广告、游戏、教育等多个领域,提升内容创作效率与质量。 AI项目与工具 2025年06月11日 18 点赞 0 评论 698 浏览