Lucidpic AI lucidpic 根据一系列预先制定的参数,比如人种、姿势、年龄、性别等来生成人像,输入简单描述,为你生成真实的人像。 Ai绘画生成 2025年06月05日 27 点赞 0 评论 378 浏览
WarpVideo WarpVideo是一款基于人工智能的视频创作工具,提供视频转视频、图像转视频、文本转视频及视频缩放等多种功能,支持用户快速高效地完成视频风格转换与格式调整。它广泛应用于电影制作、营销推广、社交媒体内容创作、教育培训及新闻报道等领域,助力用户轻松打造专业级视频内容。 AI项目与工具 2025年06月12日 42 点赞 0 评论 378 浏览
MoshiVis MoshiVis是一款由Kyutai开发的开源多模态语音模型,支持图像与语音的自然交互。它基于Moshi 7B架构,集成了视觉编码器和跨注意力机制,实现低延迟、自然流畅的对话体验。支持多种后端部署,适用于无障碍应用、智能家居、教育及工业场景,提升人机交互的智能化水平。 AI项目与工具 2025年06月12日 72 点赞 0 评论 378 浏览
BeaGo BeaGo是一款由零一万物开发的智能AI搜索助手,集文字与图像搜索于一体,具备强大的语义理解和个性化推荐功能。它能够快速生成简洁的信息摘要,提供可靠的搜索结果,并支持划词搜索和图文结合展示,广泛适用于日常生活、学术研究、工作辅助及学习辅导等多个场景。 AI项目与工具 2025年06月12日 93 点赞 0 评论 378 浏览
Viggle Viggle是一个强大的AI视频生成工具,它通过易于使用的命令为用户提供了丰富的视频创作可能性。无论是将静态角色转化为动态视频,还是完全控制角色动作,Viggle都能满足用户的创意... Ai视频生成 1970年01月01日 0 点赞 0 评论 377 浏览
Seede AI 一款简单易用的AI驱动设计工具,只需输入文字描述或上传参考图片,就能够在一分钟内帮助用户快速生成专业级的设计创作,只要应用在社交媒体、营销材料和创意项目等地方。 Ai图片处理 2025年06月05日 14 点赞 0 评论 377 浏览
Migician Migician是一款由多所高校联合开发的多模态大语言模型,专为多图像定位任务设计。它基于大规模数据集MGrounding-630k,采用端到端架构和两阶段训练方法,支持跨图像精准定位与多任务处理。Migician适用于自动驾驶、安防监控、医疗影像等多个领域,具有高效的推理能力和灵活的输入方式。 AI项目与工具 2025年06月12日 90 点赞 0 评论 377 浏览
LEOPARD LEOPARD是一款由腾讯AI Lab开发的视觉语言模型,专为处理包含大量文本的多图像任务而设计。它通过自适应高分辨率多图像编码模块和大规模多模态指令调优数据集,实现对复杂视觉语言任务的高效处理,包括跨图像推理、高分辨率图像处理及动态视觉序列长度优化。LEOPARD在自动化文档理解、教育、商业智能等领域具有广泛应用潜力。 AI项目与工具 2025年06月12日 35 点赞 0 评论 376 浏览
InternVL InternVL是由上海人工智能实验室开发的多模态大模型,融合视觉与语言处理能力,支持图像、视频、文本等多种输入。其基于ViT-MLP-LLM架构,具备多模态理解、多语言处理、文档解析、科学推理等能力,广泛应用于视觉问答、智能客服、图像分析等领域。模型采用动态高分辨率与渐进式训练策略,提升处理效率与准确性。 AI项目与工具 2025年06月12日 78 点赞 0 评论 376 浏览