视频 - 智狐AI导航

Tarsier2

Tarsier2是字节跳动研发的大规模视觉语言模型，擅长生成高精度视频描述并在多项视频理解任务中表现优异。其核心技术包括大规模数据预训练、细粒度时间对齐微调以及直接偏好优化（DPO）。该模型在视频问答、定位、幻觉检测及具身问答等任务中均取得领先成绩，支持多语言处理，具有广泛的应用潜力。

AI项目与工具 2025年06月12日 59 点赞 0 评论 529 浏览

Medeo

Medeo是一款基于AI技术的视频创作平台，能够将文字描述自动转化为高质量视频。它具备智能文生视频、素材匹配、AI配音、音乐推荐、URL转视频及动画生成等功能，广泛应用于内容创作、企业营销、教育培训、个人娱乐和新闻媒体等多个领域。平台集成了多种先进AI模型，提升视频制作效率与创意表现力，是创作者的理想工具。

AI项目与工具 2025年06月11日 84 点赞 0 评论 529 浏览

DressPlay

DressPlay是一款基于AI技术的虚拟试衣应用，支持用户通过上传照片或视频实现服装的虚拟试穿。其核心功能包括虚拟试衣、服装选择、视频换装及个性化调整等。凭借强大的AI算法，DressPlay能精准分析用户身形并生成逼真效果，广泛应用于个人购物、电商平台、内容创作及设计等领域，提升用户体验与商家效率。

AI项目与工具 2025年06月12日 58 点赞 0 评论 529 浏览

VideoRAG

VideoRAG是一种基于检索增强生成（RAG）技术的工具，旨在提升长视频的理解能力。它通过提取视频中的多模态信息（如OCR、ASR和对象检测），并将其与视频帧和用户查询结合，增强大型视频语言模型的处理效果。该技术轻量高效，易于集成，适用于视频问答、内容分析、教育、媒体创作及企业知识管理等多个领域。

AI项目与工具 2025年06月12日 75 点赞 0 评论 528 浏览

Optimo

AI驱动的营销程序，可以简化和加速营销过程。

流量变现 2026年06月23日 0 点赞 0 评论 527 浏览

千面视频动捕

千面视频动捕是一款融合先进人工智能技术的视频动捕解决方案，专注于将视频中的人体关节二维信息高效转化为三维模型动作数据。此产品简化了传统动画制作中人物动作的创建流程，显...

Ai科技公司 2026年06月23日 0 点赞 0 评论 527 浏览

Ming

Ming-Lite-Omni是蚂蚁集团开源的统一多模态大模型，基于MoE架构，支持文本、图像、音频和视频等多种模态的输入输出，具备强大的理解和生成能力。模型在多个任务中表现优异，如图像识别、视频理解、语音问答等，适用于OCR识别、知识问答、视频分析等多个领域。其高效处理能力和多模态交互特性，为用户提供一体化智能体验。

AI项目与工具 2025年06月11日 79 点赞 0 评论 527 浏览

mnml.ai

mnml.ai 是一款面向建筑师和室内设计师的 AI 渲染工具，支持将手绘或数字草图快速转换为高质量渲染图，涵盖多种风格和应用场景。其具备 AI 草图转图像、视频制作、渲染增强、风格迁移等功能，操作简便，适合各类用户使用。同时支持文本提示生成设计，提升工作效率与表现力。

AI项目与工具 2025年06月11日 29 点赞 0 评论 526 浏览

鲲云科技

下一代人工智能计算平台

创作工具 2026年06月23日 0 点赞 0 评论 526 浏览

Gan.ai

Gan.ai是一个强大的个性化视频制作工具，它通过提供易于使用的录制和个性化功能，帮助用户在各种商业场景中提升沟通效率和效果。