应用 - 智狐AI导航

VLM

VLM-R1 是由 Om AI Lab 开发的视觉语言模型，基于 Qwen2.5-VL 架构，结合强化学习优化技术，具备精准的指代表达理解和多模态处理能力。该模型适用于复杂场景下的视觉分析，支持自然语言指令定位图像目标，并在跨域数据中表现出良好的泛化能力。其应用场景涵盖智能交互、无障碍辅助、自动驾驶、医疗影像分析等多个领域。

AI项目与工具 2025年06月12日 42 点赞 0 评论 758 浏览

Magnific AI

Magnific AI，一个基于生成式AI的图像超分辨率增强工具，不仅可以实现图片的分辨率提升，更可以依靠自然语言提示和“创意”滑块等控制参数，让AI主动增加和“猜想”更多细节信息。

图片处理 2025年06月05日 36 点赞 0 评论 758 浏览

Reverb ASR

Reverb ASR是一款基于深度学习的开源自动语音识别与说话人分离工具，采用20万小时高质量英语语音数据训练，具备高精度语音转录能力，支持逐字稿控制及多种解码模式。其显著特点是擅长处理长时间语音内容，并在长篇幅识别任务中超越其他开源模型。Reverb ASR适用于播客、会议记录、法庭记录等多个应用场景，为用户提供灵活且高效的语音转文字解决方案。

AI项目与工具 2025年06月12日 55 点赞 0 评论 758 浏览

tldraw

tldraw是一款开源的无限画布工具，支持多人实时协作，适用于团队设计、项目管理和教育等领域。它提供了手绘风格、智能箭头、捕捉和便签等功能，以及丰富的绘图工具如画笔、橡皮擦、线框和文本工具，用户可在无限画布上自由创作，不受空间限制。

AI项目与工具 2025年06月12日 26 点赞 0 评论 758 浏览

FlexClip

FlexClip是一款基于云端的视频编辑平台，提供丰富的素材库及多种编辑工具，包括裁剪、分割、文字添加、录音、音乐和水印等功能，支持多格式导入与高清输出，广泛应用于社交媒体、商业宣传、教育、个人项目等领域，用户可通过网页端直接操作，无需额外软件安装。

AI项目与工具 2025年06月12日 27 点赞 0 评论 757 浏览

KAPWING

KAPWING是一款基于AI技术的在线视频编辑平台，提供从视频生成到编辑的一站式解决方案。其核心功能涵盖AI视频生成器、文档转视频、文本转语音、字幕生成及高级编辑工具，支持用户轻松创建和定制视频内容。此外，KAPWING还具备团队协作能力，适合教育、企业宣传及内容创作等多个应用场景。

AI项目与工具 2025年06月12日 14 点赞 0 评论 756 浏览

SOLAMI

SOLAMI是一款基于VR环境的3D角色扮演AI系统，支持用户通过语音和肢体语言与虚拟角色进行沉浸式互动。系统采用社交视觉-语言-行为模型（Social VLA），可识别用户的多模态输入并生成相应响应，涵盖多种角色类型及互动场景，如游戏、舞蹈等。其核心技术涉及多任务预训练和指令微调，适用于虚拟社交、教育、心理治疗及娱乐等多个领域。

AI项目与工具 2025年06月12日 66 点赞 0 评论 756 浏览

Rork

Rork是一款AI驱动的无代码开发工具，能够根据用户自然语言描述快速生成跨平台移动应用。它支持iOS和Android平台，基于React Native技术，可一键发布到App Store和Google Play，并与多种后端数据库集成。Rork适合初创企业、非技术用户及快速原型开发，降低应用开发门槛，提升效率。

AI项目与工具 2025年06月11日 92 点赞 0 评论 755 浏览

Skyo

Skyo是一款基于天工AI大模型技术的智能语音对话助手，具备快速响应、多语言对话、实时打断、情感化回应及个性化记忆等功能。它能根据用户情绪提供拟人化回复，并支持长时间对话和个性化声音定制。Skyo可应用于情感陪伴、个性化交互、多语言客服、时事新闻聊天、教育辅助和生活助理等多个场景，旨在为用户提供高质量的互动体验。

AI项目与工具 2025年06月12日 61 点赞 0 评论 755 浏览

讯飞AI大学堂

讯飞开放平台打造的AI专业学习、交流和培训的AI课堂。为AI领域开发者、爱好者提供专业、有趣、实用的AI培训课程，致力于推动AI技术的普及和应用。

Ai学习资源 2025年06月05日 38 点赞 0 评论 755 浏览

应用

首页

应用

列表

默认

浏览次数

发布日期

VLM