开源项目 - 智狐AI导航

VLM

VLM-R1 是由 Om AI Lab 开发的视觉语言模型，基于 Qwen2.5-VL 架构，结合强化学习优化技术，具备精准的指代表达理解和多模态处理能力。该模型适用于复杂场景下的视觉分析，支持自然语言指令定位图像目标，并在跨域数据中表现出良好的泛化能力。其应用场景涵盖智能交互、无障碍辅助、自动驾驶、医疗影像分析等多个领域。

AI项目与工具 2025年06月12日 42 点赞 0 评论 752 浏览

Ev

Ev-DeblurVSR是一款由多所高校联合开发的视频增强模型，利用事件相机数据提升视频去模糊和超分辨率效果。通过互惠特征去模糊模块和混合可变形对齐模块，实现高精度视频恢复。适用于监控、体育、自动驾驶等多个领域，支持快速部署与研究。

AI项目与工具 2025年06月11日 52 点赞 0 评论 747 浏览

SuperTinyIcons

一个收集了丰富 Logo的SVG 图标库，目前已收集386+ 个主流的品牌和产品的 Logo，包括GitHub、Twitter、Facebook等。适合用于网页设计、移动应用开发。

logo图标 2025年06月05日 68 点赞 0 评论 745 浏览

VideoDrafter

一个高质量视频生成的开放式扩散模型，相比之前的生成视频模型，VideoDrafter最大的特点是能在主体不变的基础上，一次性生成多个场景的视频。

Ai开源项目 2025年06月05日 89 点赞 0 评论 742 浏览

SFR-RAG

先进的大型语言模型，它通过强化对上下文的理解，提高了机器在生成文本方面的准确性和可靠性。无论是在客户服务、知识问答、内容创作还是专业咨询领域，SFR-RAG都能提供高质量的文...

Ai平台模型 2026年06月23日 0 点赞 0 评论 737 浏览

开发者搜索

百度为开发者群体开发的一个小而美垂类搜索，开发者搜索目的让开发者能够更加简单高效的检索到需要的内容，为平时的工作，学习提供帮助。

AI搜索问答 2025年06月05日 18 点赞 0 评论 736 浏览

Genmoai

Genmoai-smol 是一款专为单 GPU 设备设计的开源视频生成模型，能够将文本描述转化为高质量视频内容。其核心优势在于高保真度运动表现、强大的文本提示遵循能力及显存优化技术，支持用户在资源受限条件下开展视频创作。该工具提供了 Gradio UI 和命令行界面两种操作方式，并广泛应用于视频内容创作、超现实效果视频制作和技术研究等领域。

AI项目与工具 2025年06月12日 26 点赞 0 评论 733 浏览

OmAgent

OmAgent是由Om AI与浙江大学滨江研究院联合开发的多模态语言代理框架，支持文本、图像、视频等多种输入形式，简化设备端智能代理的开发流程。它具备高效模型集成、灵活算法接口和复杂任务处理能力，适用于视频监控、内容推荐、教育辅助等场景，提升设备智能化水平和用户体验。

AI项目与工具 2025年06月12日 97 点赞 0 评论 733 浏览

Archon

Archon 是一个开源 AI 智能体构建与优化平台，支持多智能体协作、领域知识集成、本地 LLM 集成等功能。它提供自动化代码生成、语义搜索、Streamlit 界面交互及 Docker 部署能力，适用于企业、教育、智能家居等多个场景。技术上融合 Pydantic AI 和 LangGraph，强调框架无关性和高效开发流程。

AI项目与工具 2025年06月12日 74 点赞 0 评论 731 浏览

VPP

VPP（Video Prediction Policy）是清华大学与星动纪元联合开发的AIGC机器人模型，基于视频扩散模型实现未来场景预测与动作生成。支持高频预测与跨机器人本体学习，显著降低对真实数据的依赖。在复杂任务中表现出色，适用于家庭、工业、医疗、教育等多个领域。其开源特性推动了具身智能机器人技术的发展。

AI项目与工具 2025年06月11日 61 点赞 0 评论 730 浏览

开源项目

首页

开源项目

列表

默认

浏览次数

发布日期

VLM

Ev