开源项目 - 智狐AI导航

VLM

VLM-R1 是由 Om AI Lab 开发的视觉语言模型，基于 Qwen2.5-VL 架构，结合强化学习优化技术，具备精准的指代表达理解和多模态处理能力。该模型适用于复杂场景下的视觉分析，支持自然语言指令定位图像目标，并在跨域数据中表现出良好的泛化能力。其应用场景涵盖智能交互、无障碍辅助、自动驾驶、医疗影像分析等多个领域。

AI项目与工具 2025年06月12日 42 点赞 0 评论 752 浏览

DeepWiki

DeepWiki是一款由Devin团队开发的AI代码阅读助手，基于自然语言处理技术，帮助用户理解GitHub代码库并提供详细的文档级解答。支持深度研究、交互式图表生成、私有仓库文档创建等功能，适用于开源项目学习、代码审查、团队协作及教育培训等场景。目前已索引超3万仓库，处理超40亿行代码，对开源项目免费开放。

AI项目与工具 2025年06月11日 36 点赞 0 评论 752 浏览

F

F-Lite是一款由Freepik与FAL开源项目联合开发的10B参数文本到图像生成模型，基于版权安全数据集训练，支持商业应用。它采用T5-XXL文本编码器，结合扩散模型架构，实现高精度图像生成。支持多分辨率输出，包含256、512和1024像素，并推出专为纹理优化的F-Lite Texture版本。模型通过强化学习和多项优化技术提升生成质量与效率，适用于创意设计、内容创作、游戏开发等多个领域。

AI项目与工具 2025年06月11日 10 点赞 0 评论 757 浏览

Pixtral Large

Pixtral Large是一款由Mistral AI开源的超大规模多模态模型，具备1240亿参数，支持文本、图像和图表的理解与生成。它拥有128K的上下文窗口，能在多语言环境中处理复杂文档和多图像场景，广泛应用于教育、医疗、客服和内容审核等领域。

AI项目与工具 2025年06月12日 39 点赞 0 评论 757 浏览

PandasAI

一个基于Python的库，PandasAI将将该库依赖到自己项目中，只需几行代码，轻松实现数据读取，并能通过对话方式向数据进行提问

AI搜索问答 2025年06月05日 47 点赞 0 评论 758 浏览

Orpheus TTS

Orpheus TTS 是一款基于 Llama-3b 架构的开源文本到语音系统，支持自然、富有情感的语音生成。具备零样本语音克隆能力，无需预训练即可模仿特定语音，延迟低至 200 毫秒，适合实时应用。支持多种语音风格和情感控制，适用于有声读物、虚拟助手、游戏、教育等多个领域。

AI项目与工具 2025年06月12日 26 点赞 0 评论 758 浏览

AI Cover 红包封面生成器

由idoubi艾逗笔开发的一款AI红包封面生成器，利用AI技术生成高清精美的微信红包封面图片。

Ai绘画生成 2025年06月05日 39 点赞 0 评论 760 浏览

Jaaz

Jaaz是一款开源的AI设计Agent，提供本地免费的AI设计服务。它能智能生成设计提示，批量生成图像、海报和故事板，并支持Ollama、Stable Diffusion等本地图像和语言模型。用户可通过GPT-4o、Flux Kontext等技术在对话中编辑图像，进行对象移除和风格转换。Jaaz提供无限创意画布，适用于创意设计、快速原型、教育及个人创作等多种场景。

AI项目与工具 2025年06月11日 79 点赞 0 评论 761 浏览

PeterCat

PeterCat是一款基于开源技术的智能问答机器人，能够通过自动构建的知识库与GitHub相关功能交互，提供对话式答疑服务。它支持多模型适配、多集成方式，并具备强大的自然语言处理能力和自动化工具支持。主要应用场景涵盖开源项目支持、企业内部论坛、在线教育平台以及客户服务等领域，旨在提升技术交流与问题解决效率。

AI项目与工具 2025年06月12日 50 点赞 0 评论 765 浏览

OctoTools

OctoTools是斯坦福大学推出的开源智能体框架，通过标准化工具卡片实现复杂推理任务的高效处理。支持多步骤任务规划、工具集成与优化，具备高准确率和广泛适用性，适用于数学、医学、视觉分析等多个领域。

AI项目与工具 2025年06月12日 88 点赞 0 评论 770 浏览

开源项目

首页

开源项目

列表

默认

浏览次数

发布日期

VLM