开源 - 智狐AI导航

YAYI

YAYI-Ultra是中科闻歌研发的企业级大语言模型，具备多领域专业能力与多模态内容生成能力，支持数学、代码、金融、中医等领域。模型支持超长文本处理、数据分析、任务规划及联网创作，适用于媒体、医疗、财税等行业。采用混合专家架构，结合指令微调技术，在多项评测中表现优异，提供高效、精准的智能化服务。

AI项目与工具 2025年06月12日 25 点赞 0 评论 871 浏览

MarkItDown

MarkItDown是一款由微软推出的开源文档转换工具，支持多种文件格式（如PDF、Office文档、图像、音频等）转换为Markdown格式。它具备OCR文字识别、语音转文字、元数据提取等功能，适用于文档归档、内容发布、数据挖掘、学术研究等多个场景，旨在简化文件处理流程，提升工作效率。通过提供简单易用的API接口，MarkItDown成为开发者友好型工具。

AI项目与工具 2025年06月12日 22 点赞 0 评论 871 浏览

Xiaomi MiMo

Xiaomi MiMo 是小米推出的推理型大模型，具备强大的数学推理与代码生成能力。通过预训练与后训练相结合，利用大量高价值语料及强化学习算法，在 7B 参数规模下实现超越更大模型的表现。支持多场景应用，包括教育、科研、软件开发等，已开源至 HuggingFace，便于开发者使用与研究。

AI项目与工具 2025年06月11日 95 点赞 0 评论 870 浏览

Bark

Bark是一款开源的文本到音频转换模型，由Suno AI开发，能够生成逼真的多语言语音及多种音频类型，包括音乐和背景噪音，并支持非语言交流的声音。该模型提供预训练模型，适用于研究和商业用途。其主要功能涵盖文本到音频转换、多语言支持、音频多样性和非语言交流模拟。Bark在多语言内容创作、音频内容生成和非语言交流场景中具有广泛应用。

AI项目与工具 2025年06月12日 28 点赞 0 评论 869 浏览

COMET

COMET是字节跳动开发的Mixture-of-Experts（MoE）模型优化系统，通过细粒度计算-通信重叠技术和自适应负载分配机制，显著提升分布式训练效率。它在大规模模型中实现单层1.96倍、端到端1.71倍的加速，具备强鲁棒性与泛化能力，支持多种硬件环境和并行策略，核心代码已开源并可无缝集成至主流训练框架。

AI项目与工具 2025年06月12日 12 点赞 0 评论 867 浏览

Oliva

Oliva 是一款基于语音驱动的 RAG 助手，结合 Langchain 和 Qdrant 向量数据库，实现语音指令到结构化数据的实时响应。支持多智能体协作、语义搜索与灵活知识库集成，适用于企业知识库、智能客服、智能家居等多种场景。具备语音识别、实时通信和自然语言处理能力，提升信息获取与交互效率。

AI项目与工具 2025年06月12日 57 点赞 0 评论 867 浏览

UIGEN

一个基于 Qwen2.5-Coder-7B 模型微调的开源 UI 设计生成工具，能够根据用户输入的提示生成结构清晰且符合标准的 HTML 和 CSS 代码

Ai编程建站 2025年06月05日 44 点赞 0 评论 866 浏览

FUSION BRAIN

FUSION BRAIN是一款基于AI的图像生成工具，能够根据文本描述生成高质量图像，并支持多种艺术风格和格式。用户可对生成的图像进行编辑和优化，适用于艺术创作、广告设计、游戏开发等多个领域。平台提供API接口，便于开发者集成与使用，是创意人员和研究人员的理想选择。

AI项目与工具 2025年06月12日 59 点赞 0 评论 866 浏览

YT Navigator

YT Navigator 是一款基于 AI 的 YouTube 内容检索工具，支持自然语言查询、语义搜索和视频内容交互。用户可快速定位视频片段并获取时间戳，提升信息获取效率。适用于研究、学习、创作和分析等场景，具备频道管理、安全会话等功能。采用向量嵌入与 BM25 算法结合的搜索机制，提高搜索准确率，项目已开源。

AI项目与工具 2025年06月12日 57 点赞 0 评论 866 浏览

Make-A-Character

创新的3D角色生成框架，它通过文本描述快速创建逼真的3D角色，具有高度的定制性和逼真度。它结合了最新的人工智能技术，提供了一个直观、灵活且高效的角色创建解决方案，适用于多...

Ai平台模型 2026年06月23日 0 点赞 0 评论 865 浏览

开源

首页

开源

列表

默认

浏览次数

发布日期