开源 - 智狐AI导航

Pangea

Pangea是一款由卡内基梅隆大学团队开发的多语言多模态大型语言模型，支持39种语言，具备多模态理解和跨文化覆盖能力。其主要功能包括多语言文本生成与理解、图像描述、视觉问答等，同时通过高质量指令和文化相关任务优化性能。Pangea基于丰富的数据集和先进的模型架构，适用于多语言客户服务、教育、跨文化交流等多个领域。

AI项目与工具 2025年06月12日 11 点赞 0 评论 479 浏览

VideoTrans

一个开源的视频翻译和配音工具，VideoTrans能够一键识别视频字幕、翻译成其他语言以及进行多种语音合成，最终输出带字幕和配音的目标语言的视频。

字幕配音 2025年06月05日 84 点赞 0 评论 480 浏览

LMEval

LMEval是谷歌推出的开源框架，用于简化大型语言模型（LLMs）的跨提供商评估。它支持多模态（文本、图像、代码）和多指标评估，兼容Google、OpenAI、Anthropic等主流模型提供商。LMEval基于增量评估引擎，节省时间和计算资源，并通过自加密的SQLite数据库安全存储评估结果。LMEvalboard提供交互式可视化界面，帮助用户分析模型性能并直观比较不同模型的优缺点。

AI项目与工具 2025年06月11日 27 点赞 0 评论 481 浏览

TANGOFLUX

TANGOFLUX是一款高效文本到音频生成模型，具备约5.15亿参数量，能够在3.7秒内生成30秒高质量音频。它采用CLAP-Ranked Preference Optimization框架优化音频输出，支持多种应用场景，包括多媒体内容创作、音频制作、播客、教育及虚拟助手开发。其开源特性推动了相关领域的技术进步。

AI项目与工具 2025年06月12日 73 点赞 0 评论 485 浏览

Dream Studio模型

DreamStudio 模型是一个多功能的AI艺术创作平台，它通过提供文本到图像的转换服务，使用户能够轻松创作艺术作品。

Ai绘画生成 2026年06月23日 0 点赞 0 评论 487 浏览

Sweep AI

Sweep AI 是一款利用人工智能技术优化软件开发流程的工具，集成了大型语言模型与代码分析引擎，主要功能涵盖代码搜索、重构、测试生成以及文档创建等。它旨在帮助开发者提高工作效率，简化代码管理，并支持灵活定制化设置以满足不同团队的需求。

AI项目与工具 2025年06月12日 96 点赞 0 评论 488 浏览

小顽简报

一款全新、免费且功能强大的PPT插件，提供了一键智能透视、批量图片处理等多种实用功能

PPT资源 2025年06月05日 85 点赞 0 评论 489 浏览

轩辕大模型

国内首个开源的千亿级中文对话大模型

Ai平台模型 2026年06月23日 0 点赞 0 评论 493 浏览

BAGEL是字节跳动开源的多模态基础模型，拥有140亿参数，采用混合变换器专家架构（MoT），通过两个独立编码器捕捉图像的像素级和语义级特征。它能够进行图像与文本融合理解、视频内容理解、文本到图像生成、图像编辑与修改、视频帧预测、三维场景理解与操作、世界导航以及跨模态检索等任务。BAGEL在多模态理解基准测试中表现优异，生成质量接近SD3，并适用于内容创作、三维场景生成、可视化学习和创意广告生成等

AI项目与工具 2025年06月11日 92 点赞 0 评论 495 浏览

Hertz

Hertz-Dev是一款由Standard Intelligence开发的开源音频模型，专注于低延迟实时对话AI。它具备强大的音频生成与处理能力，能够处理和生成高质量的音频信号，并支持多任务微调，适用于语音识别、语音合成等多种应用场景。此外，Hertz-Dev还提供了音频自动编码、流式生成等功能，广泛应用于智能助手、客户服务、语音识别及合成等领域。

AI项目与工具 2025年06月12日 48 点赞 0 评论 496 浏览

开源

首页

开源

列表

默认

浏览次数

发布日期