开源专题

AIMv2

AIMv2是苹果公司开发的开源多模态自回归预训练视觉模型，通过图像与文本的深度融合提升视觉理解能力。其采用图像块与子词标记拼接的方式进行自回归预训练，支持多种参数规模，适用于不同设备。具备视觉问答、指代表达理解、图像字幕生成、多媒体检索等功能，并可无缝集成到大型语言模型中。模型在多个视觉任务中表现优异，具备良好的可扩展性和零样本适应能力。

AI项目与工具 2025年06月12日 48 点赞 0 评论 698 浏览

青梧字幕

青梧字幕是一款基于AI语音识别技术的字幕提取工具，能够从视频中精准提取语音内容并生成时间轴字幕。支持多语言识别、多格式导出及多语种翻译，适用于视频创作者、外语学习者及字幕团队。所有数据处理在本地完成，保障隐私安全，兼容Windows和MacOS系统，提升字幕制作效率。

AI项目与工具 2025年06月12日 90 点赞 0 评论 693 浏览

AsrTools

AsrTools是一款无需复杂配置的智能语音转文字工具，支持多种音频格式的转换，生成SRT和TXT字幕文件，适用于视频字幕、会议记录、音频转写等多个场景。它具有友好的用户界面、高效的多线程处理能力以及详细的技术文档，旨在为用户提供便捷、准确的语音转文字解决方案。

AI项目与工具 2025年06月12日 40 点赞 0 评论 834 浏览

RAG Logger

RAG Logger 是一款专为检索增强生成（RAG）应用设计的开源日志记录工具，支持查询跟踪、检索结果记录、LLM 交互记录及性能监控等功能。其核心特性包括结构化 JSON 日志存储、每日日志组织、事件驱动架构和灵活配置选项。RAG Logger 能够帮助开发者有效监控和优化 RAG 管道的运行效率，广泛适用于搜索引擎优化、智能问答系统、内容推荐系统、NLP 研究及教育辅助工具等领域。

AI项目与工具 2025年06月12日 24 点赞 0 评论 669 浏览

Pangea

Pangea是一款由卡内基梅隆大学团队开发的多语言多模态大型语言模型，支持39种语言，具备多模态理解和跨文化覆盖能力。其主要功能包括多语言文本生成与理解、图像描述、视觉问答等，同时通过高质量指令和文化相关任务优化性能。Pangea基于丰富的数据集和先进的模型架构，适用于多语言客户服务、教育、跨文化交流等多个领域。

AI项目与工具 2025年06月12日 11 点赞 0 评论 479 浏览

Omages

Omages是一个开源的3D模型生成项目，基于图像扩散技术将3D形状的几何和纹理信息编码到64×64像素的2D图像中。该工具不仅提高了3D对象生成的效率，还在低分辨率下保留丰富的细节。Omages支持3D对象生成、几何和纹理编码、多图谱表示以及自动材质生成等功能。它适用于3D打印与制造、虚拟现实、增强现实、游戏开发、电影和动画制作及室内设计等多种应用场景。

AI项目与工具 2025年06月12日 25 点赞 0 评论 615 浏览

OpenEMMA

OpenEMMA是一个开源的端到端自动驾驶多模态模型框架，基于预训练的多模态大型语言模型（MLLMs），能够处理视觉数据和复杂驾驶场景的推理任务。它通过链式思维推理机制提升轨迹规划和感知任务性能，并集成了优化的YOLO模型以提高3D边界框预测的准确性。此外，OpenEMMA支持人类可读的输出，适用于多种驾驶环境，包括城市道路、高速公路、夜间及复杂天气条件下的驾驶。

AI项目与工具 2025年06月12日 36 点赞 0 评论 827 浏览

AI Dev Gallery

AI Dev Gallery 是一款由微软开发的开源 AI 工具集，集成于 Visual Studio 中，旨在帮助开发者快速集成端侧 AI 功能。它提供超过 25 个交互式示例，涵盖文本、图像、音频和视频领域，支持从 GitHub 和 Hugging Face 下载模型，并能在本地设备上高效运行。此外，工具集还具备代码导出功能，便于开发者将示例集成至自有项目中。

AI项目与工具 2025年06月12日 55 点赞 0 评论 620 浏览

Oumi

Oumi 是一个开源 AI 平台，支持从数据准备到模型部署的全流程开发。它提供零样板代码体验，支持多种训练方法和多模态模型，适用于自动驾驶、人机交互、学术研究等多个场景。平台具备高效的分布式训练能力和灵活的部署选项，适合企业和研究机构使用。

AI项目与工具 2025年06月12日 26 点赞 0 评论 714 浏览

Figma

Figma-Low-Code 是一款基于 Luisa 框架的开源工具，通过将 Figma 设计自动转换为 Vue.js 应用程序，大幅缩短设计与开发间的交接时间。支持零代码渲染、数据绑定、自定义组件扩展及响应式布局，有效分离 UI 和业务逻辑，提升团队协作效率。适用于快速原型制作、敏捷开发、MVP 开发以及教育场景。

AI项目与工具 2025年06月12日 17 点赞 0 评论 824 浏览

本专题汇集了与开源相关的各类工具和资源，通过分类整理和详细介绍，帮助用户快速找到适合自己需求的工具，提高工作和学习效率。