开源

Ultravox

Ultravox 是一种多模态大型语言模型(LLM),能够直接处理文本和语音输入,无需额外的语音识别步骤。其核心技术包括多模态投影器,用于将音频数据转换为高维空间表示,显著提升语音理解和处理效率。该模型支持实时语音对话、多语言扩展及领域特定知识的学习,适用于智能客服、虚拟助手、语言学习、实时翻译及教育等领域。

FreeImages

FreeImages,免费无版权图片素材资源下载网站。其中包括了超过 400000张免费照片和图片,分类很清晰,无需注册就能直接下载。

九章大模型(MathGPT)

学而思九章大模型是好未来自主研发的,面向全球数学爱好者和科研机构,以解题和讲题算法为核心的大模型。

FastExcel

FastExcel 是一个基于 Java 的开源 Excel 处理工具,具备高性能读写、流式操作和内存优化等特点。它兼容 EasyExcel 并在此基础上扩展了功能,如读取指定行数和 Excel 转换为 PDF,适用于大规模数据处理场景。FastExcel 提供简单易用的 API 和灵活的数据映射机制,广泛应用于财务报表生成、批量数据导入导出、ERP 系统集成及在线教育等领域。

HiDream

HiDream-I1是一款由HiDream.ai团队开发的开源AI图像生成模型,具备17亿参数,支持多种图像风格生成,包括真实、卡通和艺术风格。其在提示词理解、细节渲染和图像一致性方面表现出色,适用于艺术创作、商业设计、教育科研等领域。模型采用扩散模型和混合专家架构(MoE),并集成多种文本编码器,实现高质量与高效率的图像生成。项目已在GitHub和HuggingFace开源,便于研究与应用。

ReasonGraph

ReasonGraph 是一个开源平台,用于可视化和分析大语言模型(LLM)的推理过程。它支持多种主流模型和推理方法,提供直观的图表展示和交互式功能,帮助用户理解 AI 思考逻辑、优化模型表现。模块化设计使其易于扩展,适用于学术研究、教育、开发等多个领域。

LLaVA

LLaVA-OneVision是字节跳动开发的开源多模态AI模型,主要功能包括多模态理解、任务迁移、跨场景能力、开源贡献及高性能。该模型采用多模态架构,集成了视觉和语言信息,通过Siglip视觉编码器和Qwen-2语言模型,实现高效特征映射和任务迁移学习。广泛应用于图像和视频分析、内容创作辅助、聊天机器人、教育和培训以及安全监控等领域。

COMET

COMET是字节跳动开发的Mixture-of-Experts(MoE)模型优化系统,通过细粒度计算-通信重叠技术和自适应负载分配机制,显著提升分布式训练效率。它在大规模模型中实现单层1.96倍、端到端1.71倍的加速,具备强鲁棒性与泛化能力,支持多种硬件环境和并行策略,核心代码已开源并可无缝集成至主流训练框架。

LazyGraphRAG

LazyGraphRAG是微软研究院推出的一种图形增强生成增强检索框架,旨在降低数据索引成本并提升查询效率。相比GraphRAG,其索引成本仅为其0.1%,并通过混合搜索策略优化查询性能。该工具支持本地与全局查询,适用于多种应用场景,包括内容推荐、项目管理和客户服务等,且计划开源以促进技术普及。

FreeMind

FreeMind是一款基于java的免费的脑图(mind mapping)制作与管理软件。 支持的平台:Windows、Linux和Mac多种操作系统。