模型 - 智狐AI导航

LLaDA

LLaDA是一款基于扩散模型框架的新型大型语言模型，由中国人民大学高瓴AI学院与蚂蚁集团联合开发。它通过正向掩蔽和反向恢复机制建模文本分布，采用Transformer作为掩蔽预测器，优化似然下界提升生成效果。LLaDA在上下文学习、指令遵循和双向推理方面表现突出，尤其在反转推理任务中克服了传统自回归模型的局限。其8B参数版本在多项基准测试中表现优异，适用于多轮对话、文本生成、代码生成、数学推理和语

AI项目与工具 2025年06月12日 66 点赞 0 评论 710 浏览

AskXBOT

AskXBOT将AI Agent的开发、设计、部署和管理等功能集成于一体，为企业提供了一个便捷、高效的智能化工作流解决方案。

Ai编程建站 2026年06月25日 0 点赞 0 评论 710 浏览

DeepSeek服务器繁忙怎么解决？16个免费R1满血版平替

本文介绍了16款可替代DeepSeek R1满血版的AI工具，涵盖本地部署、API调用及多平台解决方案。这些工具支持深度思考、联网搜索、多模态交互等功能，部分平台还提供高速专线、文档解析、图片识别等增强特性，满足不同场景下的AI需求。

AI项目与工具 2025年06月12日 62 点赞 0 评论 709 浏览

RelightVid

RelightVid是一款基于时序一致性扩散模型的视频重照明工具，由多所高校和研究机构联合开发。它支持通过文本提示、背景视频或HDR环境贴图对视频进行细粒度和一致的场景编辑，具备全场景和前景保留重照明功能。该模型在预训练图像照明编辑框架基础上扩展，引入时序层提升视频重照明效果，并结合真实视频与3D渲染数据生成高质量数据对。RelightVid在保持时序一致性和照明细节方面表现突出，适用于影视制作、

AI项目与工具 2025年06月11日 53 点赞 0 评论 709 浏览

MARS

MARS是一款由字节跳动开发的优化框架，专注于提升大型模型训练效率。它融合了预条件梯度方法与方差减少技术，并通过缩放随机递归动量技术优化梯度估计。MARS支持多种Hessian近似方式，可生成基于AdamW、Lion和Shampoo的优化算法实例。该框架适用于深度神经网络、大规模语言模型、计算机视觉任务及强化学习等领域，能有效加速模型收敛并提高训练稳定性。

AI项目与工具 2025年06月12日 79 点赞 0 评论 709 浏览

风宇

风宇是全球首个全链式空间天气大模型，由中气局、南昌大学和华为联合开发。通过整合卫星观测与数值模拟数据，实现太阳风、磁层和电离层的动态耦合模拟，提升空间天气预测精度，尤其在短临预报和极端事件响应方面表现突出，广泛应用于通信、航天、电力及航空等领域，推动AI与地球空间科学融合。

AI项目与工具 2025年06月11日 72 点赞 0 评论 709 浏览

Windsurf

Windsurf是一款由Codeium公司开发的AI编程辅助工具，通过深度集成AI技术，支持多步骤协作与上下文感知，提供代码补全、搜索、重构和问题检测等功能，帮助企业提升开发效率。其特色包括自然语言集成、多模型AI融合及企业级混合部署方案，适用于大型代码库管理和快速原型开发场景。

AI项目与工具 2024年11月26日 100 点赞 0 评论 709 浏览

Darwin模型

Darwin模型是一个专门为自然科学领域（尤其是物理、化学和材料科学）设计的大语言模型（LLM），只要通过整合结构化和非结构化的科学知识，提升语言模型在科学研究

Ai平台模型 2025年06月05日 19 点赞 0 评论 709 浏览

dots.llm1

dots.llm1 是小红书 hi lab 开源的中等规模 Mixture of Experts（MoE）文本大模型，拥有 1420 亿参数，激活参数为 140 亿。模型在 11.2T 高质量 token 数据上预训练，采用高效的 Interleaved 1F1B 流水并行和 Grouped GEMM 优化技术，提升训练效率。该模型支持多语言文本生成、复杂指令遵循、知识问答、数学与代码推理以及多轮

AI项目与工具 2025年06月11日 78 点赞 0 评论 709 浏览

Instella

Instella是AMD推出的30亿参数开源语言模型，基于自回归Transformer架构，支持4096标记序列，具备强大的自然语言理解、指令跟随和多轮对话能力。通过多阶段训练和高效优化技术，Instella在多个任务中表现优异，适用于智能客服、内容创作、教育辅导、编程辅助和企业知识管理等多个场景。AMD全面开放了模型资源，促进AI技术发展与社区合作。