AI

OSUM

OSUM是一款由西北工业大学研发的开源语音理解模型,结合Whisper编码器与Qwen2 LLM,支持语音识别、情感分析、说话者性别分类等多种任务。采用“ASR+X”多任务训练策略,提升模型泛化能力和稳定性。基于约5万小时语音数据训练,性能优异,适用于智能客服、教育、心理健康监测等多个领域。

知存科技

专注研发基于存算一体先进技术的人工智能芯片

AInav

AInav 是一个专为您整理最前沿的人工智能工具的平台,让您直接找到适合的工具,成为超人

MiniMind

MiniMind 是一款轻量级开源语言模型项目,具备极低的训练成本和高效的训练流程。其最小模型仅需 25.8M 参数,可在普通 GPU 上运行,支持多模态能力,如视觉语言模型 MiniMind-V。项目提供完整的训练代码,涵盖预训练、微调、LoRA、DPO 和模型蒸馏,兼容主流框架,适合初学者和开发者快速上手并应用于多个领域。

k1 视觉思考模型

K1视觉思考模型是一款基于强化学习的AI工具,支持端到端图像理解和思维链技术,适用于数学、物理、化学等基础科学领域。该模型可直接处理图像信息并生成推理思维链,具有优秀的字符识别能力和跨学科问题解决能力,广泛应用于教育、科研、艺术等领域。

Meta Motivo

Meta Motivo是一款由Meta公司研发的人工智能模型,专为提高元宇宙中虚拟人形智能体的真实性和自然性而设计。通过无监督强化学习算法,Meta Motivo实现了对全身动作的有效控制,支持零样本学习、多任务泛化以及行为模仿等功能。其核心优势在于将状态、动作和奖励统一映射至潜在空间,显著增强了元宇宙体验的真实感。此外,该模型还适用于机器人控制、虚拟助手、游戏动画等多个应用场景。

Glasp

Glasp是一款集高亮标注、笔记管理和AI辅助于一体的多功能工具,支持用户在网页和PDF文档上标记重要信息,并通过AI技术生成个性化见解。它具备社交共享功能,支持多平台集成,适合学术研究、在线学习及团队协作等多种场景,助力用户高效管理知识资产。

芊芊妙音

芊芊妙音是一款基于AI技术的配音与变声工具,拥有丰富的音色库及强大的音频处理能力。它支持文字提取、语音转文字、音频编辑等功能,可广泛应用于社交媒体内容创作、视频制作、语言学习等领域。用户可以通过该软件实现个性化声音定制,并轻松分享作品至各大社交平台。

Polymet

Polymet是一款基于AI的产品设计平台,支持用户通过描述需求或上传图片快速生成原型,并提供可直接部署的代码输出。它与Figma等工具无缝集成,具备强大的编辑与迭代能力,适用于产品开发、设计迭代、跨部门协作以及教育等领域,助力团队高效完成创意到产品的转化过程。

OneStory.Art

一款创新的AI故事小说网文生成助手,OneStory.Art通过AI快速生成连续性、一致性的角色和故事网文,提供影视分镜、网文图片、游戏漫画以及更多内容创作。