模型 - 智狐AI导航

VITA

VITA-Audio 是一款开源的端到端多模态语音大模型，具备低延迟、高推理效率和多模态交互能力。其核心创新包括轻量级 MCTP 模块和四阶段渐进式训练策略，使模型在语音识别、文本转语音和口语问答等任务中表现优异。支持实时对话、智能客服、教育辅助、医疗辅助及内容创作等多种应用场景，适用于各类语音交互系统。

AI项目与工具 2025年06月11日 19 点赞 0 评论 922 浏览

OutofFocus

OutofFocus是一款基于AI的图像编辑工具，支持文本提示驱动的图像生成与编辑。其核心功能包括风格转换、内容填充、图像修复和增强等，通过自然语言处理与扩散逆过程重建技术实现高效编辑。该工具具有易用性和灵活性，广泛适用于艺术创作、内容营销、教育研究等多个领域。

AI项目与工具 2025年06月12日 58 点赞 0 评论 920 浏览

明岐

明岐是上海交通大学LoCCS实验室开发的医学多模态大模型，专注于罕见病精准诊断。它整合影像、病历与化验数据，采用双引擎架构实现高精度、可解释的诊断，准确率超92%。通过模型优化技术，支持低成本本地化部署，适用于基层医疗、远程服务及科研教学，助力医疗资源均衡发展。

AI项目与工具 2025年06月11日 28 点赞 0 评论 919 浏览

TechGPT-东北大学

TechGPT是一个强大的垂直领域大语言模型，具备处理专业领域文本的能力，并在信息抽取、智能问答和序列生成等方面表现出色。

Ai平台模型 2026年06月23日 0 点赞 0 评论 919 浏览

MiniCPM 4.0

MiniCPM 4.0是面壁智能推出的高效端侧大模型，包含8B和0.5B两种参数规模。其采用创新稀疏架构和三值量化技术，实现模型体积缩小90%并保持高性能。自研CPM.cu推理框架在极限场景下可提升220倍速度，支持多种开源框架部署，并适配主流芯片。具备高效双频换挡机制、多平台适配和多种版本选择，适用于智能辅导、医疗辅助、客服、游戏剧情生成等场景。

AI项目与工具 2025年06月11日 59 点赞 0 评论 918 浏览

通古大模型

通古大模型是由华南理工大学研发的古籍文言文处理AI工具，基于百川2-7B-Base进行增量预训练，结合24.1亿古籍语料和400万对话数据，采用RAT和RAG技术提升古籍处理效果。支持古文句读、文白翻译、诗词创作、古籍赏析、检索问答及辅助整理等功能，广泛应用于古籍数字化、教育、文化传承与学术研究等领域。

AI项目与工具 2025年06月12日 61 点赞 0 评论 916 浏览

MagicVideo

MagicVideo-V2是一款由字节跳动公司团队开发的AI视频生成模型和框架。该模型通过集成文本到图像模型、视频运动生成器、参考图像嵌入模块和帧插值模块，实现了从文本到高保真视频的转换。生成的视频不仅具有高分辨率，而且在视觉质量和运动流畅度方面表现出色，为用户提供卓越的观看体验。

AI项目与工具 2024年01月01日 56 点赞 0 评论 915 浏览

GenCast

GenCast是一款基于扩散模型的AI气象预测工具，可提供长达15天的高精度全球天气预报，尤其擅长预测极端天气事件。它采用0.25°纬度-经度分辨率生成高精度集合预报，并通过并行计算在8分钟内完成预测。GenCast已开源，支持学术界和行业用户进一步研究与应用。

AI项目与工具 2025年06月12日 25 点赞 0 评论 914 浏览

LTXV

LTXV-13B 是 Lightricks 推出的开源 AI 视频生成模型，拥有 130 亿参数，可在消费级显卡上高效运行，生成速度比同类产品快 30 倍。支持文本、图像转视频及多关键帧调节，具备多尺度渲染和高压缩率技术，适用于影视、广告、游戏、教育等多个领域，提升内容创作效率与质量。

AI项目与工具 2025年06月11日 18 点赞 0 评论 914 浏览

SmoothCache

SmoothCache是一种针对Diffusion Transformers（DiT）模型的推理加速技术，通过分析层输出的相似性实现自适应缓存和特征重用，有效减少计算成本并提升生成效率。该技术具有模型无关性、跨模态适用性和易于集成的特点，支持图像、视频、音频及3D模型生成，并在多种应用场景中展现出卓越的性能表现。

AI项目与工具 2025年06月12日 52 点赞 0 评论 912 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期