模型 - 智狐AI导航

SpeechGPT 2.0

SpeechGPT 2.0-preview 是复旦大学 OpenMOSS 团队开发的拟人化实时交互系统，基于大量中文语音数据训练，支持低延迟、高自然度的语音与文本交互。具备情感控制、实时打断、多风格语音生成等功能，适用于智能助手、内容创作及无障碍通信等场景，技术上融合了语音-文本联合建模与多阶段训练策略，提升语音表现力与智能化水平。

AI项目与工具 2025年06月12日 23 点赞 0 评论 630 浏览

赤兔Chitu

Chitu（赤兔）是清华大学与清程极智联合开发的高性能大模型推理引擎，支持多种GPU及国产芯片，打破对特定硬件的依赖。其具备全场景部署能力，支持低延迟、高吞吐、小显存优化，并在性能上优于部分国外框架。适用于金融风控、智能客服、医疗诊断、交通优化和科研等领域，提供高效、稳定的推理解决方案。

AI项目与工具 2025年06月12日 25 点赞 0 评论 629 浏览

Video Alchemist是一款由Snap公司研发的视频生成模型，支持多主体和开放集合的个性化视频生成。它基于Diffusion Transformer模块，通过文本提示和参考图像生成视频内容，无需测试优化。模型引入自动数据构建和图像增强技术，提升主体识别能力。同时，研究团队提出MSRVTT-Personalization基准，用于评估视频个性化效果。该工具适用于短视频创作、动画制作、教育、剧

AI项目与工具 2025年06月12日 26 点赞 0 评论 629 浏览

Offline Chat

Offline Chat是一款专为iOS设备设计的离线AI聊天应用程序。它支持完全在本地运行，无需网络连接，确保用户数据的安全和隐私。用户可以加载和查询私人文档，并且可以选择不同性能的AI模型。这款应用适用于商务、学习和旅行等多种场景，是注重隐私保护和便携性的理想助手。

AI项目与工具 2025年06月12日 16 点赞 0 评论 629 浏览

MatterGen

MatterGen是由微软开发的生成式AI模型，专注于无机材料的设计与生成。它通过扩散过程逐步优化原子结构，生成稳定、多样化且符合特定性能要求的材料。支持化学组成、磁性、电子和机械性能等多维度约束，适用于逆向材料设计，提升新材料研发效率。已应用于能源、催化、电子等领域，推动材料科学进步。

AI项目与工具 2025年06月12日 16 点赞 0 评论 629 浏览

EXAONE 3.5

EXAONE 3.5是一款由LG AI研究院开发的开源AI模型，包含多种参数规模版本，专长于长文本处理和复杂场景下的推理任务。其核心技术包括检索增强生成与多步推理，可显著减少错误信息并提升准确性。此外，EXAONE 3.5还具备双语支持及强大的上下文理解能力，适用于聊天机器人、语言翻译、内容创作等多个领域。

AI项目与工具 2025年06月12日 14 点赞 0 评论 629 浏览

EvolveDirector

EvolveDirector是一个由阿里巴巴与南洋理工大学合作开发的文本到图像生成框架，通过与高级模型API交互获取数据对，结合预训练的视觉语言模型（VLMs）动态优化训练集，大幅降低数据量和训练成本。该框架支持多模型学习、动态数据集管理及在线训练，显著提升了生成图像的质量和多样性，广泛应用于内容创作、媒体娱乐、广告营销、教育科研等多个领域。

AI项目与工具 2025年06月12日 17 点赞 0 评论 629 浏览

百度灵医Bot

百度灵医Bot作为百度推出的医疗大模型应用，通过其强大的语言处理能力和专业医疗知识库，为用户提供了全面、安全、智能的医疗健康服务。

创作工具 2026年06月24日 0 点赞 0 评论 628 浏览

360智绘

360集团推出的AI绘画创作大模型，文生图、参考图生图，支持 CG、写实、动漫、剪纸等多种风格。

Ai绘画生成 2025年06月05日 59 点赞 0 评论 628 浏览

olmOCR

olmOCR 是一款开源 PDF 文档处理工具，结合文档锚定技术和 Qwen2-VL-7B-Instruct 模型，可高效提取结构化文本并保留原始布局。支持多种文档类型，具备大规模批量处理能力和低成本优势，适用于学术研究、法律文件处理、企业文档管理及数字图书馆建设等多个场景。其开源特性与可扩展性也增强了用户的使用灵活性。

AI项目与工具 2025年06月12日 47 点赞 0 评论 627 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期