模型 - 智狐AI导航

Aero

Aero-1-Audio 是一款基于 Qwen-2.5-1.5B 的轻量级音频模型，拥有 1.5 亿参数，专注于长音频处理，支持连续 15 分钟音频输入并保持上下文连贯性。在语音识别、复杂音频分析及指令驱动任务中表现出色，具备高效的训练方法和多任务处理能力，适用于语音助手、实时转写、归档理解等场景。

AI项目与工具 2025年06月11日 43 点赞 0 评论 572 浏览

Spellbook

一款人工智能合同起草和审查助手，Spellbook将AI合同起草与审核集成在Microsoft Word中。它旨在帮助律师和法律专业人士高效起草和审核合同。

生活创意 2025年06月05日 83 点赞 0 评论 572 浏览

Vidgo AI

一个多合一AI图像、音乐和视频生成器，能将文字、图片等素材变成图像、音乐和视频等多媒体内容。提供AI 图像生成、视频生成和编辑三大核心功能。

Ai绘画生成 2025年06月05日 78 点赞 0 评论 572 浏览

PROMPT HUNT

Prompt Hunt 是一款基于AI技术的艺术创作平台，整合了Stable Diffusion、DALL-E和自有Chroma模型等先进工具，支持用户通过简单的操作生成高质量的艺术图像。平台提供丰富的样式库、主题模板以及参数调节功能，便于用户个性化定制作品。此外，Prompt Hunt还打造了一个活跃的社区，鼓励用户分享创意、交流经验，推动AI艺术的普及与发展。

AI项目与工具 2025年06月12日 69 点赞 0 评论 571 浏览

Loopy AI

字节跳动和浙江大学联合开发的音频驱动的AI视频生成模型，能够将静态图像转化为动态视频，实现音频与面部表情、头部动作的完美同步。

Ai视频生成 2025年06月05日 93 点赞 0 评论 571 浏览

Lyra

Lyra是一款由香港中文大学、SmartMore和香港科技大学联合研发的高效多模态大型语言模型（MLLM）。它通过整合视觉、语音和文本三种模态的信息，实现了强大的跨模态理解和推理能力。Lyra不仅擅长处理长语音数据，还支持流式文本-语音生成及跨模态信息交互，适用于智能助手、客户服务、教育培训、医疗健康等多个领域。

AI项目与工具 2025年06月12日 18 点赞 0 评论 571 浏览

Fugatto

Fugatto是一款由英伟达开发的音频合成与转换模型，利用增强型Transformer架构实现了从文本到音频的高效转化。它支持多种音频生成任务，如音乐创作、声音效果设计及语音合成，并可通过ComposableART技术实现对声音属性的精细调控。此外，Fugatto擅长生成动态变化的声音景观，广泛应用于音乐创作、声音设计及广告音频制作等领域。

AI项目与工具 2025年06月12日 44 点赞 0 评论 571 浏览

Docmatix

Docmatix 是一个专为文档视觉问答任务设计的大规模数据集，包含240万张图像和950万个问题-答案对，源自130万个PDF文档。数据集覆盖广泛，包括扫描图片、PDF文件和数字文档，且具有高质量的问答对。Docmatix 支持模型训练和微调，可用于训练视觉语言模型，提高其在理解和回答与文档内容相关问题方面的性能。应用场景包括自动化客户服务、智能文档分析、教育和学术研究以及业务流程自动化等。

AI项目与工具 2025年06月12日 87 点赞 0 评论 570 浏览

六合AI大模型

六合AI大模型，融合了众多主流语言模型，包括GPT3.5、GPT4.0、文心一言、讯飞星火、Midjourney、LLaMA等一站式AI智能平台。

Ai平台模型 2025年06月05日 31 点赞 0 评论 570 浏览

Photo AI

Photo AI 是一种革命性的人工智能工具，使用ai为您提供专业水准的照片拍摄，用于在各种设置中生成逼真的图像。

Ai图片处理 2025年06月05日 38 点赞 0 评论 569 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期