模型 - 智狐AI导航

UniToken

UniToken 是一种面向多模态理解与生成任务的自回归模型，结合了离散与连续视觉表示，实现对图像语义与细节的全面捕捉。它支持图文理解、图像生成、多模态对话、复杂指令执行等多种任务，并具备细粒度视觉处理能力。适用于内容创作、智能客服、教育、医疗及自动驾驶等多个领域。

AI项目与工具 2025年06月11日 67 点赞 0 评论 487 浏览

TANGOFLUX

TANGOFLUX是一款高效文本到音频生成模型，具备约5.15亿参数量，能够在3.7秒内生成30秒高质量音频。它采用CLAP-Ranked Preference Optimization框架优化音频输出，支持多种应用场景，包括多媒体内容创作、音频制作、播客、教育及虚拟助手开发。其开源特性推动了相关领域的技术进步。

AI项目与工具 2025年06月12日 73 点赞 0 评论 487 浏览

Natural Language Playlist

Natural Language Playlist 探索语言和音乐之间丰富而复杂的关系，并使用 Transformer 语言模型构建播放列表。由于没有更好的术语，音乐推荐是一种“闭门造车”的东西。

创作工具 2026年06月23日 0 点赞 0 评论 488 浏览

Sweep AI

Sweep AI 是一款利用人工智能技术优化软件开发流程的工具，集成了大型语言模型与代码分析引擎，主要功能涵盖代码搜索、重构、测试生成以及文档创建等。它旨在帮助开发者提高工作效率，简化代码管理，并支持灵活定制化设置以满足不同团队的需求。

AI项目与工具 2025年06月12日 96 点赞 0 评论 488 浏览

AutoSlide Ai

一个人工智能驱动的PPT演示文稿生成器，用于生成具有视觉吸引力和有效的演示文稿，使用机器学习来分析内容并节省您的时间和精力。

PPT资源 2025年06月05日 91 点赞 0 评论 488 浏览

Fabrie AI

Fabrie AI，设计师的在线设计协作平台，基于Fabrie白板构建的AI驱动的设计工具。它可以帮助工业设计师、时装设计师和室内设计师在几秒钟内快速生成带有草图的逼真渲染。

Ai绘画生成 2025年06月05日 11 点赞 0 评论 489 浏览

SkyReels Ai

一个由昆仑万维推出的AI短剧平台，集成了视频大模型与3D大模型，能够通过AI一键生成完整剧本、分镜、人物对白与背景音乐，支持角色形象、音色与分镜的自定义调整。

Ai视频生成 2025年06月05日 36 点赞 0 评论 489 浏览

文心大模型歌词生成器

文心大模型「歌词生成」器，是百度旗下的AI智能处理“文心大模型”提供的服务出品的 AI 自动生成歌词网站，

Ai语音工具 2025年06月05日 53 点赞 0 评论 490 浏览

STIV

STIV是一款由苹果公司开发的视频生成大模型，具有8.7亿参数，擅长文本到视频（T2V）及文本图像到视频（TI2V）任务。它通过联合图像-文本分类器自由引导（JIT-CFG）技术提升生成质量，并结合时空注意力机制、旋转位置编码（RoPE）及流匹配训练目标优化性能。STIV支持多种应用场景，包括视频预测、帧插值、长视频生成等，适用于娱乐、教育、广告及自动驾驶等多个领域。

AI项目与工具 2025年06月12日 57 点赞 0 评论 490 浏览

DeepEyes

DeepEyes是由小红书团队和西安交通大学联合开发的多模态深度思考模型，基于端到端强化学习实现“用图思考”能力，无需依赖监督微调。它在推理过程中动态调用图像工具，增强对细节的感知与理解，在视觉推理基准测试V* Bench上准确率高达90.1%。具备图像定位、幻觉缓解、多模态推理和动态工具调用等功能，适用于教育、医疗、交通、安防和工业等多个领域。

AI项目与工具 2025年06月11日 21 点赞 0 评论 490 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期