模型 - 智狐AI导航

InfiniteYou

InfiniteYou 是由字节跳动推出的基于扩散变换器的身份保持图像生成框架，通过 InfuseNet 注入身份特征，确保生成图像与输入图像的高度相似。结合多阶段训练策略，提升文本与图像对齐、图像质量和美学效果。支持插件化设计，兼容多种工具，适用于社交媒体、影视制作、广告营销等多个领域。

AI项目与工具 2025年06月12日 79 点赞 0 评论 554 浏览

WebDreamer

WebDreamer是一款基于大型语言模型的网络智能体，专注于通过模拟和预测网络交互结果来进行高效的任务规划与决策。它具备模拟函数、评分函数以及候选动作生成等功能，能够显著提升网络任务执行的效率与安全性，同时支持多种应用场景，包括网页自动化、智能搜索、客户服务等领域。

AI项目与工具 2025年06月12日 35 点赞 0 评论 554 浏览

言之画

言之画是由出门问问推出的AI图像内容创作平台，用户只需输入一句话描述，便可以快速生成高质量商用图片素材。

Ai绘画生成 2026年06月24日 0 点赞 0 评论 553 浏览

灰色AI | GreyAi

一键实现无缝AI换脸等操作，使用数字人虚拟人解放生产力。灰色AI基于多年人工智能经验，大幅简化ai换脸操作方式。

AI服务商 2025年06月05日 24 点赞 0 评论 553 浏览

Jamba

Jamba是由AI21 Labs开发的基于Mamba架构的生产级别大语言模型，结合了结构化状态空间模型（SSM）和传统Transformer架构，具备高吞吐量和低内存占用的特点。Jamba拥有256K的上下文窗口，适用于处理长文本序列，并且以开放权重的形式发布，遵循Apache 2.0开源许可。该模型主要用于研究领域，未来将推出更安全的版本。

AI项目与工具 2024年01月01日 29 点赞 0 评论 553 浏览

Reka Flash 3

Reka Flash 3 是一款由 Reka AI 开发的开源推理模型，拥有 21 亿参数，支持多模态输入（文本、图像、视频、音频），并可处理最长 32k 个令牌的上下文。它具备高效的推理能力和多语言支持，适用于日常对话、编码辅助、指令执行等多种场景。模型可在本地部署，支持 4 位量化以降低资源占用，适合广泛的应用需求。

AI项目与工具 2025年06月12日 70 点赞 0 评论 551 浏览

CatVTON

CatVTON是一款基于先进AI算法的虚拟试衣工具，能够将服装从一个人无缝转移到另一个人身上，同时保留服装细节的一致性。该工具采用轻量级网络架构，减少了计算资源的需求，无需复杂的预处理步骤，即可实现高效的服装试穿效果。CatVTON适用于电子商务、时尚设计、个性化推荐等多个领域，为用户提供了便捷且真实感强的虚拟试衣体验。

AI项目与工具 2025年06月12日 42 点赞 0 评论 551 浏览

VMix

VMix是一款提升文本到图像生成美学质量的工具，通过解耦文本内容与美学描述，并引入细粒度美学标签，增强图像在色彩、光线、构图等方面的视觉表现。其核心技术为交叉注意力混合控制模块，可在不改变原有模型结构的情况下注入美学条件，保持图文一致性。VMix兼容多种扩散模型及社区模块，支持多源输入、高质量视频处理、实时直播与远程协作，广泛应用于电视直播、网络直播、现场活动及虚拟演播室等场景。

AI项目与工具 2025年06月12日 97 点赞 0 评论 551 浏览

InvokeAI

InvokeAI 是一个开源项目，是 Stable Diffusion 模型的领先创意引擎，它为使用 Stable Diffusion 模型生成高质量图像提供了简化的过程。

Ai开源项目 2025年06月05日 52 点赞 0 评论 551 浏览

Video Diffusion Models

Video Diffusion Models项目展示了扩散模型在视频生成领域的潜力，通过创新的梯度条件方法和自回归扩展技术，生成了具有高度时间连贯性和质量的视频样本。

Ai绘画生成 2026年06月24日 0 点赞 0 评论 550 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期