AI模型 - 智狐AI导航

视界一粟YiSu

北京极佳视界科技有限公司联合清华大学自动化系共同发布的Sora级视频生成大模型。

Ai视频生成 2025年06月05日 64 点赞 0 评论 486 浏览

Botgroup.chat

Botgroup.chat 是一款支持多人 AI 交互的聊天平台，用户可自定义 AI 角色并进行群聊互动。平台兼容多种 AI 模型，支持实时对话、Markdown 排版及数学公式显示，具备上下文记忆和角色管理功能。项目基于 React 和 Cloudflare Pages 构建，部署便捷，代码开源，适用于语言学习、创意讨论等多种场景。

AI项目与工具 2025年06月12日 89 点赞 0 评论 484 浏览

Loopy AI

字节跳动和浙江大学联合开发的音频驱动的AI视频生成模型，能够将静态图像转化为动态视频，实现音频与面部表情、头部动作的完美同步。

Ai视频生成 2025年06月05日 93 点赞 0 评论 484 浏览

Modeli.ai

一个旨在使用AI模型为时尚产品优化和替代传统的拍照流程的AI模特生成工具。

电商运营 2025年06月05日 57 点赞 0 评论 480 浏览

LitServe

LitServe是一款基于FastAPI的高性能AI模型部署引擎，专为企业级AI服务设计。它支持批处理、流式处理和GPU自动扩展，简化了模型部署流程。LitServe易于安装和使用，提供灵活的API定义和强大的服务器控制能力。它兼容多种机器学习框架，具备自动扩展和身份验证等高级特性，适用于机器学习模型部署、大语言模型服务、视觉模型推理、音频和语音处理及自然语言处理等多个领域。

AI项目与工具 2025年06月12日 64 点赞 0 评论 478 浏览

谷歌DeepMind推出V2A技术，可为无声视频添加逼真音效

DeepMind推出的V2A（Video-to-Audio）模型能够将视频内容与文本提示相结合，生成包含对话、音效和音乐的详细音频轨道。它不仅能够与DeepMind自身的视频生成模型Veo协同工作，还能与其他视频生成模型，如Sora、可灵或Gen 3等，进行集成，从而为视频添加戏剧性的音乐、逼真的音效或与视频中角色和情绪相匹配的对话。V2A的强大之处在于其能够为每个视频输入生成无限数量的音轨。该模

AI项目与工具 2025年06月12日 21 点赞 0 评论 474 浏览

TimesFM 2.0

TimesFM 2.0是谷歌推出的开源时间序列预测模型，采用仅解码器架构，支持处理长达2048个时间点的单变量序列，具备灵活的预测频率选择与分位头预测功能。模型通过大规模自监督预训练，覆盖多个领域，具有优秀的泛化能力。适用于零售、金融、交通、环境监测等多个场景，为数据分析与决策提供支持。

AI项目与工具 2025年06月12日 69 点赞 0 评论 473 浏览

Dream

Dream-7B是由香港大学与华为诺亚方舟实验室联合开发的开源扩散模型，支持文本、数学和代码生成，具备双向上下文建模能力和灵活的生成控制。其在通用任务、数学推理和编程方面表现优异，适用于文本创作、数学求解、编程辅助及复杂任务规划等多种场景，提供高效且高质量的生成服务。

AI项目与工具 2025年06月12日 26 点赞 0 评论 471 浏览

Open

Open-Sora是一个开源视频生成模型，基于DiT架构，通过三个阶段的训练（大规模图像预训练、大规模视频预训练和高质量视频数据微调），生成与文本描述相符的视频内容。该模型包括预训练的VAE、文本编码器和STDiT（Spatial-Temporal Diffusion Transformer）核心组件，利用空间-时间注意力机制和交叉注意力模块实现视频生成。项目旨在提供全面的视频生成模型训练过程，供

AI项目与工具 2024年01月01日 97 点赞 0 评论 471 浏览

Reka Flash 3

Reka Flash 3 是一款由 Reka AI 开发的开源推理模型，拥有 21 亿参数，支持多模态输入（文本、图像、视频、音频），并可处理最长 32k 个令牌的上下文。它具备高效的推理能力和多语言支持，适用于日常对话、编码辅助、指令执行等多种场景。模型可在本地部署，支持 4 位量化以降低资源占用，适合广泛的应用需求。

AI项目与工具 2025年06月12日 70 点赞 0 评论 470 浏览

AI模型

首页

AI模型

列表

默认

浏览次数

发布日期