R - 智狐AI导航

混元图生视频

混元图生视频是腾讯混元推出的开源图生视频模型，支持用户上传图片并输入描述生成5秒短视频，具备对口型、动作驱动和背景音效自动生成等功能。模型适用于多种风格与场景，参数量达130亿，已在腾讯云上线并开源，支持本地部署与定制开发，适用于创意视频、特效制作及动画开发等多个领域。

AI项目与工具 2025年06月12日 43 点赞 0 评论 748 浏览

Whisper语音识别模型

Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练，也是一个多任务模型，可以执行多语言语音识别以及语音翻译和语言识别。

Ai开源项目 2025年06月05日 90 点赞 0 评论 748 浏览

TextHarmony

TextHarmony是一款由华东师范大学与字节跳动联合开发的多模态生成模型，擅长视觉与文本信息的生成与理解。该模型基于Slide-LoRA技术，支持视觉文本生成、编辑、理解及感知等功能，广泛应用于文档分析、场景文本识别、视觉问题回答、图像编辑与增强以及信息检索等领域。通过高质量数据集的构建与多模态预训练，TextHarmony在视觉与语言生成任务中表现出色。

AI项目与工具 2025年06月12日 47 点赞 0 评论 749 浏览

OmniCam

OmniCam 是一种基于多模态输入的高级视频生成框架，结合大型语言模型与视频扩散模型，实现高质量、时空一致的视频内容生成。支持文本、视频或图像作为输入，精确控制摄像机运动轨迹，具备帧级操作、复合运动、速度调节等功能。采用三阶段训练策略提升生成效果，并引入 OmniTr 数据集增强模型性能。适用于影视、广告、教育及安防等多个领域，提高视频创作效率与质量。

AI项目与工具 2025年06月12日 18 点赞 0 评论 749 浏览

VideoDrafter

一个高质量视频生成的开放式扩散模型，相比之前的生成视频模型，VideoDrafter最大的特点是能在主体不变的基础上，一次性生成多个场景的视频。

Ai开源项目 2025年06月05日 89 点赞 0 评论 749 浏览

PDF.ai

PDF.ai是一个创新平台，使用 AI 与任何文档聊天并提出问题、获取摘要、查找信息等。

Ai办公效率 2025年06月05日 46 点赞 0 评论 749 浏览

Rodin

Rodin是一款由影眸科技开发的AI驱动3D生成工具，专注于快速生成高质量的3D模型。它支持文本提示和图片输入生成3D资产，具备多视图融合、模型调整及材质生成等功能，适用于游戏开发、角色建模、虚拟现实等多种场景，同时兼顾生成效率与细节表现，但需进一步优化精度与数据集适应性。

AI项目与工具 2025年06月12日 56 点赞 0 评论 749 浏览

Twitter Personality

Twitter Personality是一款AI驱动的分析工具，能够通过分析Twitter用户的公开言论生成个性化、幽默且尖锐的点评。用户只需输入Twitter用户名，即可获得针对其推文历史的评价。该工具主要应用于个人娱乐、社交互动、名人点评、内容创作以及市场调研等多个领域。

AI项目与工具 2025年06月12日 99 点赞 0 评论 750 浏览

TME Studio腾讯音乐

分析TME全曲库歌词以及散文、诗歌等多种语料素材，依据智能推荐算法帮你找到合适的押韵词语，打开灵感空间

创作工具 2026年06月25日 0 点赞 0 评论 750 浏览

Omni Reference

Omni Reference 是 Midjourney V7 提供的一项图像生成辅助功能，允许用户将特定人物、物体或场景嵌入生成图像中。通过 `--oref` 和 `--ow` 参数，用户可灵活控制参考图像的权重与风格融合程度，提升创作精度与多样性。支持 Web 和 Discord 两种平台操作，适用于角色嵌入、产品展示、场景构建等多种应用场景。

AI项目与工具 2025年06月11日 48 点赞 0 评论 751 浏览

R

首页

R

列表

默认

浏览次数

发布日期