生成 - 智狐AI导航

Mora

Mora是一个多智能体框架，专为视频生成任务设计，通过多个视觉智能体的协作实现高质量视频内容的生成。主要功能包括文本到视频生成、图像到视频生成、视频扩展与编辑、视频到视频编辑以及视频连接。尽管在处理大量物体运动场景时性能稍逊于Sora，Mora仍能在生成高分辨率视频方面表现出色。

AI项目与工具 2024年01月01日 75 点赞 0 评论 733 浏览

Open Code Reasoning

Open Code Reasoning（OCR）是英伟达推出的开源代码推理AI模型，基于Nemotron架构设计，支持多种编程语言。它具备代码生成、逻辑补全、多语言处理及高效推理能力，适用于代码优化、教育、测试等多个场景。OCR提供32B、14B和7B三种参数版本，满足不同计算需求，并与主流框架兼容，具有良好的扩展性。

AI项目与工具 2025年06月11日 10 点赞 0 评论 733 浏览

I2V3D

I2V3D是一款由香港城市大学与微软GenAI合作开发的图像到视频生成工具，支持将静态图像转换为高质量动态视频。其核心在于结合传统CG管线与生成式AI技术，采用两阶段生成流程实现精准的3D动画控制，支持复杂场景编辑和灵活的视频生成，适用于动画制作、视频创作及教育等多个领域。

AI项目与工具 2025年06月12日 50 点赞 0 评论 733 浏览

BedtimeStory AI

一款由AI驱动的睡前故事生成器，允许用户为儿童和家庭成员制作个性化的睡前故事。BedtimeStory AI使用AI即时生成故事，具有可自定义的角色、流派、艺术风格和道德。

教育学习 2025年06月05日 43 点赞 0 评论 734 浏览

OmniAudio

OmniAudio-2.6B是一款专为边缘设备设计的高性能音频语言模型，具备语音识别、转录、问答、对话生成及内容创作等核心功能。其技术优势在于多模态架构的高效集成、稀疏性利用以及三阶段训练流程，支持FP16和Q4_K_M量化版本，确保在资源受限的环境下仍能稳定运行。OmniAudio-2.6B可应用于智能助手、车载系统、会议记录、教育和医疗等多个领域，为用户提供便捷、高效的语音交互体验。

AI项目与工具 2025年06月12日 95 点赞 0 评论 735 浏览

AIPaperPass

AI PaperPass，AI论文写作，千字大纲免费，10分钟三万字极速体验。

AI写作对话 2025年06月05日 14 点赞 0 评论 735 浏览

豆包大模型1.5

豆包大模型1.5是字节跳动推出的高性能AI模型，采用大规模稀疏MoE架构，具备卓越的综合性能和多模态能力。支持文本、语音、图像等多种输入输出方式，适用于智能辅导、情感分析、文本与视频生成等场景。模型训练数据完全自主，性能优于GPT-4o和Claude 3.5 Sonnet等主流模型，且具备成本优势。

AI项目与工具 2025年06月12日 23 点赞 0 评论 735 浏览

Cartwheel 是一款基于文本到动画（Text-to-Motion）技术的 AI 3D 动画生成平台，用户只需输入文本描述即可快速生成高质量的 3D 角色动画。平台结合深度学习与传统动画技术，支持动作捕捉、自动化运动合成，并与主流 3D 软件无缝集成。其功能包括文本驱动动画、可编辑动画、动作库预设等，适用于游戏开发、影视制作、广告营销、VR/AR 及教育等多个场景。Cartwheel 提供不同

AI项目与工具 2025年06月11日 14 点赞 0 评论 736 浏览

PaperFake

PaperFake是一款利用先进大模型技术支持的论文写作平台，能够快速生成原创性高的论文初稿，支持多种格式输出并附带辅助材料，显著提升学术写作效率。其核心技术降低了AIGC痕迹，确保了论文的原创性和查重率达标，适用于各类学术与非学术写作场景。

AI项目与工具 2025年06月12日 92 点赞 0 评论 736 浏览

ACTalker

ACTalker 是一种基于视频扩散模型的端到端工具，可生成高质量、自然的说话人头部视频。支持多信号控制（如音频、表情），采用并行 Mamba 结构和门控机制，实现跨时间和空间的精准面部动作控制。实验表明其在音频同步性和视频质量上表现优异，适用于虚拟主播、远程会议、在线教育等多种场景。

AI项目与工具 2025年06月12日 99 点赞 0 评论 736 浏览

生成

首页

生成

列表

默认

浏览次数

发布日期