生成

AgiBot Digital World

AgiBot Digital World 是一款基于 NVIDIA Isaac-Sim 的高保真机器人仿真框架,支持多模态大模型驱动的任务与场景自动生成,具备真实感强的视觉与物理模拟能力。其提供多样化专家轨迹生成、域随机化与数据增强功能,助力机器人技能训练与算法优化,并开源了包含多种场景和技能的数据集,适用于工业自动化、服务机器人开发及人工智能研究等领域。

Wish AI

一个适合各种场合的个性化AI祝福语生成器,有了 Wish AI,可让您轻松地为您所爱的人生成独特的个性化愿望。

Cube 3D

Cube 3D 是 Roblox 推出的 AI 驱动 3D 生成工具,可通过文本描述快速创建高质量 3D 模型和场景。其核心功能包括文本到 3D 模型生成、网格优化、场景布局预测以及开源扩展能力。基于深度学习与原生 3D 数据训练,Cube 3D 提升了 3D 内容创作效率,适用于游戏开发、虚拟环境设计、教育及个性化创作等多种场景。

Quasar Alpha

Quasar Alpha是一款预发布AI模型,具备100万token的超大上下文窗口,可高效处理长文本和复杂文档。其在代码生成、指令遵循、多模态处理等方面表现出色,支持联网搜索以增强信息准确性。适用于代码开发、长文本分析、创意写作及智能问答等多种场景,目前可通过OpenRouter平台免费使用,存在一定请求限制。

Open NotebookLM

Open NotebookLM是一个开源工具,能够将PDF文档转换为播客形式的音频内容。它基于Llama 3.1 405B、MeloTTS和Bark等先进AI模型,生成自然流畅的对话式音频,并支持多语言及个性化音调设置。用户可通过简单易用的Gradio界面上传PDF文件并下载MP3格式的音频文件,适用于教育、科研、商业分析等多个领域。

Livensa

Livensa是一款创新的AI视频生成应用,主要功能包括文本到视频的转换、视频合成以及创意多样性。它允许用户通过简单的文字描述生成具有叙事性的视频内容,无需任何视频编辑技能。Livensa在西班牙、智利、德国等地的图形与设计应用中表现突出,其应用场景广泛,涵盖社交媒体内容创作、广告和营销、教育和培训、个人娱乐以及企业宣传等多个领域。

PageOn.ai

PageOn.ai是一个AI驱动的内容创作平台,帮助用户快速生成高质量的视觉内容。通过AI Agent理解用户需求,自动生成动态视觉元素,如互动图表、3D模型和媒体内容。用户只需描述外观和感觉,AI即可转化为视觉表达。平台具备深度搜索功能,支持拖放和斜杠命令组合内容,打造个性化视觉故事。主要功能包括AI生成幻灯片、智能演示、数据图表生成、实时语音交互和多人协作等,适用于教学演示、商务会议、项目汇报

PPT.cn

PPT.cn 是一个基于 AI 技术的智能 PPT 制作平台,用户输入主题或上传文档后,系统可快速生成逻辑清晰、视觉效果出色的 PPT 框架和内容。平台提供上千套涵盖多行业的精美模板,支持多种风格和格式导出,适用于职场汇报、提案演示、课程讲解、产品介绍和个人项目展示等多种场景。

Fairies

Fairies 是一款功能强大的 AI Agent 智能体,支持 1000 多种操作,包括文件管理、代码生成、邮件发送等。用户可通过自然语言与 Fairies 交互,实现多任务执行。它注重隐私保护,采用端到端加密,所有数据处理在本地完成。Fairies 可与 Slack、Gmail、Google Drive 等应用集成,提供免费版和 Pro 版,适合个人和团队提升生产力。

OmniSync

OmniSync是由中国人民大学、快手科技和清华大学联合开发的通用对口型框架,基于扩散变换器实现视频中人物口型与语音的精准同步。它采用无掩码训练范式,直接编辑视频帧,支持无限时长推理,保持自然面部动态和身份一致性。通过渐进噪声初始化和动态时空分类器自由引导(DS-CFG)机制,提升音频条件下的口型同步效果。OmniSync适用于影视配音、虚拟现实、AI内容生成等多个场景。