生成

Sekai

Sekai是一款结合AI技术的交互式内容平台,允许用户创建和自定义虚拟角色,并通过AI生成完整的故事情节。平台支持互动式叙事、沉浸式体验以及故事编辑与分享功能,适用于个人娱乐、社交互动、教育学习及品牌营销等多种场景。

Opus Clip

Opus Clip是一款由Opus公司开发的AI视频剪辑工具,它能够自动从长视频中提取亮点片段,并生成短视频。该工具利用AI技术分析视频内容,识别重要时刻。Opus Clip简化了视频编辑流程,使得即使是非专业用户也能够快速制作出适合社交媒体分享的短视频。此外,它还提供了手动选择和编辑片段的功能,以及基本的视频编辑工具。

美图AI Logo

美图AI Logo,用户只需输入一句想法,即可生成多个不同风格的Logo。

BlockDance

BlockDance是由复旦大学与字节跳动联合开发的扩散模型加速技术,通过识别结构相似的时空特征(STSS)减少冗余计算,提升推理效率达25%-50%。结合强化学习的BlockDance-Ada模块实现动态资源分配,平衡速度与质量。适用于图像、视频生成及实时应用,支持多种模型,兼顾高效与高质,适用于资源受限环境。

Canva Text To Image

Canva Text To Image允许你从简单的文本描述中生成图像,您可以使用它为您的设计创建独特和原始的图像。

Agent TARS

Agent TARS 是字节跳动推出的开源多模态 AI 代理工具,支持浏览器、命令行和文件系统的集成,实现复杂任务的自动化执行。其核心功能包括代理工作流、数据处理、代码生成与解释等。基于事件流和模型上下文协议(MCP),Agent TARS 能高效分解任务并实时反馈结果,适用于网页自动化、任务管理、数据分析和代码辅助等多种场景。目前支持 macOS 平台,处于技术预览阶段。

Ai Drawing Generator

一个免费的在线AI图像生成器,它可以将用户提供的文本描述或者简单涂鸦转化为详细的图像。

OmniTalker

OmniTalker 是一款由阿里巴巴开发的实时多模态交互技术,支持文本、图像、音频和视频的同步处理,并能生成自然流畅的语音响应。其核心技术包括 Thinker-Talker 架构和 TMRoPE 时间对齐技术,实现音视频精准同步与高效流式处理。适用于智能语音助手、内容创作、教育、客服及工业质检等场景,具有高实时性与稳定性。

Imagen 4

Imagen 4是谷歌推出的最新图像生成AI模型,支持高达2K分辨率的图像生成,具备出色的细节呈现能力,可清晰展示复杂织物纹理、水滴折射及动物毛发质感。其文本渲染能力显著提升,适合广告、漫画等设计场景。支持多种艺术风格,包括超现实、抽象、插图和摄影,满足多样化创作需求。同时,Imagen 4拥有快速生成模式和高效的特征蒸馏技术,提升了生成速度,并已集成到Gemini应用、Google Worksp

Vid.AI

一个爆款短视频生成AI工具并优化这些视频以提高在社交媒体上的传播率,提供提示生成视频、AI 脚本生成、AI 声音、短视频创作和内置的素材库。