风格

AI Portrait

Al头像生成器Al Portrait是一个免费的在线应用程序,利用Midjourney V5提供的支持,可以将自拍照转化为引人注目的AI肖像。

Lingo

Lingo是一款由西湖心辰开发的国内首个端到端语音大模型,具备实时交互、语音理解、多风格语音表达、情绪价值等功能。Lingo在人机对话的自然流畅度和情绪感知方面表现出色,适用于智能家居、客户服务、教育、医疗等多个领域。其核心技术包括端到端设计、深度学习算法和自然语言处理,旨在提供高质量的语音交互体验。

ARTalk

ARTalk是由东京大学与日本理化学研究所联合开发的语音驱动3D头部动画生成框架,基于自回归模型实现实时、高同步性的唇部动作和自然表情生成。它通过多尺度运动码本和滑动时间窗口技术提升动画质量,并引入风格编码器实现个性化风格适配。该工具在唇部同步、表情自然性和风格一致性方面优于现有技术,适用于虚拟现实、游戏开发、动画制作及人机交互等领域。

酷家乐AI

支持免费使用,没有专业设计软件能力,也能快速制作AI

PopShort.AI

PopShort.AI 是一款利用人工智能技术打造的短剧创作平台,专注于提供沉浸式互动体验和创新剧情。平台每周更新短剧内容,用户可与虚拟角色对话,体验独家剧情,并通过访问庞大的AI故事库参与创作。PopShort.AI 支持多种视频风格,包括短剧、互动故事、定制视频等,满足多样化的创作需求。

Kokoro

Kokoro-TTS是一款由hexgrad开发的轻量级文本转语音工具,基于StyleTTS 2与ISTFTNet架构,支持多种语音风格和自然语调,具备实时处理能力。支持美式与英式英语,提供10种语音包,适用于教育、游戏、客服等多种场景。支持本地部署与API集成,确保数据安全与高效运行。

MusicFX

Google MusicFX是一款基于人工智能技术的音乐生成工具,支持用户通过文本描述来生成音乐,涵盖多种风格。它具备文本到音乐创作、自定义音乐参数、数字水印技术和版权安全过滤等功能,旨在降低音乐创作门槛,提升创作效率和质量。自发布以来,已有大量用户通过该工具创作出原创音乐作品。

PersonaTalk

PersonaTalk是一种基于注意力机制的两阶段框架,用于实现高保真度和个性化的视觉配音。其核心技术包括风格感知音频编码、唇形同步几何生成、双注意力面部渲染等,能够确保视频中人物的嘴型动作与输入音频精准匹配,同时保留说话者的独特风格和面部特征。相比现有技术,PersonaTalk在视觉质量和唇形同步方面表现更优,适用于电影、游戏、虚拟助手等多个领域。

抖音星绘

一款由抖音推出的AI相机类产品,支持AI分身、AI修图和文生图功能。用户可以通过上传图片并输入提示词来轻松切换照片风格,如像素风、赛博朋克、日式漫画等。

OpenDoodles

一个提供免费开源的手绘风格人物矢量插画素材网站,用户自由地使用、编辑、混合和分享插画,无需担心版权问题,支持SVG和PNG两种格式下载。