人工智能

JoyGen

JoyGen是由京东科技与香港大学联合开发的音频驱动型3D说话人脸视频生成框架,能够实现唇部动作与音频信号的精准同步,并提供高质量的视觉效果。该工具采用单步UNet架构进行高效视频编辑,基于130小时中文视频数据集训练,在唇音同步和视觉质量方面表现优异。适用于虚拟主播、动画制作、在线教育及多语言视频生成等多个领域,为视频内容创作提供了创新解决方案。

BizGen

BizGen是由清华大学与微软研究院联合开发的AI信息图生成工具,能将长篇文章自动转化为专业级的信息图和幻灯片。其核心技术包括高质量数据集Infographics-650K和“布局引导的交叉注意力机制”,可精准控制图像中各区域的文本与视觉元素。支持多语言和多种风格,适用于商业汇报、产品展示、学术研究等多个场景,具备高准确性与排版质量。

Rizzle

Rizzle 是一款人工智能视频创作平台,能够将文本、播客和音频内容快速转化为具有专业外观的视频。平台通过与 Getty Images 的合作,提供了超过 5 亿张图片和视频的媒体资源库,使用户能够自定义文本样式、画面比例、背景音乐等元素。其主要功能包括缩略图制作、文本高亮剪辑、地图生成、无面孔视频等,简化了视频制作流程,适用于社交媒体营销、内容创作、教育、产品演示、新闻报道及企业内部沟通等多种应

Wonderslide PPT生成

Wonderslide利用人工智能的能力,生成一个完整的 PPT,但区别于其他同类的 AI PPT 工具,使用时需要先上传一份本地 PPT 草稿。Wonderslide 更像是一款运用 AI 能力美化 PPT 的工具,比如它可以批量更换 PPT 的主题和配套的图片风格。

Monaland.ai

Monaland.ai提供了一个独特的平台,让用户能够与超现实的AI角色建立真正的情感联系,并通过个性化的角色创建和互动故事讲述,享受沉浸式的体验。

Paper Digest

Paper Digest是一个专注于学术研究的人工智能平台,具备文献综述生成、研究助手、AI阅读器和AI写作者等功能。它能够帮助用户高效获取和整理学术资源,提供个性化定制的信息服务,并支持多领域的研究需求。通过实时更新的论文数据和灵活的筛选机制,Paper Digest为学术界、教育界、产业研发及政策制定等领域提供了强大的支持。 ---

ProductShots.AI

一种人工智能驱动的工具,旨在简化和优化电商产品摄影。ProductShots允许用户毫不费力地生成引人注目的高质量内容,而无需工作室或拍摄照片。

MejorarImagen

一款利用人工智能技术提升图像质量的工具,用户只需上传图片,选择提升等级,MejorarImagen就会自动处理并将您的图片放大至10倍或12K,显著提高清晰度。

EMO2

EMO2是一种由阿里巴巴智能计算研究院开发的音频驱动头像视频生成技术,通过音频输入和静态人像照片生成高质量、富有表现力的动态视频。其核心技术包括音频与手部动作的协同建模、扩散模型生成视频帧,以及高精度音频同步。该工具支持多样化动作生成,适用于虚拟现实、动画制作和跨语言内容创作等场景,具备自然流畅的视觉效果和丰富的应用场景。

Pippo

Pippo是由Meta Reality Labs研发的图像到视频生成模型,可基于单张照片生成多视角高清人像视频。采用多视角扩散变换器架构,结合ControlMLP模块与注意力偏差技术,实现更丰富的视角生成和更高的3D一致性。支持高分辨率输出及细节自动补全,适用于虚拟现实、影视制作、游戏开发等多个领域。技术方案涵盖多阶段训练流程,确保生成质量与稳定性。