深度学习

DeepFaceLive

DeepFaceLive是一款基于人工智能的面部合成技术,它可以将一个人的面部表情和动作合成到另一个人的脸上,从而实现非常逼真的面部合成效果。

PicFinder.AI

PicFinder.AI是一个让您通过 AI 生成的图像的在线工具网站。它使用人工智能将您的描述转换为令人惊叹的艺术品。您可以将它用于娱乐、灵感或任何需要视觉内容的项目。

Fish Speech 1.5

Fish Speech 1.5是一款基于深度学习的文本转语音(TTS)工具,支持多语言文本输入,通过Transformer、VITS、VQVAE和GPT等技术实现高质量语音合成。它具备零样本和少样本语音合成能力,延迟时间短,无需依赖音素,泛化性强,且支持本地化部署。Fish Speech 1.5可应用于有声读物、辅助技术、语言学习及客户服务等多个领域。

FlashMLA

FlashMLA 是 DeepSeek 开发的开源 MLA 解码内核,针对 NVIDIA Hopper 架构 GPU 优化,提升可变长度序列处理效率。支持 BF16 精度、页式 KV 缓存及分块调度,内存带宽达 3000 GB/s,算力达 580 TFLOPS。适用于大语言模型推理和 NLP 任务,具备高性能与低延迟特性,支持快速部署与性能验证。

VideoRefer

VideoRefer是由浙江大学与阿里达摩院联合开发的视频对象感知与推理系统,基于增强型视频大型语言模型,实现对视频中对象的细粒度理解与分析。其核心包括大规模视频数据集、多功能空间-时间编码器和全面评估基准,支持对象识别、关系分析、推理预测及多模态交互等功能,适用于视频剪辑、教育、安防、机器人控制和电商等多个领域。

Prodia AI

ProdiaAI是一款基于人工智能技术的艺术画生成工具,可以通过简单的用户输入自动生成各种类型的绘画作品。

MagicMirror

MagicMirror是一款基于深度学习的开源AI工具,提供面部替换、发型调整和穿搭模拟功能。其特点包括易用性、硬件兼容性、隐私保护及轻量化设计,支持离线运行,适用于个人娱乐、创意设计及虚拟角色扮演等场景。

Marco

Marco是一款由阿里国际研发的大规模商用翻译大模型,支持15种主流语种,具备基于语境的精准翻译能力。其核心功能包括多语种翻译支持、跨境电商优化、多样化风格翻译以及高并发处理能力。Marco采用深度学习技术,结合多语言数据筛选和参数扩展方法,确保翻译质量和效率。它广泛应用于商品信息本地化、多语言客户服务、跨境电商平台及个人文档翻译等领域,助力全球化沟通。

DrawingSpinUp

DrawingSpinUp 是一种基于深度学习的3D动画生成技术,可将平面绘画转化为动态三维动画,同时保持原画风格。其核心技术包括轮廓线去除、几何细化、纹理合成及3D模型重建,适用于数字艺术、游戏开发、影视特效以及教育领域,大幅提升了创作效率和视觉表现力。

EasyAnimate

EasyAnimate是一款由阿里巴巴研发的AI视频生成工具,支持通过文本或图片生成视频。用户可以上传图片作为视频的起始和结束画面,增加视频编辑的灵活性。该工具最长可生成1分钟的视频,适用于内容创作、教育、营销等多个领域。用户可以通过简单的操作快速生成高质量的视频内容。