AI

Voice Design

Voice Design是一款由ElevenLabs研发的AI语音生成工具,通过描述声音特征或虚构角色来快速生成独特的人类化语音。它支持32种语言,适用于视频旁白、广告配音、播客制作、游戏开发及虚拟助手等多个场景,为内容创作者提供高效且多样化的语音解决方案。

135小红书排版

135小红书排版是一款基于AI技术的内容创作与排版工具,主要功能包括AI绘图、AI创作、一键生成、批量生成探店和种草笔记等。它支持用户通过简单指令生成高质量笔记,并可添加emoji增强互动性。该工具适用于个人博主、品牌商家、营销团队等多种场景,旨在提升内容创作效率和互动性。

HandTalk

一款利用人工智能技术,自动将文本和音频翻译成手语的应用程序。它支持美国手语(ASL)和巴西手语(Libras),为全球约4.66亿聋人和重听人士提供了一个融入社会的新途径。

CodePal AI

CodePal是一个提供一系列编码助手和工具,帮助开发人员的平台。它适用于学生、初学者、经验丰富的开发人员以及希望改进开发流程的公司。

MSQA

MSQA是一个包含251,000个问答对的大规模多模态情境推理数据集,支持文本、图像和点云等多种数据形式,旨在提升具身AI在三维场景中的理解与推理能力。通过设计MSQA和MSNN两个基准测试任务,该工具不仅能够评估模型性能,还能促进具身AI和3D场景理解领域的研究进展。同时,它为开发更强大的情境推理模型提供了丰富的预训练资源。

Video Alchemist

Video Alchemist是一款由Snap公司研发的视频生成模型,支持多主体和开放集合的个性化视频生成。它基于Diffusion Transformer模块,通过文本提示和参考图像生成视频内容,无需测试优化。模型引入自动数据构建和图像增强技术,提升主体识别能力。同时,研究团队提出MSRVTT-Personalization基准,用于评估视频个性化效果。该工具适用于短视频创作、动画制作、教育、剧

视觉族

视觉族是一个免费好用的在线AI绘画工具,使用人工智能技术快速生成逼真的图片。

Vidu 1.5

Vidu 1.5是一款基于多模态视频大模型的AI生成工具,支持参考生视频、图生视频和文生视频生成,通过精准的语义理解能力,在30秒内完成高质量视频创作,适用于影视、动漫、广告等多行业场景,助力创作者高效产出多样化内容。

GENERator

GENERator是阿里云飞天实验室开发的生成式基因组基础模型,基于Transformer解码器架构,具备98k碱基对的上下文长度和120亿参数。它能生成具有生物学意义的DNA序列,应用于蛋白质家族设计、启动子优化、基因组分析及合成生物学等领域。模型通过大规模数据预训练,并经过生物学验证,展现出强大的序列生成与优化能力。

HeroUI

一个基于Tailwind CSS的美观、快速且现代的React UI库,支持主题定制、明暗模式自动切换,基于 React Aria 实现高可访问性,提供类型安全的开发体验和多包结构。