AI

Beepbooply

Beepbooply是一款人工智能驱动的文本转语音工具,允许用户快速轻松地生成具有逼真声音的音频内容。超过80种语言、120种口音和900种声音,用户可以自定义他们的音频,并生成几个小...

DeepSeek-安装下载

DeepSeeK APP是深度求索公司推出的A!智能助手,免费提供与全球领先A1模型的互动交流

天翼AI开放平台

天翼AI开放平台是中国电信推出的AI技术服务平台,基于自研星辰大模型,提供问答、表格分析、文生图、多方言识别等功能,同时为企业提供大模型开发、AI中台等工具,覆盖政务、金融、工业等领域,支持多场景数字化创新。

MimicTalk

MimicTalk是一款利用NeRF技术快速生成个性化3D说话人脸模型的工具,其核心功能包括15分钟内完成新身份训练、高质量视频生成、增强的表现力以及上下文学习能力。该工具通过混合适应流程、上下文风格化音频到运动模型等技术,实现了高效的数据样本利用和训练效率提升,适用于虚拟主播、远程协作、VR/AR等领域。

TANGO

TANGO是一个开源框架,利用分层音频运动嵌入和扩散插值网络,生成与目标语音同步的全身手势视频。其主要功能包括高保真视频制作、跨模态对齐、过渡帧生成及外观一致性保持,适用于新闻播报、虚拟YouTuber、在线教育等多个领域。该工具通过先进的技术解决了动作与语音匹配问题,并有效提升了视频内容制作效率。

Wannafake

一种Ai驱动的工具,允许用户通过一张照片轻松交换视频中的人脸。通过简单直观的界面,用户可以快速上传自己的人脸照片和视频,然后使用该工具强大的算法无缝换脸。

VITRON

VITRON是一款由多家顶尖机构联合研发的像素级视觉大型语言模型,具备强大的图像与视频处理能力,涵盖理解、生成、分割及编辑等功能。它融合了编码器-LLM-解码器架构、视觉-语言编码和视觉专家系统,支持多种视觉任务,广泛应用于图像编辑、视频创作、教育辅助、电商营销和新闻报道等领域。

Qwen3 Embedding

Qwen3 Embedding 是基于 Qwen3 基础模型开发的文本表征、检索与排序专用模型,支持 119 种语言,参数规模从 0.6B 到 8B。它能够精准捕捉文本语义,支持多语言处理、高效检索和语义相关性排序,并可通过个性化优化提升用户体验。在 MTEB 等任务中表现优异,适用于智能搜索、推荐系统、问答系统和教育领域等场景。

Samwell.ai

Samwell.ai是一款利用人工智能技术打造的写作平台,主要服务于学术界和专业人士。它提供了强大的抄袭检测功能、多种引用格式支持以及全球学术资源访问权限,同时具备扩展段落和应用批判性思维等高级编辑能力,以提升用户的写作质量和效率。无论是撰写学术论文、课程作业还是商业计划,Samwell.ai都能提供全面的支持。

讯飞智作

一款集AI配音、虚拟数字人视频生成、PPT生成视频、数字人定制等多功能的AI音视频生产平台。已广泛应用于媒体、教育、短视频等领域。