AI工具

Phygital+

Phygital+ 是一个基于AI提供了多种功能和工具整合的平台,允许用户使用AI并创建、转换和增强图像、视频和 3D 模型。

讯飞译制

讯飞译制是一款基于语音识别与机器翻译技术的智能字幕制作与翻译平台,支持多语言转换与自动字幕生成,提供高精度识别、智能时间码匹配、多格式导出及配音功能,适用于短视频出海、教学视频、广告宣传等多种场景,提升内容传播效率与国际化水平。

Refly

Refly是一款基于“自由画布”理念的AI原生创作平台,支持多线程对话、知识库管理、上下文记忆和智能写作等功能。用户可通过其便捷的工具实现创意转化、内容优化与团队协作,适用于学术研究、内容创作及商业文档撰写等多种场景。平台强调高效、专业与个性化,助力用户提升创作效率与内容质量。

MimicTalk

MimicTalk是一款利用NeRF技术快速生成个性化3D说话人脸模型的工具,其核心功能包括15分钟内完成新身份训练、高质量视频生成、增强的表现力以及上下文学习能力。该工具通过混合适应流程、上下文风格化音频到运动模型等技术,实现了高效的数据样本利用和训练效率提升,适用于虚拟主播、远程协作、VR/AR等领域。

TANGO

TANGO是一个开源框架,利用分层音频运动嵌入和扩散插值网络,生成与目标语音同步的全身手势视频。其主要功能包括高保真视频制作、跨模态对齐、过渡帧生成及外观一致性保持,适用于新闻播报、虚拟YouTuber、在线教育等多个领域。该工具通过先进的技术解决了动作与语音匹配问题,并有效提升了视频内容制作效率。

Stable Virtual Camera

Stable Virtual Camera 是 Stability AI 推出的 AI 工具,能够将 2D 图像转换为具有真实深度和透视感的 3D 视频。用户可通过自定义相机轨迹生成多种宽高比的视频,支持最长 1000 帧的高质量输出。其核心技术包括生成式 AI、神经渲染和多视图一致性优化,确保视频在不同视角间过渡自然且保持 3D 一致性。适用于广告、内容创作及教育等多个领域。

Magic Copy

Magic Copy是一款基于开源技术的AI图像处理工具,支持Chrome浏览器扩展。它利用Meta的Segment Anything Model技术,实现图像中前景对象的自动识别与提取。用户可将提取的内容直接复制到剪贴板或下载保存,广泛应用于设计、教育、电商及办公等领域,提升工作效率。

Leffa

Leffa是一种基于注意力机制的可控人物图像生成框架,通过流场学习精确控制人物的外观和姿势。其核心技术包括正则化损失函数、空间一致性及模型无关性,能够在保持细节的同时提升图像质量。Leffa广泛应用于虚拟试穿、增强现实、游戏开发及影视后期制作等领域,展现出卓越的性能与灵活性。

Qwen3 Embedding

Qwen3 Embedding 是基于 Qwen3 基础模型开发的文本表征、检索与排序专用模型,支持 119 种语言,参数规模从 0.6B 到 8B。它能够精准捕捉文本语义,支持多语言处理、高效检索和语义相关性排序,并可通过个性化优化提升用户体验。在 MTEB 等任务中表现优异,适用于智能搜索、推荐系统、问答系统和教育领域等场景。

Evoto

Evoto是一款以提升照片编辑效率为核心的AI工具,拥有精准的人脸识别、自然的皮肤美化、高级色彩调节、背景替换及批量处理等功能。它通过提供专业设计师设计的独特预设,帮助用户快速达到专业级图像处理效果,适用于人像摄影、婚礼摄影、时尚摄影、产品摄影及社交媒体内容创作等多个领域。