深度学习 - 智狐AI导航

UniToken

UniToken 是一种面向多模态理解与生成任务的自回归模型，结合了离散与连续视觉表示，实现对图像语义与细节的全面捕捉。它支持图文理解、图像生成、多模态对话、复杂指令执行等多种任务，并具备细粒度视觉处理能力。适用于内容创作、智能客服、教育、医疗及自动驾驶等多个领域。

AI项目与工具 2025年06月11日 67 点赞 0 评论 487 浏览

团子AI

一款集伴奏人声提取、乐器分离及无损音频升降调等功能于一体的在线人工智能音乐处理工具箱。

Ai语音工具 2025年06月05日 39 点赞 0 评论 487 浏览

JoyGen

JoyGen是由京东科技与香港大学联合开发的音频驱动型3D说话人脸视频生成框架，能够实现唇部动作与音频信号的精准同步，并提供高质量的视觉效果。该工具采用单步UNet架构进行高效视频编辑，基于130小时中文视频数据集训练，在唇音同步和视觉质量方面表现优异。适用于虚拟主播、动画制作、在线教育及多语言视频生成等多个领域，为视频内容创作提供了创新解决方案。

AI项目与工具 2025年06月12日 78 点赞 0 评论 491 浏览

Yodayo AI | 文本生成动漫图片

Yodayo是一个AI文本生成动漫图片工具，是一款先进的人工智能系统，它可以根据你输入的文字或图片，自动生成出免费、高质量的动漫风格的画面。

Ai绘画生成 2025年06月05日 94 点赞 0 评论 495 浏览

触站AI | P站

触站AI（P站画师通）是国内专业的AI绘画网站平台，结合了Midjourney、Stable Diffusion、NovelAI、Dalle等主流AI插画绘图APP、软件模型技术，是专业的免费AI作图工具和AI作画自动生成器。

Ai绘画生成 2025年06月05日 88 点赞 0 评论 496 浏览

思腾合力

行业领先的人工智能基础架构解决方案商

创作工具 2026年06月23日 0 点赞 0 评论 496 浏览

Hertz

Hertz-Dev是一款由Standard Intelligence开发的开源音频模型，专注于低延迟实时对话AI。它具备强大的音频生成与处理能力，能够处理和生成高质量的音频信号，并支持多任务微调，适用于语音识别、语音合成等多种应用场景。此外，Hertz-Dev还提供了音频自动编码、流式生成等功能，广泛应用于智能助手、客户服务、语音识别及合成等领域。

AI项目与工具 2025年06月12日 48 点赞 0 评论 497 浏览

CatchMe

一款为识别图片、视频和音频内容是否由人工智能生成而设计的AI内容检测器

Ai办公效率 2025年06月05日 91 点赞 0 评论 498 浏览

AnyCharV

AnyCharV是一款由多所高校联合研发的角色可控视频生成框架，能够将任意角色图像与目标场景结合，生成高质量视频。它采用两阶段训练策略，确保角色细节的高保真保留，并支持复杂的人-物交互和背景融合。该工具兼容多种文本生成模型，具备良好的泛化能力，适用于影视制作、艺术创作、虚拟现实等多个领域。

AI项目与工具 2025年06月12日 73 点赞 0 评论 499 浏览

Eagle 2.5

Eagle 2.5 是一款由英伟达开发的视觉语言模型，专注于长上下文多模态学习，具备处理高分辨率图像和长视频序列的能力。其参数规模为 8B，但性能接近更大模型。采用信息优先采样和渐进式后训练策略，提升模型稳定性与适应性。支持多样任务，适用于视频分析、图像处理、内容创作及教育等多个领域。

AI项目与工具 2025年06月11日 59 点赞 0 评论 500 浏览

深度学习

首页

深度学习

列表

默认

浏览次数

发布日期