学习 - 智狐AI导航

LipDub语音翻译

用人工智能在几秒钟内说任何语言

Ai语音工具 2026年06月24日 0 点赞 0 评论 750 浏览

3DIS

3DIS-FLUX是一种基于深度学习的多实例图像生成框架，采用两阶段流程：先生成场景深度图，再进行细节渲染。通过注意力机制实现文本与图像的精准对齐，无需额外训练即可保持高生成质量。适用于电商设计、创意艺术、虚拟场景构建及广告内容生成等领域，具备良好的兼容性和性能优势。

AI项目与工具 2025年06月12日 32 点赞 0 评论 750 浏览

TME Studio腾讯音乐

分析TME全曲库歌词以及散文、诗歌等多种语料素材，依据智能推荐算法帮你找到合适的押韵词语，打开灵感空间

创作工具 2026年06月24日 0 点赞 0 评论 749 浏览

LongReward

LongReward是一种由清华大学、中国科学院及智谱AI联合开发的AI工具，专注于通过多维度评估（有用性、逻辑性、忠实性和完整性）来优化长文本大型语言模型的表现。它利用现成的语言模型提供奖励信号，并结合强化学习算法改善模型性能，特别擅长处理复杂长文本任务，如文档理解、摘要生成及特定领域的数据分析，如法律、金融和医疗。

AI项目与工具 2025年06月12日 71 点赞 0 评论 749 浏览

QwQ

QwQ-32B-Preview是一款由阿里巴巴开发的开源AI推理模型，具有325亿参数，擅长处理数学与编程领域的复杂任务。它能在多个基准测试中超越同类产品，并提供透明化的推理流程。然而，该模型在语言切换及跨领域应用上存在一定局限性。

AI项目与工具 2025年06月12日 99 点赞 0 评论 749 浏览

WIRESTOCK

WIRESTOCK是一个面向AI艺术创作者的在线平台，支持作品上传与销售，提供AI绘画工具和创意挑战，与多家图库合作扩大曝光，帮助创作者实现作品价值最大化。主要功能包括作品分类管理、收入追踪以及多渠道分发。

AI项目与工具 2025年06月12日 47 点赞 0 评论 749 浏览

MiniCPM

MiniCPM-o 2.6 是一款高性能的多模态大模型，具备 8B 参数量，支持视觉、语音及多模态直播等多种功能。其在图像处理、语音识别和实时交互方面表现优异，采用高效的 token 技术提升推理速度，可在端侧设备上运行。支持多种语言和音色配置，适用于智能助手、内容创作、教育、客服和医疗等多个领域。

AI项目与工具 2025年06月12日 58 点赞 0 评论 749 浏览

Vika维格云

Vika维格云是一个数据生产力平台，它结合了电子表格和数据库的特点，通过API支持为用户提供灵活的数据管理和分析能力。

创作工具 2026年06月24日 0 点赞 0 评论 748 浏览

OmniCam

OmniCam 是一种基于多模态输入的高级视频生成框架，结合大型语言模型与视频扩散模型，实现高质量、时空一致的视频内容生成。支持文本、视频或图像作为输入，精确控制摄像机运动轨迹，具备帧级操作、复合运动、速度调节等功能。采用三阶段训练策略提升生成效果，并引入 OmniTr 数据集增强模型性能。适用于影视、广告、教育及安防等多个领域，提高视频创作效率与质量。

AI项目与工具 2025年06月12日 18 点赞 0 评论 748 浏览

Ev

Ev-DeblurVSR是一款由多所高校联合开发的视频增强模型，利用事件相机数据提升视频去模糊和超分辨率效果。通过互惠特征去模糊模块和混合可变形对齐模块，实现高精度视频恢复。适用于监控、体育、自动驾驶等多个领域，支持快速部署与研究。

AI项目与工具 2025年06月11日 52 点赞 0 评论 748 浏览

学习

首页

学习

列表

默认

浏览次数

发布日期