深度学习 - 智狐AI导航

FancyVideo

FancyVideo是一款由360公司与中山大学合作开发的AI文生视频模型，采用创新的跨帧文本引导模块（CTGM）。它能够根据文本描述生成连贯且动态丰富的视频内容，支持高分辨率视频输出，并保持时间上的连贯性。作为开源项目，FancyVideo提供了详尽的文档和代码库，便于研究者和开发者深入研究和应用。主要功能包括文本到视频生成、跨帧文本引导、时间信息注入及时间亲和度细化等。

AI项目与工具 2025年06月12日 28 点赞 0 评论 480 浏览

OmniThink

OmniThink是由浙江大学与阿里巴巴通义实验室联合开发的机器写作框架，通过模拟人类学习和反思机制，提升文章的知识密度与深度。支持多种语言模型，具备信息树与概念池结构化管理功能，适用于学术写作、新闻报道、教育内容创作等多个领域，有效提高生成内容的质量与多样性。

AI项目与工具 2025年06月12日 10 点赞 0 评论 478 浏览

CapsWriter

CapsWriter-Offline是一款基于PC端的离线语音输入与字幕转录工具，支持实时语音转文字功能，具备高准确率和无限时长录音能力。其核心技术依托于深度学习模型，可处理中英文混合语音，并提供热词自定义功能以提升特定术语的识别效果。此工具适用于会议记录、学术讲座、视频字幕生成等多种场景，同时确保用户数据的安全与隐私。 ---

AI项目与工具 2025年06月12日 38 点赞 0 评论 477 浏览

Stable Virtual Camera

Stable Virtual Camera 是 Stability AI 推出的 AI 工具，能够将 2D 图像转换为具有真实深度和透视感的 3D 视频。用户可通过自定义相机轨迹生成多种宽高比的视频，支持最长 1000 帧的高质量输出。其核心技术包括生成式 AI、神经渲染和多视图一致性优化，确保视频在不同视角间过渡自然且保持 3D 一致性。适用于广告、内容创作及教育等多个领域。

AI项目与工具 2025年06月12日 61 点赞 0 评论 477 浏览

ReCamMaster

ReCamMaster 是由浙江大学与快手科技联合开发的视频重渲染框架，支持根据用户指定的相机轨迹生成新视角视频。采用预训练模型与帧维度条件机制，实现视频视角、运动轨迹的灵活调整。具备视频稳定化、超分辨率、外扩等功能，适用于视频创作、后期制作、自动驾驶和虚拟现实等领域，提升视频内容的表现力与质量。

AI项目与工具 2025年06月12日 95 点赞 0 评论 477 浏览

Torch

Torch-MLU 是一个开源的 PyTorch 扩展插件，支持开发者将寒武纪 MLU 系列智能加速卡作为 PyTorch 的加速后端。它实现了对 PyTorch 的原生支持，使开发者能够无缝地将基于 GPU 的深度学习模型迁移到 MLU 硬件上，显著提高模型的训练和推理效率。此外，Torch-MLU 还支持自动混合精度训练，通过优化计算图等技术，进一步提升了模型的执行效率。

AI项目与工具 2025年06月12日 13 点赞 0 评论 475 浏览

Veo是Google DeepMind开发的一款视频生成模型，用户可以通过文本、图像或视频提示来指导其生成所需的视频内容。Veo具备深入的自然语言理解能力，能够准确解析用户的文本提示，生成高质量、高分辨率的视频。其主要功能包括高分辨率视频输出、自然语言处理、风格适应性、创意控制与定制、遮罩编辑功能、参考图像与风格应用、视频片段的剪辑与扩展以及视觉连贯性。Veo技术目前仍处于实验阶段，但已在电影制作

AI项目与工具 2024年01月01日 34 点赞 0 评论 474 浏览

Titans

Titans是谷歌推出的新型神经网络架构，突破了传统Transformer在处理长序列数据时的限制。其核心是神经长期记忆模块，可模拟人脑记忆机制，提升对关键信息的存储与提取能力。Titans支持多种任务，包括语言建模、常识推理和时间序列预测，尤其在处理超长上下文时表现优异。该架构具备并行计算能力，提高了训练效率，适用于文本生成、生物信息学、视频音乐处理等多个领域。

AI项目与工具 2025年06月12日 27 点赞 0 评论 472 浏览

喜娜AI助手

喜娜AI助手是新浪财经推出的智能工具，具备AI摘要和个股公告解读两大功能。AI摘要可快速提炼财经新闻核心信息，帮助用户高效掌握公司业务、财务状况及行业动态；个股公告解读则基于深度学习技术，对A股公告进行专业分析，识别关键数据并用可视化方式标注风险与机会，提升信息理解效率，助力用户做出更明智的投资决策。

AI项目与工具 2025年06月12日 27 点赞 0 评论 469 浏览

DeepSite

DeepSite 是一款基于 DeepSeek-V3 模型的在线开发工具，用户可通过自然语言描述快速生成游戏、网页或应用代码，并支持实时预览。无需安装环境，操作简便，适用于快速原型开发、教育学习、创意实现及小型项目开发，提升了编程的易用性和效率。

AI项目与工具 2025年06月12日 70 点赞 0 评论 467 浏览

深度学习

首页

深度学习

列表

默认

浏览次数

发布日期