AI项目与工具

GEN3C

GEN3C是由NVIDIA、多伦多大学和向量研究所联合开发的生成式视频模型，基于点云构建3D缓存，结合精确的相机控制和时空一致性技术，实现高质量视频生成。支持从单视角到多视角的视频创作，具备3D编辑能力，适用于动态场景和长视频生成。在新型视图合成、驾驶模拟、影视制作等领域有广泛应用前景。

AI项目与工具 2025年06月12日 23 点赞 0 评论 520 浏览

SPIKY.AI

SPIKY.AI是一款面向销售团队的实时AI助手，它通过分析销售通话、客户互动及培训会议等内容，提供即时反馈和数据驱动的决策支持，帮助销售代表遵循销售手册执行任务，同时实现CRM系统的自动更新，旨在提升销售效率、优化客户互动并加速销售周期。其核心功能包括实时反馈、行动项目管理、个性化培训、CRM集成及数据分析，广泛应用于销售电话、客户服务、入职培训、团队辅导和产品演示等多个场景。

AI项目与工具 2025年06月12日 54 点赞 0 评论 520 浏览

清影

清影2.0是一款基于CogVideoX模型的AI视频生成工具，支持4K超高清视频生成，具备强大文本理解能力与多通道输出功能。集成CogSound模型提供音效匹配，支持任意比例输出，提升创作灵活性。适用于教育、营销、娱乐等多个领域，提供高效、高质量的视频生成服务。

AI项目与工具 2025年06月12日 31 点赞 0 评论 520 浏览

OmniThink

OmniThink是由浙江大学与阿里巴巴通义实验室联合开发的机器写作框架，通过模拟人类学习和反思机制，提升文章的知识密度与深度。支持多种语言模型，具备信息树与概念池结构化管理功能，适用于学术写作、新闻报道、教育内容创作等多个领域，有效提高生成内容的质量与多样性。

AI项目与工具 2025年06月12日 10 点赞 0 评论 520 浏览

OpenAudio S1是Fish Audio推出的文本转语音（TTS）模型，基于200万小时音频数据训练，支持13种语言。采用双自回归架构和RLHF技术，生成自然流畅的语音，支持50多种情感和语调标记。具备零样本和少样本语音克隆功能，仅需10到30秒音频即可生成高保真声音。适用于视频配音、播客、游戏角色语音、虚拟助手、游戏娱乐、教育培训及客服系统等场景。提供40亿参数完整版和5亿参数开源版，满足

AI项目与工具 2025年06月11日 28 点赞 0 评论 520 浏览

DuoAttention

DuoAttention是由MIT韩松团队提出的新型框架，通过区分“检索头”和“流式头”两种注意力机制，显著提升了大型语言模型在处理长上下文时的推理效率。该框架有效减少了内存占用，加速了解码和预填充过程，并保持了模型的准确性。它适用于多轮对话、长文档处理、学术研究以及内容推荐等多个领域。

AI项目与工具 2025年06月12日 58 点赞 0 评论 521 浏览

LanDiff

LanDiff是一种结合自回归语言模型和扩散模型的文本到视频生成框架，采用粗到细的生成策略，有效提升语义理解与视觉质量。其核心功能包括高效语义压缩、高质量视频生成、语义一致性保障及灵活控制能力。支持长视频生成，降低计算成本，适用于视频制作、VR/AR、教育及社交媒体等多个领域。

AI项目与工具 2025年06月12日 92 点赞 0 评论 521 浏览

Project DIGITS

Project DIGITS 是 NVIDIA 推出的高性能 AI 计算设备，基于 Grace Blackwell 架构，配备 GB10 Superchip，提供高达 1 万万亿次的 AI 计算能力，支持运行 2000 亿参数的大模型。其具备 128GB 统一内存和 4TB NVMe 存储，支持本地开发与云端部署，适配多种 AI 应用场景，如研究、数据分析、教育及医疗等。

AI项目与工具 2025年06月12日 52 点赞 0 评论 521 浏览