AI工具 - 智狐AI导航

Ai好记

[Ai好记是一款利用人工智能技术实现音视频转图文的专业工具，主要功能包括精准转录、思维导图生成、多语言翻译及个性化总结。它支持多种格式导出，并兼容主流音视频平台，广泛应用于知识管理、学术研究、内容创作等领域。]

AI项目与工具 2025年06月12日 70 点赞 0 评论 561 浏览

PDF to Podcast

PDF to Podcast 是一款由 NVIDIA 开发的 AI 工具，能够将 PDF 文档自动转换为高质量的音频内容，如播客。该工具结合了大型语言模型、文本到语音技术以及 NVIDIA NIM 微服务架构，支持从 PDF 提取信息并生成结构化文本，再通过语音合成输出自然流畅的音频。用户可自定义生成内容的重点，并支持多种部署方式，适用于企业培训、技术简报、客户服务、医疗教育等多个领域。

AI项目与工具 2025年06月12日 32 点赞 0 评论 560 浏览

DreamVideo-2是一款由复旦大学和阿里巴巴集团等机构共同开发的零样本视频生成框架，能够利用单一图像及界定框序列生成包含特定主题且具备精确运动轨迹的视频内容。其核心特性包括参考注意力机制、混合掩码参考注意力、重加权扩散损失以及基于二值掩码的运动控制模块，这些技术共同提升了主题表现力和运动控制精度。DreamVideo-2已在多个领域如娱乐、影视制作、广告营销、教育及新闻报道中展现出广泛应用前

AI项目与工具 2025年06月12日 65 点赞 0 评论 560 浏览

CLaMP 3

CLaMP 3是由清华大学朱文武教授团队开发的多模态、多语言音乐信息检索框架，支持文本、图像、音频和乐谱等多种模态之间的跨模态检索。其基于对比学习技术，将不同模态数据与多语言文本对齐至统一语义空间，适用于文本到音乐、图像到音乐检索、零样本分类及音乐推荐等任务。支持27种语言，可扩展至100种，广泛应用于音乐创作、教育、分析及多媒体内容制作。

AI项目与工具 2025年06月12日 86 点赞 0 评论 560 浏览

绘蛙·多图成片

绘蛙·多图成片是一款基于AI技术的视频生成工具，通过上传2-4张连贯图片并配合文字描述，快速生成高质量视频。支持多种视频尺寸，具备智能文案生成能力，适用于创意视频、广告、电商展示等多种场景，显著降低视频制作门槛和成本。

AI项目与工具 2025年06月12日 18 点赞 0 评论 559 浏览

News Agents

News Agents是一个基于终端的新闻聚合与摘要系统，利用Amazon Q CLI作为Agent框架，通过Model Context Protocol（MCP）解析RSS新闻源，并借助tmux实现多任务监控。系统从多个新闻源抓取文章，分配给多个子Agents并行处理，生成简洁摘要并汇总到main-summary.md文件中，提供高效、个性化的新闻阅读体验。

AI项目与工具 2025年06月11日 72 点赞 0 评论 559 浏览