工具 - 智狐AI导航

万相首尾帧模型

万相首尾帧模型（Wan2.1-FLF2V-14B）是一款开源视频生成工具，基于DiT架构和交叉注意力机制，可根据用户提供的首帧和尾帧图像生成高质量、流畅的过渡视频。支持多种风格和特效，适用于创意视频制作、影视特效、广告营销等多个场景。模型具备细节复刻、动作自然、指令控制等功能，且提供GitHub和HuggingFace开源资源供用户使用。

AI项目与工具 2025年06月11日 100 点赞 0 评论 649 浏览

裂变宝平台

公众号海报裂变涨粉服务商

裂变增长 2025年06月05日 33 点赞 0 评论 649 浏览

FoloUp

FoloUp 是一款开源的 AI 语音面试平台，能根据职位描述自动生成面试问题，并通过自然语言交互与候选人进行语音面试。系统支持实时分析、评分与报告生成，提供数据仪表盘用于跟踪候选人表现。平台支持一键分享、远程面试和批量招聘，结合语音识别、NLP 和安全数据管理技术，适用于多种招聘场景，提升招聘效率与质量。

AI项目与工具 2025年06月12日 74 点赞 0 评论 649 浏览

Scrapeless

Scrapeless是什么？Scrapeless 是一款强大的 AI 驱动网页抓取工具，可高效从网站提取结构化数据。它支持无头浏览器模式，自动绕过验证码和IP封

Ai办公效率 2025年06月05日 48 点赞 0 评论 650 浏览

创音岛

创音岛是一款集录音转文字、配音、AI写歌及音频编辑于一体的综合性音乐创作与音频处理平台。它采用先进语音识别技术，支持多场景下的文字转录需求；提供多样化的配音选项和智能化音乐编曲功能，帮助用户轻松创作音乐；并配备音频编辑工具，满足用户对音频文件的精细化处理需求。该平台界面友好，操作便捷，适合音乐爱好者、创作者及专业人士使用。

AI项目与工具 2025年06月12日 42 点赞 0 评论 650 浏览

OSUM

OSUM是一款由西北工业大学研发的开源语音理解模型，结合Whisper编码器与Qwen2 LLM，支持语音识别、情感分析、说话者性别分类等多种任务。采用“ASR+X”多任务训练策略，提升模型泛化能力和稳定性。基于约5万小时语音数据训练，性能优异，适用于智能客服、教育、心理健康监测等多个领域。

AI项目与工具 2025年06月12日 46 点赞 0 评论 650 浏览

MagicQuill

MagicQuill是一款基于AI的开源图像编辑工具，提供智能化的局部编辑功能。其核心功能包括AI驱动的智能建议、精确的像素级编辑（如添加、删除和颜色调整），以及多种定制化工具（如添加笔刷、减去笔刷和颜色笔刷）。此外，它还具备实时意图预测和参数调整能力，支持多模态大语言模型和扩散模型的协作，适用于个人娱乐、教育、专业设计及商业应用等多个领域。

AI项目与工具 2025年06月12日 85 点赞 0 评论 650 浏览

Blogcast™

BlogcastTM是一个文本转语音的工具，允许用户创建播客、视频、电子学习课程的音频和音频书籍，而无需录制。它由人工智能驱动的文本转语音技术提供支持，并提供多种声音和语言可供...

Ai语音工具 1970年01月01日 0 点赞 0 评论 650 浏览

网易天音

网易天音提供基于人工智能技术的音乐创作工具，帮助用户创作音乐。

创作工具 1970年01月01日 0 点赞 0 评论 650 浏览

GraphMaker

GraphMaker是一款基于AI的图表制作工具，能够通过自然语言理解实现数据可视化。它支持多种数据格式，可生成柱状图、饼图、散点图等多样化图表，并提供编辑和美化功能，广泛应用于商业报告、学术研究、市场分析等领域，注重数据安全与用户体验。

AI项目与工具 2025年06月12日 54 点赞 0 评论 650 浏览

工具

首页

工具

列表

默认

浏览次数

发布日期