开源 - 智狐AI导航

Fish Speech

Fish Speech是一款开源的文本到语音（TTS）工具，支持中文、英文和日文。它通过大约15万小时的多语种数据训练，实现了接近人类水平的语音合成效果。该工具的特点包括低显存需求（仅需4GB）、快速推理速度、高自定义性和灵活性。Fish Speech支持多种语音生成模型，如VITS2、Bert-VITS2等，适用于智能助手、自动客服、语言学习等多个领域。

AI项目与工具 2025年06月12日 14 点赞 0 评论 786 浏览

万相首尾帧模型

万相首尾帧模型（Wan2.1-FLF2V-14B）是一款开源视频生成工具，基于DiT架构和交叉注意力机制，可根据用户提供的首帧和尾帧图像生成高质量、流畅的过渡视频。支持多种风格和特效，适用于创意视频制作、影视特效、广告营销等多个场景。模型具备细节复刻、动作自然、指令控制等功能，且提供GitHub和HuggingFace开源资源供用户使用。

AI项目与工具 2025年06月11日 100 点赞 0 评论 786 浏览

Phidata

Phidata 是一个开源的 AI 智能体框架，支持开发者构建具备记忆、知识和推理能力的智能代理系统。它提供多代理协作、用户界面交互、性能监控优化等功能，并广泛应用于网络搜索、财务分析、数据科学和自动化任务等领域。

AI项目与工具 2025年06月12日 24 点赞 0 评论 787 浏览

s1

S1是由斯坦福大学和华盛顿大学联合开发的低成本、高性能AI推理模型，采用知识蒸馏技术从大型模型中提取推理能力。通过1000个高质量问题训练，成本低于50美元，训练时间短于30分钟。S1在数学和编程领域表现卓越，支持测试时扩展技术以优化推理效果，并已在GitHub开源，适用于科学问题解决、智能辅导、自动问答等多种场景。

AI项目与工具 2025年06月12日 33 点赞 0 评论 787 浏览

TurboSeek

TurboSeek 是一款基于开源技术的 AI 搜索引擎，融合了 Bing 搜索 API 和先进语言模型（如 Mixtral 8x7B 和 Llama-3），为用户提供快速、智能的搜索体验。其核心功能包括智能搜索、AI 模型生成答案、后续问题推荐以及本地部署支持。TurboSeek 可广泛应用于学术研究、新闻追踪、技术文档查询、市场分析和个人知识管理等领域。

AI项目与工具 2025年06月12日 65 点赞 0 评论 787 浏览

Text Behind Image

Text Behind Image 是一款开源在线工具，支持用户在图片中主体背后添加自定义文字，提供多样化的样式定制选项，包括字体、颜色、位置等。它基于 Next.js 框架，采用前端图像处理技术，适配多种应用场景，如社交媒体营销、广告宣传、个人表达及教育用途。

AI项目与工具 2025年06月12日 65 点赞 0 评论 787 浏览

Podcastfy

Podcastfy 是一款基于生成式人工智能技术开发的开源工具，可将网络文章、PDF 文件及纯文本转化为多语言对话式音频。它不仅支持多源文本合并，还具备强大的文本转语音功能，允许用户选择不同的语音模型来优化音频效果。此外，其开源特性便于开发者根据需求进行个性化定制，广泛适用于内容摘要、语言本地化、教育材料转化等多个领域。

AI项目与工具 2025年06月12日 18 点赞 0 评论 789 浏览

TypingMind

一款支持多种大型语言模型的聊天界面应用，用户可以通过API密钥与ChatGPT、Claude、Gemini等模型进行互动。

AI写作对话 2025年06月05日 28 点赞 0 评论 789 浏览

TTS-vue

TTS-Vue是一个开源的桌面应用程序，它利用了微软的语音合成技术，为用户提供了一个简单易用的文本到语音转换工具。

Ai语音工具 2026年06月23日 0 点赞 0 评论 789 浏览

书生·万象InternVL 2.5

书生·万象InternVL 2.5是一款开源多模态大型语言模型，基于InternVL 2.0升级而来。它涵盖了从1B到78B不同规模的模型，支持多种应用场景，包括图像和视频分析、视觉问答、文档理解和信息检索等。InternVL 2.5在多模态理解基准上表现优异，性能超越部分商业模型，并通过链式思考技术提升多模态推理能力。

AI项目与工具 2025年06月12日 100 点赞 0 评论 789 浏览

开源

首页

开源

列表

默认

浏览次数

发布日期