工具 - 智狐AI导航

Zerox

Zerox是一款基于GPT-4o-mini模型的开源OCR工具，支持多种文件格式，具备零样本识别能力，可高效处理扫描文档和复杂布局内容。其输出为Markdown格式，便于编辑与使用，同时提供API接口，适用于企业文档管理、学术研究、法律金融等多个场景，显著提升文档处理效率和准确性。

AI项目与工具 2025年06月12日 20 点赞 0 评论 546 浏览

AnyStory

AnyStory是阿里巴巴通义实验室开发的文本到图像生成工具，支持单个或多个主体的高保真图像生成。其核心在于“编码-路由”架构，结合ReferenceNet和CLIP视觉编码器实现主体特征的精准建模与定位。通过解耦路由机制，有效避免多主体混淆，确保图像与文本描述高度一致。适用于创意设计、角色生成、广告制作等多个场景，提供高质量、个性化的图像生成能力。

AI项目与工具 2025年06月12日 42 点赞 0 评论 686 浏览

T2A

T2A-01-HD是一款支持声音克隆与多语言合成的AI语音模型，可精准还原原声特征与情感表达。具备智能情感系统、多语言支持及高级参数控制功能，适用于有声读物、影视配音、教育、语言学习等多种场景，提供高质量、个性化的语音输出。

AI项目与工具 2025年06月12日 46 点赞 0 评论 499 浏览

万物追踪

万物追踪是一款基于生成式AI技术的信息推送工具，能从全球数据中精准捕捉用户关心的事件，如政策变化、股票动态、体育赛事等，并实时生成定制内容推送给用户。用户可自由订阅感兴趣的主题，系统自动持续追踪并推送更新。适用于财经、科技、体育、教育和娱乐等多个领域，提供高效、个性化的信息获取体验。

AI项目与工具 2025年06月12日 86 点赞 0 评论 522 浏览

TestSprite

TestSprite 是一款基于 AI 的自动化测试平台，支持后端 API、前端 UI、数据及 AI 模型的测试，能够自动生成测试计划、执行测试并输出详细报告。其核心优势在于提升测试效率、减少人工干预，并适用于多种测试场景，如软件发布前验证、CI/CD 集成、生产环境监控等，帮助企业提升软件质量与交付速度。

AI项目与工具 2025年06月12日 39 点赞 0 评论 950 浏览

ParGo

ParGo是一种由字节与中山大学联合开发的多模态大语言模型连接器，通过结合局部与全局token，提升视觉与语言模态的对齐效果。其核心模块PGP和CPP分别提取图像的局部和全局信息，增强细节感知能力。在多个基准测试中表现优异，尤其在文字识别和图像描述任务中优势明显。采用自监督学习策略，提高模型泛化能力，适用于视觉问答、图像字幕生成、跨模态检索等多种场景。

AI项目与工具 2025年06月12日 38 点赞 0 评论 872 浏览

Weebo

Weebo是一款基于AI技术的实时语音交互工具，支持语音识别与生成，实现自然流畅的语音对话。具备多语言支持和实时响应能力，适用于个人助理、娱乐互动和教育辅导等场景。技术上融合了Whisper Small、Llama 3.2等模型，提供便捷高效的语音交互体验。

AI项目与工具 2025年06月12日 72 点赞 0 评论 621 浏览

AutoMouser

AutoMouser是一款Chrome浏览器扩展，能够智能记录用户交互行为，并基于OpenAI GPT模型自动生成Selenium测试代码。它支持实时操作跟踪、代码结构优化、JSON日志导出等功能，适用于自动化测试脚本的快速生成与调试，提高了测试效率和可维护性。其核心优势在于简化了测试脚本的创建过程，降低了技术门槛。

AI项目与工具 2025年06月12日 30 点赞 0 评论 656 浏览

Aibiye

Aibiye是一款基于先进语言模型的AI论文辅助工具，支持从选题建议、结构生成到内容填充的全流程写作服务。用户可输入关键词、选择专业及字数，生成符合学术规范的论文初稿，支持中英文文献引用和图表插入，具备降重与改写功能，助力提升论文质量。

AI项目与工具 2025年06月12日 61 点赞 0 评论 938 浏览

豆包AI编程

豆包AI编程是一款基于AI技术的编程辅助工具，支持一键上传代码、实时接入GitHub项目，并提供沉浸式代码阅读和精准提问功能。它能生成、解释、修复和优化代码，提升编程效率与理解力，适用于学习、开发、代码审查及团队协作等场景。

AI项目与工具 2025年06月12日 82 点赞 0 评论 601 浏览

工具

首页

工具

列表

默认

浏览次数

发布日期