AI项目与工具

Docmatix

Docmatix 是一个专为文档视觉问答任务设计的大规模数据集，包含240万张图像和950万个问题-答案对，源自130万个PDF文档。数据集覆盖广泛，包括扫描图片、PDF文件和数字文档，且具有高质量的问答对。Docmatix 支持模型训练和微调，可用于训练视觉语言模型，提高其在理解和回答与文档内容相关问题方面的性能。应用场景包括自动化客户服务、智能文档分析、教育和学术研究以及业务流程自动化等。

AI项目与工具 2025年06月12日 87 点赞 0 评论 490 浏览

Blinko

Blinko是一款开源的个人笔记工具，具备AI增强的搜索功能，支持自然语言查询，便于用户快速定位笔记内容。它兼容Markdown，支持标签管理和批量操作，同时确保数据存储在用户自有的服务器中，保障隐私与安全。Blinko适用于个人知识管理、创意写作、项目规划、日常任务管理和学习复习等多个场景。

AI项目与工具 2025年06月12日 39 点赞 0 评论 490 浏览

Stable Video 3D（SV3D）是一款由Stability AI公司开发的多视角合成和3D生成模型，能够从单张图片生成一致的多视角图像，并进一步优化生成高质量的3D网格模型。该模型在视频扩散模型基础上进行改进，提供更好的质量和多视角体验。主要功能包括多视角视频生成、3D网格创建、轨道视频生成、相机路径控制以及新视角合成。SV3D在新视角合成方面取得显著进展，能够生成逼真且一致的视图，提升

AI项目与工具 2024年01月01日 39 点赞 0 评论 490 浏览

Spark

Spark-TTS是一款基于大型语言模型的高效文本转语音工具，支持中英文双语及跨语言合成。它无需额外生成模型，通过LLM预测编码直接生成音频，实现零样本语音克隆。用户可自定义语音参数，如音色、语速等，适用于语音助手、多语言内容创作、智能客服及虚拟角色配音等多种场景。

AI项目与工具 2025年06月12日 47 点赞 0 评论 490 浏览

slidebean

Slidebean是一款基于AI技术的演示文稿生成工具，旨在为创业者和企业提供高效、专业的PPT制作解决方案。其核心功能包括智能内容生成、个性化模板选择、数据可视化支持以及团队协作管理。此外，平台还提供专家级设计服务，确保输出内容兼具美观性和实用性。适用于融资演示、商业计划展示、产品发布及内部汇报等多种场景。

AI项目与工具 2025年06月12日 17 点赞 0 评论 490 浏览

Outrank

Outrank 是一款基于 AI 的 SEO 内容生成与管理工具，具备自动化关键词研究、文章生成、内容发布及性能分析等功能。它支持多语言内容创作，可与主流平台和工具集成，适用于企业、营销团队和内容创作者，帮助提升网站流量与搜索排名。

AI项目与工具 2025年06月12日 70 点赞 0 评论 490 浏览

InternVL3

InternVL3是上海人工智能实验室推出的多模态大型语言模型，具备文本、图像、视频等多模态数据处理能力。采用原生多模态预训练方法，提升语言与视觉理解效率，并支持工具使用、3D视觉、工业图像分析等复杂任务。模型可通过API部署，适用于智能交互、图像识别、视频分析及客服系统等多种场景。

AI项目与工具 2025年06月11日 68 点赞 0 评论 490 浏览

Omniflow

Omniflow 是一款基于AI的产品开发工具，旨在提升创意转化效率。其核心功能涵盖创意梳理、文档生成、任务分解与项目监控，支持自动化流程与多平台集成，适用于多种行业场景，助力团队高效协作与高质量交付。

AI项目与工具 2025年06月12日 100 点赞 0 评论 489 浏览

SurfSense

SurfSense是一款开源的AI研究工具，具备强大的搜索功能和自然语言交互能力。它支持多种外部数据源集成，如搜索引擎、Slack、Notion等，并允许用户上传多种格式的文件，整合到个人知识库中。SurfSense采用RAG技术，结合语义和全文搜索，提升检索效率和准确性。同时支持本地部署，保障数据隐私，适用于个人知识管理、学术研究、企业协作等多种场景。

AI项目与工具 2025年06月11日 23 点赞 0 评论 489 浏览

InfiMM

InfiMM-WebMath-40B是由字节跳动与中国科学院联合推出的大规模多模态数据集，涵盖大量数学和科学内容，包括文本、公式、符号及图像。该数据集通过筛选、清洗和标注优化，可显著提升多模态模型的数学推理能力。它适用于数学题库生成、学习工具开发、论文理解及科学研究等多个应用场景。 ---

AI项目与工具 2025年06月12日 100 点赞 0 评论 489 浏览