AI项目与工具

Whispo

Whispo是一款AI驱动的语音转录工具,支持用户通过快捷键快速录制语音并将其转写为文本,同时具备本地数据处理、隐私保护及基于大型语言模型的文本后处理功能。它适用于会议记录、教育、自动字幕生成等多个场景,旨在提升工作效率和用户体验。

Backflip AI

Backflip AI 是一款基于 AI 技术的 3D 模型生成工具,可将 3D 扫描数据快速转换为 CAD 模型,提升数字设计效率。支持多种文件格式,具备自动修复、智能特征识别等功能,适用于制造业、建筑、文化遗产保护等多个领域。用户可通过不同订阅方案灵活使用,满足多样化需求。

EvoAgentX

EvoAgentX 是一个开源的 AI Agent 自进化框架,通过进化算法实现多 Agent 系统的自动化生成与优化。它能根据目标描述自动生成工作流,并通过迭代优化提升性能。框架采用模块化设计,包含工作流生成器、Agent 管理器、执行器、评估器和优化器等核心组件,支持多种 LLM 模型,用户可通过自然语言提示轻松定制 Agent 和工作流。同时提供可视化工具和多环境支持,适用于复杂系统模拟、自

Pull Sense

Pull Sense 是一款基于 AI 的代码审查工具,支持 GitHub 集成,可自动检测语法错误、安全漏洞、性能问题及代码风格不一致等问题。用户可选择多种 AI 模型,并通过自带密钥确保数据安全。支持自定义规则、多语言覆盖及灵活触发机制,适用于初创公司、大型企业、开源项目及 CI/CD 流程,提升代码质量和开发效率。

Connected Papers

Connected Papers 是一个学术研究工具,通过构建可视化图表帮助用户探索和发现相关学术文献。用户可以输入论文标题、DOI 或关键词,工具会生成一个展示相似论文的网络图,其中论文按相似度排列,颜色深浅表示发表时间的远近,圆圈大小代表被引用次数。该工具主要功能包括视觉概览、重要论文追踪、参考书目构建、先前和衍生作品发现以及跨学科支持。应用场景涵盖学术研究、文献综述、课程学习和项目研究等。

mPLUG

mPLUG-Owl3是一款由阿里巴巴开发的多模态AI模型,专注于理解和处理多图及长视频内容。该模型具备高推理效率和准确性,采用创新的Hyper Attention模块优化视觉与语言信息的融合。它已在多个基准测试中展现出卓越性能,并且其源代码和资源已公开,可供研究和应用。

Mathtutor on Groq

Mathtutor on Groq 是一款基于 Groq 架构的 AI 辅导工具,通过语音识别功能接收数学问题,结合强大的数学引擎提供实时解题过程与答案。其主要功能包括语音输入、LaTeX 公式渲染、高精度计算及自然语言处理支持,适用于代数、微积分等领域的学习与教学辅助。此外,它还集成了 xRx 框架、Whisper 和 Llama 模型,确保高效且精准的问题解决能力。Mathtutor on G

Kimi

Kimi-VL是月之暗面推出的轻量级多模态视觉语言模型,支持图像、视频、文档等多种输入形式。其基于轻量级MoE架构和原生分辨率视觉编码器,具备强大的图像感知、数学推理和OCR能力。在长上下文(128K)和复杂任务中表现优异,尤其在多模态推理和长视频理解方面超越同类模型。适用于智能客服、教育、医疗、内容创作等多个领域。

元镜

元镜是一款基于人机共生引擎的AI视频创作工具,支持从创意脚本生成到成片输出的全流程制作。具备多模态分镜设计、智能工作流和一键成片功能,提升视频创作效率与质量。适用于短视频、广告、教育、影视及政务宣传等多个领域,满足多样化内容生产需求。

FocuSee

FocuSee是一款智能化屏幕录制软件,具备自动缩放、光标跟踪及动态变焦功能,能将普通屏幕录制升级为专业级视频。支持多布局定制、字幕添加、水印嵌入以及跨平台导出与分享,适用于教学、产品演示、营销推广、软件教程等多种场景,大幅降低后期编辑成本,提升视频制作效率。