AI项目与工具

AutoMouser

AutoMouser是一款Chrome浏览器扩展,能够智能记录用户交互行为,并基于OpenAI GPT模型自动生成Selenium测试代码。它支持实时操作跟踪、代码结构优化、JSON日志导出等功能,适用于自动化测试脚本的快速生成与调试,提高了测试效率和可维护性。其核心优势在于简化了测试脚本的创建过程,降低了技术门槛。

VACE

VACE是由阿里巴巴通义实验室推出的视频生成与编辑框架,支持文本到视频、参考生成、视频扩展、遮罩编辑等多种任务。其核心是Video Condition Unit(VCU),可整合多模态输入,实现任务灵活组合。支持480P和720P分辨率,适用于创意视频制作、视频修复、风格转换及互动创作等场景,具备高灵活性和广泛的应用潜力。

VSI

VSI-Bench是一种用于评估多模态大型语言模型(MLLMs)视觉空间智能的基准测试工具,包含超过5000个问题-答案对,覆盖多种真实室内场景视频。其任务类型包括配置型任务、测量估计和时空任务,可全面评估模型的空间认知、理解和记忆能力,并提供标准化的测试集用于模型性能对比。 ---

Mochi 1

Mochi 1 是一款基于开源架构的 AI 视频生成工具,具有高保真度和强大的提示遵循能力。它采用 Genmo 自研的非对称扩散变压器(AsymmDiT)架构,结合实时视频生成技术和流式架构,能够高效生成高质量的视频内容。Mochi 1 支持多种应用场景,包括视频内容创作、教育、娱乐、广告和社交媒体等,适用于个人和企业用户。

蓝藻AI智播

蓝藻AI智播是一款基于山海大模型和高拟人AI声音技术的自动直播系统,实现24小时不间断直播。主要功能包括全天候直播、逼真的AI主播声音、全自动化操作流程、实时互动、在线改稿、大模型接入、中控副播以及真人接管。该系统降低直播成本,提高直播效率和观众体验,适用于电商直播带货、教育培训、企业宣传、新闻播报、客户服务及虚拟展会等多个场景。

CapsWriter

CapsWriter-Offline是一款基于PC端的离线语音输入与字幕转录工具,支持实时语音转文字功能,具备高准确率和无限时长录音能力。其核心技术依托于深度学习模型,可处理中英文混合语音,并提供热词自定义功能以提升特定术语的识别效果。此工具适用于会议记录、学术讲座、视频字幕生成等多种场景,同时确保用户数据的安全与隐私。 ---

LyricStudio

LyricStudio是一款利用AI技术辅助歌词创作的工具,能够根据用户设定的主题和风格生成个性化歌词建议,并提供押韵词推荐、歌词结构优化等功能。它支持团队协作创作,兼容多种音乐流派,适用于个人创作、团队协作及教育等多个场景,同时确保用户对生成内容享有完整版权。

Evryface

Evryface 是一款基于AI技术的照片生成工具,用户上传照片后可生成多种风格的数字孪生形象,支持超过100种风格选择,输出高清图像,适用于社交媒体、职业形象、艺术创作及宠物摄影等场景。平台注重隐私保护,操作便捷,支持批量生成,满足多样化需求。

AutoRAG

AutoRAG是一款由中科院相关机构研发的自主迭代检索模型,专为大型语言模型设计,通过多轮对话实现检索规划与查询细化,具备动态调整迭代次数、增强可解释性的特点。它在复杂任务处理方面表现出色,支持智能问答、学术研究、市场分析、在线教育及客户服务等多样化应用场景。 ---

爱派

AiPy 是一款基于大语言模型与 Python 深度整合的 AI 工具,支持自然语言生成代码、数据处理与分析、可视化、API 调用、任务自动化等功能。具备本地部署能力,保障数据安全,适用于开发、数据分析、自动化任务等场景。用户可通过自然语言或直接输入代码进行交互,支持多种操作系统与环境配置,提升编程效率与灵活性。